Google baru sahaja melancarkan Gemini 2.0, model AI terkini yang membawa kemajuan besar dalam teknologi era agentik. Dengan kemampuan multimodaliti yang lebih maju, Gemini 2.0 bukan sahaja memahami pelbagai input seperti teks, imej, video, dan audio, tetapi juga menghasilkan output seperti imej asli, teks, serta audio pelbagai bahasa.
Model ini memperkenalkan Gemini 2.0 Flash, yang menampilkan prestasi lebih pantas dengan latensi rendah, kemampuan penjanaan audio dan imej asli, serta integrasi alat seperti Google Search dan pelaksanaan kod.
Selain itu, fungsi baharu seperti API Multimodal Live membolehkan input masa nyata untuk audio dan video, menjadikannya alat yang serba boleh untuk pembangun.
Google turut memperkenalkan beberapa projek inovatif seperti Project Astra, pembantu AI universal dengan memori dan kefahaman konteks yang lebih baik.
Project Mariner, agen AI yang mampu memahami elemen pelayar web untuk membantu menyelesaikan tugas kompleks. Selain itu Jules juga berperanan menjadi pembantu untuk pembangun dalam persekitaran GitHub.
Dalam dunia permainan, Gemini 2.0 mampu memberikan cadangan masa nyata kepada pemain berdasarkan tindakan di skrin. Teknologi ini juga sedang diteroka dalam aplikasi robotik untuk membantu dalam dunia fizikal.
Google menegaskan komitmen terhadap keselamatan dan etika melalui ujian ketat dan kawalan privasi bagi memastikan teknologi ini dibangunkan secara bertanggungjawab. Gemini 2.0 kini sedia digunakan oleh pembangun dan akan diperluaskan ke lebih banyak produk Google pada masa akan datang.
{suggest}
Sumber: Google