Google Perkenal Gemma 3 – Sokongan 128K Tetingkap Konteks, Boleh Beroperasi Pada Satu GPU

Selepas lebih setahun melancarkan versi 1 pada Februari 2024 dan versi 2 pada Mei, Google hari ini memperkenalkan Gemma 3 sebagai model terbuka terkini untuk pembangun.

Menurut Google, model ini direka untuk beroperasi dengan pantas secara terus pada pelbagai peranti – daripada telefon dan komputer riba hingga ke stesen kerja – bagi membantu pembangun mencipta aplikasi AI di mana sahaja ia diperlukan.

Gemma 3 dibangunkan berasaskan penyelidikan dan teknologi sama yang menggerakkan model Gemini 2.0. Ia tersedia dalam pelbagai saiz, termasuk 1B, 4B, 12B dan 27B, membolehkan pembangun memilih model paling sesuai mengikut keperluan perkakasan.

Google turut mendakwa bahawa Gemma 3 ialah model paling berkuasa yang boleh dijalankan pada satu GPU atau TPU. Dalam penilaian LMArena, ia berjaya mengatasi Llama-405B, DeepSeek-V3, dan o3-mini.

Selain itu, model ini juga mempunyai keupayaan penaakulan teks dan visual yang canggih untuk menganalisis imej, teks dan video pendek pada model bersaiz 4B ke atas. Ia turut menyokong tetingkap konteks 128K token serta lebih 35 bahasa secara default, dengan sokongan pra-latihan untuk lebih 140 bahasa.

Dari segi keselamatan, ShieldGemma 2 diperkenalkan sebagai pemeriksa keselamatan imej 4B yang berkuasa, dibina berasaskan teknologi Gemma 3. Ia menyediakan penyelesaian sedia ada untuk keselamatan imej, menghasilkan label keselamatan dalam tiga kategori utama: kandungan berbahaya, unsur seksual eksplisit, dan keganasan.

Pembangun juga boleh menyesuaikan ShieldGemma 2 mengikut keperluan keselamatan dan pengguna mereka. Sebagai model terbuka, ia menawarkan fleksibiliti dan kawalan, memanfaatkan prestasi serta kecekapan seni bina Gemma 3 bagi menyokong pembangunan AI yang lebih bertanggungjawab.

{suggest}