MiMo: Model AI Kecil Dari Xiaomi Tapi Setanding OpenAI

Xiaomi secara rasmi melancarkan model kecerdasan buatan (AI) pertamanya yang dinamakan MiMo, sebuah model bahasa raya (LLM) dengan 7 bilion parameter yang direka khusus untuk tugas penaakulan matematik dan penjanaan kod.

MiMo dibangunkan oleh Xiaomi Big Model Core Team, dan walaupun saiznya lebih kecil, ia berjaya menyamai prestasi model lebih besar seperti OpenAI o1-mini dan Alibaba Qwen-32B.

Antara kelebihan MiMo adalah proses pra-latihan yang khusus, melibatkan data sebanyak 25 trilion token melalui tiga fasa berperingkat, dengan fokus khusus pada pola penaakulan.

Xiaomi turut memperkenalkan sistem Pembelajaran Pengukuhan (RL) dalam fasa selepas latihan, menggunakan 130,000 soalan matematik dan pengekodan untuk memperkuat kebolehannya.

MiMo ditawarkan dalam empat variasi:

MiMo-7B-Base: Model asas dengan potensi penaakulan tinggi.
MiMo-7B-RL-Zero: Dilatih secara RL terus daripada model asas.
MiMo-7B-SFT: Model melalui penalaan halus (fine-tuning).
MiMo-7B-RL: Model RL daripada SFT dengan prestasi tertinggi setanding OpenAI o1-mini.

Prestasi MiMo amat baik dalam ujian piawai seperti:

Matematik (MATH-500): 95.8% lulus.
Kod (LiveCodeBench v5): 57.8% lulus.
Ujian umum (GPQA Diamond): 54.4% lulus.

Xiaomi menawarkan MiMo secara sumber terbuka melalui Hugging Face dan GitHub, membolehkan komuniti teknologi global menggunakannya untuk pelbagai aplikasi, termasuk peranti dengan sumber terhad.

{suggest}

Sumber: fonearena