Apple Bangunkan Model AI Untuk Suntingan Imej

Penyelidik Apple kini telah mengeluarkan model AI berdasarkan sumber terbuka baharu, yang membolehkan suntingan imej melalui prompt atau arahan bahasa semula jadi pengguna - tanpa perlu menggunakan perisian suntingan gambar.

{suggest}

MGIE atau MLMM-Guided Image Editing menggunakan multimodal large language models (MLLM) untuk mentafsir permintaan pengguna dan melakukan manipulasi tahap piksel.

Model ini mampu menyunting pelbagai aspek imej - termasuk tahap kecerahan, kontras, ketajaman, atau kesan artistik seperti lakaran. Selain itu, pengguna boleh mengubah suai bentuk, saiz, warna atau tekstur objek tertentu dalam imej.





Terdapat juga pengubahsuaian gaya Photoshop seperti crop, resize, rotate, penambahan lapisan serta menukar latar belakang dan menggabungkan imej.



Model MGIE dihasilkan dengan kerjasama penyelidik Universiti California, yang dibentangkan dalam kertas kerja di Persidangan Antarabangsa mengenai Perwakilan Pembelajaran (ICLR) 2024.

Kapsyen: web demo dengan model MGIE


Model ini tersedia di GitHub, dan termasuk kod, data serta model pra-latihan di web Hugging Face Space. Ketika ini, Apple tidak menyatakan rancangannya untuk model itu di luar penyelidikan.

Sumber: MacRumors, VentureBeat