{suggest}
MGIE atau MLMM-Guided Image Editing menggunakan multimodal large language models (MLLM) untuk mentafsir permintaan pengguna dan melakukan manipulasi tahap piksel.
Model ini mampu menyunting pelbagai aspek imej - termasuk tahap kecerahan, kontras, ketajaman, atau kesan artistik seperti lakaran. Selain itu, pengguna boleh mengubah suai bentuk, saiz, warna atau tekstur objek tertentu dalam imej.
Terdapat juga pengubahsuaian gaya Photoshop seperti crop, resize, rotate, penambahan lapisan serta menukar latar belakang dan menggabungkan imej.
Model MGIE dihasilkan dengan kerjasama penyelidik Universiti California, yang dibentangkan dalam kertas kerja di Persidangan Antarabangsa mengenai Perwakilan Pembelajaran (ICLR) 2024.
Model ini tersedia di GitHub, dan termasuk kod, data serta model pra-latihan di web Hugging Face Space. Ketika ini, Apple tidak menyatakan rancangannya untuk model itu di luar penyelidikan.
Sumber: MacRumors, VentureBeat
Berkaitan
- Google Perkenal Papan Kekunci 'TalkBack' Braille Untuk Pengguna OKU Penglihatan
- OnePlus 8 Pro Akan Hadir Dengan Sokongan Kalis Air IP68
- Semakan Kelulusan Geran Khas Prihatin (GKP) 2.0 Boleh Dibuat Mulai 27 November, Pembayaran Bermula 30 November
- Apple Akan Benarkan Pengguna Di Eropah Padam Safari Dari iPhone
- Gunung Everest Kini Mempunyai Sokongan Infrastruktur 5G
- iPad Air 2020 Bakal Hadir Dengan Sambungan Port USB-C
- PDRM Kesan Modus Operandi Penipuan Baharu Melalui Penggunaan Fail APK
- Apple Sahkan Acara Pelancaran iPhone 15 Akan Berlangsung Dua Minggu Lagi
- Audio Kualiti Tinggi Spotify Mungkin Diperkenal Sebagai 'Add-On' Untuk Pelan Sedia Ada
- Apple Hadkan Tetapan AirDrop Dalam Kemas Kini iOS 16.2 Akan Datang