Baru-baru ini, satu organisasi daripada China yang memperkenalkan diri mereka sebagai ahli Institute for Intelligent Computing, sebahagian daripada Alibaba Group telah mencipta satu teknologi kecerdasan buatan yang mampu untuk membuat sesuatu gambar itu menyanyi dan bercakap.
Teknologi itu dikenali sebagai EMO (Emote Potrait Alive), penjana imej potret ke video dengan pacuan input audio.
Secara ringkasnya, EMO AI ini bekemampuan untuk menjana sesuatu imej atau gambar itu bertukar kepada bentuk video dengan gabungan input fail vokal ataupun audio.
Antara sistem yang menyumbang kepada keberkesanan teknologi ini adalah Backbone Network yang berperanan dalam menyatukan audio suara seiring dengan pergerakan muka karakter dalam sesuatu gambar itu.
Video di bawah adalah contoh projek EMO AI yang telah siap.
Namun begitu, pelancarannya untuk kegunaan umum belum lagi diketahui.
{suggest}
Sumber: GitHub