OpenAI Perkenal Sora - Boleh Hasilkan Video AI Daripada Teks

OpenAI kini memperkenalkan model teks-ke-video baharu, dinamakan sebagai Sora. Syarikat itu mengatakan Sora merupakan model AI yang boleh mencipta adegan realistik dan imaginatif daripada arahan teks.

{suggest}

Menurut OpenAI, Sora boleh menghasilkan video sehingga 60 saat yang menampilkan pemandangan dan subjek yang sangat terperinci, pergerakan kamera yang kompleks dan spesifik, serta berbilang karakter dengan emosi - semuanya berdasarkan prompt atau gesaan yang ditulis pengguna.

https://twitter.com/OpenAI/status/1758192957386342435

Syarikat itu menyatakan bahawa model ini boleh memahami bukan sahaja perkara yang diminta oleh pengguna dalam gesaan, tetapi juga bagaimana perkara itu wujud dalam dunia fizikal.







Selain itu, Sora juga boleh mentafsir gesaan dengan tepat dan menjana karakter dengan ekspresi emosi. Ia mempunyai keupayaan untuk menghasilkan berbilang tangkapan dalam satu janaan video dengan mengekalkan karakter dan gaya visual dengan tepat.

https://twitter.com/OpenAI/status/1758192962755051792

Bagaimanapun, OpenAI menjelaskan model awal ini mempunyai beberapa kelemahan. Ia mungkin mempunyai kesukaran untuk mensimulasikan adegan kompleks. Contohnya, seseorang mungkin menggigit biskut, tetapi adegan seterusnya tidak memaparkan biskut dengan kesan gigitan.

Model ini juga mungkin keliru dengan gesaan butiran spatial, seperti mencampurkan kiri dan kanan.

Ketika ini, OpenAI mengambil beberapa langkah keselamatan penting sebelum menjadikan Sora tersedia dalam bentuk produk. Syarikat itu bekerjasama dengan "red teamers" untuk menguji serta menilai potensi bahaya dan risiko model AI berkenaan.

Akses awal turut diberikan kepada beberapa artis visual, pereka dan pembuat filem bagi mendapatkan maklum balas untuk menambah baik Sora.

Sumber: OpenAI