Dalam dunia kecerdasan buatan (AI) yang berkembang pesat, satu inovasi terkini dari China kini menarik perhatian global. Namun, teknologi ini masih belum banyak dibincangkan di Malaysia. Inovasi tersebut datang daripada syarikat 4DV.ai, yang menggabungkan konsep 4D Gaussian Splatting untuk mengubah video 2D biasa menjadi pengalaman visual empat dimensi yang boleh diterokai secara interaktif.
Apa maksudnya? Bayangkan anda menonton rakaman video biasa, tetapi kali ini anda boleh menukar sudut kamera mengikut kehendak sendiri.
Anda boleh memutar paparan ke belakang, zum masuk, dan lebih menarik lagi, audio juga akan berubah mengikut sudut pandang anda. Ini bukan animasi CGI biasa, sebaliknya hasil daripada AI yang memahami ruang dan masa dalam video serta membina semula persekitaran itu dalam bentuk empat dimensi.
Apa itu 4D Gaussian Splatting?
Teknologi ini berasal daripada kajian akademik oleh penyelidik di Universiti Fudan, China, dan dibentangkan dalam persidangan ICLR 2024. Ia menggunakan kaedah paparan volumetrik yang dikenali sebagai Gaussian Splatting, iaitu satu teknik yang membina bentuk tiga dimensi berdasarkan ribuan titik Gaussian.
Dimensi keempat yang ditambah ialah masa. Ini bermakna sistem ini bukan sahaja memodelkan ruang dalam bentuk 3D, tetapi juga menangkap perubahan dan pergerakan dalam babak mengikut urutan masa.
Syarikat 4DV.ai kemudiannya mengolah teknologi ini untuk digunakan secara meluas oleh orang ramai. Mereka membangunkan sistem berasaskan web yang tidak memerlukan alat seperti set kepala realiti maya. Ia boleh diakses terus melalui pelayar web seperti Chrome atau Edge.
Bagaimana ia berfungsi?
Sistem ini bermula dengan video 2D biasa, seperti rakaman daripada telefon pintar atau dron. AI akan menganalisis setiap bingkai dalam video tersebut, mengenal pasti maklumat seperti kedalaman, bentuk dan pergerakan.
Selepas itu, sistem akan membina satu model volumetrik empat dimensi yang boleh diputar, dizum dan diterokai secara masa nyata.
Salah satu ciri paling unik ialah sokongan untuk audio ruangan (spatial). Ini bermaksud bunyi dalam babak akan berubah mengikut posisi atau sudut pandang pengguna.
Sebagai contoh, jika anda berada di belakang subjek, bunyinya juga akan berbeza, seolah-olah anda benar-benar berada dalam ruang tersebut.
Prestasi dan potensi
Dengan menggunakan kad grafik seperti NVIDIA RTX 3090, sistem ini mampu mencapai kadar bingkai melebihi 80 fps pada resolusi tinggi.
Dalam beberapa ujian terkini, versi model yang lebih baharu mencecah lebih 500 fps untuk babak tertentu. Ini menjadikannya cukup pantas untuk digunakan dalam aplikasi masa nyata.
4DV.ai menjangkakan teknologi ini akan digunakan dalam pelbagai bidang. Antaranya ialah filem interaktif, pendidikan realiti mendalam, liputan sukan, dan simulasi industri.
Malah, ia juga membuka peluang baharu dalam bidang pemasaran digital, di mana pengguna boleh mengalami produk secara maya dengan lebih realistik.
Kesimpulan
Walaupun dunia kini banyak memberi perhatian kepada penjana imej dan video AI seperti Sora atau Veo, teknologi 4DV.ai membawa satu pendekatan yang berbeza.
Ia memberi kawalan penuh kepada pengguna untuk meneroka kandungan secara interaktif, bukan sekadar menonton secara pasif.
Ini adalah langkah penting ke arah masa depan kandungan digital, di mana video akan menjadi lebih hidup dan boleh diterokai dari pelbagai sudut.
Buat masa ini, teknologi ini belum banyak disentuh atau diceritakan media tempatan. Namun, bagi anda yang mengikuti perkembangan AI dan teknologi visual, inilah antara inovasi yang patut diberi perhatian.
Ia mungkin bakal mengubah cara kita melihat dan mencipta kandungan dalam masa terdekat.
{suggest}