Manusia menggunakan kedua-dua belah mata untuk menganggar jarak dan perspektif untuk melihat secara 3 dimensi. Untuk AI, pembelajaran mesin memerlukan kemampuan sebegini untuk memahami data imej yang dilihatnya. Penyelidik di Nvidia berjaya mencipta kaedah sedemikian dengan satu rangka kerja yang dipanggil DIB-R (Differentiable Interpolation-based Renderer).

Kebiasaannya, komputasi grafik menukarkan model 3D kepada imej 2D. Namun, Nvidia melalui rangka kerja tersebut berjaya menukar imej 2D kepada model 3D pula. DIB-R adalah sangat berguna terutamanya dalam bidang robotik. Ia mampu meningkatkan tahap anggaran maklumat dan juga persepsi jarak di sekeliling persekitaran.

Untuk melatih model DIB-R ini, ia mengambil masa selama 2 hari menggunakan pemproses grafik Nvidia V100 GPU. Dengan latihan tersebut, DIB-R mampu untuk menukar model 3D dari gambar 2D kurang dari 100 milisaat.

IKLAN

“Ini adalah kali pertama untuk sesiapapun boleh mengambil mana-mana gambar 2D dan tukarkannya kepada model 3D”. Ujar Jun Gao, salah seorang pasukan penyelidik tersebut.

Ia juga boleh menukarkan gambar 2D haiwan yang sudah pupus seperti T-Rex atau burung Dodo kepada model 3D kurang dalam 1 saat.

Penyelidik di Nvidia akan mempersembahkan rangka kerja DIB-R ini di Neural Information Processing System (NeurIPS) yang bertempat di Vancouver minggu ini.

Sumber: Nvidia