OpenAI kini melancarkan Operator, ejen kecerdasan buatan (AI) serba guna yang boleh melaksanakan tugasan di web bagi pihak pengguna.
Dengan menggunakan pelayarnya sendiri, ia boleh melihat laman web dan berinteraksi dengan menaip, klik dan menatal (scrolling).
Walau bagaimanapun, Operator ketika ini masih dalam fasa pratonton penyelidikan, yang bermaksud ia mempunyai had tertentu dan akan berkembang berdasarkan maklum balas pengguna.
Menurut OpenAI, Operator dikuasakan oleh model baru yang dipanggil Computer-Using Agent (CUA), menggabungkan keupayaan GPT-4o dengan “advanced reasoning through reinforcement learning” untuk membolehkannya berinteraksi dengan antara muka grafik pengguna (GUI) – butang, menu dan teks.
Operator boleh “melihat” (melalui tangkapan skrin) dan “berinteraksi” (menggunakan semua tindakan yang dibenarkan oleh tetikus dan papan kekunci) dengan pelayar, membolehkannya mengambil tindakan di web tanpa memerlukan integrasi API khas.
Operator boleh diarahkan untuk menangani pelbagai tugas berulang di pelayar seperti mengisi borang, memesan barangan runcit, malah mencipta meme.
Sebagai sebahagian pratonton penyelidikan, Operator tersedia untuk pengguna ChatGPT Pro di AS terlebih dahulu, yang boleh diakses melalui operator.chatgpt.com.
Akan datang, OpenAI merancang untuk memperluaskan kepada pengguna ChatGPT Plus, Team, dan Enterprise serta mengintegrasikan kemampuan berkenaan ke dalam ChatGPT.
{suggest}
Sumber: OpenAI