Ya, "ChatGPT kini bisa melihat, mendengar, dan bicara," kata OpenAI mengutip pengumuman resmi peluncuran kemampuan baru ChatGPT di laman resminya, Selasa.
OpenAI meluncurkan kemampuan suara dan gambar baru di ChatGPT, yang menawarkan jenis antarmuka baru yang lebih intuitif dengan memungkinkan penggunanya melakukan percakapan suara atau memberitahu ChatGPT tentang apa yang anda bicarakan.
Suara dan gambar memberi pengguna lebih banyak cara untuk menggunakan ChatGPT dalam kehidupan sehari-hari. Pengguna, misal, bisa memotret isi kulkas dan dapur kemudian mencari tahu menu apa untuk makan malam hari ini.
Setelah makan malam, anda juga bisa membantu anak mengerjakan soal matematika dengan mengambil foto, melingkari kumpulan soal, dan minta ChatGPT berbagi petunjuk mengenai menemukan jawabannya.
Anda kini dapat menggunakan suara untuk melakukan percakapan bolak-balik dengan ChatGPT. Bicaralah dengannya saat bepergian, minta cerita pengantar tidur untuk keluarga, atau selesaikan perdebatan di meja makan.
Untuk memulai interaksi dengan suara, buka Pengaturan kemudian pilih Fitur Baru di aplikasi seluler dan ikut serta dalam percakapan suara. Kemudian, ketuk tombol headphone yang terletak di sudut kanan atas layar dan pilih suara pilihan anda dari lima suara berbeda.
ChatGPT can now see, hear, and speak. Rolling out over next two weeks, Plus users will be able to have voice conversations with ChatGPT (iOS & Android) and to include images in conversations (all platforms). https://t.co/uNZjgbR5Bm pic.twitter.com/paG0hMshXb
— OpenAI (@OpenAI) September 25, 2023
Kemampuan suara baru ini didukung oleh model text-to-speech baru, yang mampu menghasilkan audio mirip manusia hanya dari teks dan contoh ucapan beberapa detik.
OpenAI berkolaborasi dengan pengisi suara profesional untuk menciptakan setiap suara. "Kami juga menggunakan Whisper, sistem pengenalan ucapan sumber terbuka kami, untuk menyalin kata-kata yang Anda ucapkan ke dalam teks," kata OpenAI.
Untuk memulai percakapan dengan gambar, silakan ketuk tombol foto untuk mengambil atau memilih gambar. Jika anda menggunakan iOS atau Android, ketuk tombol plus terlebih dahulu. Anda juga dapat mendiskusikan banyak gambar atau menggunakan alat menggambar kami untuk memandu ChatGPT.
Pemahaman gambar ChatGPT didukung oleh multimodal GPT-3.5 dan GPT-4. Model ini menerapkan keterampilan penalaran bahasanya pada berbagai macam gambar, seperti foto, tangkapan layar, dan dokumen yang berisi teks dan gambar.
Meski demikian, OpenAI mengakui bahwa mereka telah mengambil langkah-langkah teknis untuk secara signifikan membatasi kemampuan ChatGPT dalam menganalisis dan membuat pernyataan langsung tentang orang-orang karena ChatGPT tidak selalu akurat dan sistem ini harus menghormati privasi individu.
OpenAI meluncurkan kemampuan suara dan gambar di ChatGPT kepada pengguna Plus dan Perusahaan selama dua minggu ke depan. Suara akan hadir di iOS dan Android dan gambar akan tersedia di semua platform.
Baca juga: Pengamat Komunikasi: Peran pers tidak bisa digantikan teknologi kecerdasan buatan