Home Iptek Cara mengaktifkan mode suara lanjutan di ChatGPT – panduan fitur AI baru

Iptek

Cara mengaktifkan mode suara lanjutan di ChatGPT – panduan fitur AI baru

September 25, 2024

Di antara pembaruan OpenAI baru, perusahaan teknologi di balik ChatGPT telah mengumumkan peluncuran fitur mode suara baru yang memungkinkan pengguna melakukan percakapan alami dengan chatbot mereka.

Perusahaan mengatakan produk tersebut belum tersedia di negara-negara UE, termasuk Islandia, Liechtenstein, Norwegia, Swiss, atau Inggris.

“Semoga ini layak untuk ditunggu,” tulis pendiri dan CEO OpenAI Sam Altman dalam postingan di X.

Pengenalan mode suara tingkat lanjut dimulai hari ini! (jatuh tempo dalam seminggu)

harap menurut Anda itu pantas untuk ditunggu

— Sam Altman (@sama) 24 September 2024

Inilah yang perlu Anda ketahui tentangnya dan cara mengaktifkan mode suara lanjutan di ChatGPT.

Apa itu Mode Suara Tingkat Lanjut di ChatGPT?

Obrolan suara memungkinkan pengguna melakukan percakapan dengan ChatGPT, yang berarti Anda dapat melakukan interaksi dan percakapan yang lebih alami. Ketika Anda dapat mengajukan pertanyaan atau berdiskusi melalui input suara, ChatGPT memberikan respons verbal.

Saat ini, ada dua jenis percakapan suara – standar dan lanjutan.

Advanced Voice diluncurkan ke semua pengguna Plus dan Tim di aplikasi ChatGPT sepanjang minggu.

Sementara Anda telah menunggu dengan sabar, kami telah menambahkan instruksi khusus, memori, lima suara baru, dan aksen yang ditingkatkan.

Ia juga dapat mengatakan “Maaf, saya terlambat” dalam lebih dari 50 bahasa. pic.twitter.com/APOqqhXtDg

— OpenAI (@OpenAI) 24 September 2024

ReadWrite melaporkan OpenAI meluncurkan mode suara standar barunya bulan lalu. Standard Voice menggunakan beberapa model bahasa berskala besar (LLM) untuk menghasilkan responsnya, termasuk mengetik apa yang Anda ucapkan ke dalam teks sebelum mengirimkannya ke model OpenAI untuk mendapatkan respons. Meskipun suara standar tidak multimodal seperti suara tingkat lanjut, percakapan suara standar juga menggunakan GPT-4o dan GPT-4o mini. Setiap permintaan dalam suara standar diperhitungkan dalam batas pesan Anda.

Perbedaan mode lanjutan adalah mode ini menggunakan kemampuan audio asli dan fitur GPT-4o. Hasilnya, OpenAI berharap dapat menciptakan percakapan real-time yang lebih alami yang mempertimbangkan isyarat non-verbal, seperti kecepatan pengguna berbicara, dan dapat merespons dengan emosi.

Namun, penggunaan suara tingkat lanjut dibatasi oleh pengguna harian Plus dan Team.

Bagaimana cara mengaktifkan mode suara di ChatGPT?

Pada bulan Juli, OpenAI memperkenalkan mode suara audio saja yang canggih untuk sekelompok kecil pengguna ChatGPT Plus dan berencana untuk memperluasnya ke semua pelanggan pada musim gugur.

Meskipun berbagi layar dan video merupakan bagian dari demo awal, keduanya saat ini tidak tersedia dalam versi alfa ini, dan OpenAI belum memberikan jadwal penyertaannya.

Selain itu, pelanggan akan menerima email notifikasi ketika fitur ini tersedia. Setelah diaktifkan, pengguna dapat beralih antara Mode Suara Standar dan Lanjutan di bagian atas aplikasi saat menggunakan fitur suara ChatGPT.

Untuk memulai obrolan suara, ketuk ikon Suara di sudut kanan bawah layar Anda.

Jika Anda menggunakan suara tingkat lanjut, Anda akan melihat gelembung biru di tengah layar saat percakapan dimulai. Untuk suara standar, bolanya akan berwarna hitam.

Layar smartphone yang menampilkan notifikasi mendekati batas harian penggunaan suara tingkat lanjut. Pesannya mengatakan, "Hampir setiap hari. Anda memiliki 15 menit suara tingkat lanjut. Ketika Anda mencapai batas, Anda dapat beralih ke suara standar. Pelajari lebih lanjut." Di tengah layar terdapat gradien biru dan putih melingkar, dengan ikon mikrofon dan pengaturan terlihat di atas. — Mode suara lanjutan OpenAI yang baru untuk ChatGPT menampilkan balon biru. Kredit: OpenAI

Selama percakapan, Anda dapat membisukan atau mengaktifkan suara Anda dengan mengeklik ikon mikrofon di kiri bawah. Dan bila Anda sudah siap untuk mengakhiri percakapan, cukup klik ikon keluar di kanan bawah.

Jika Anda memulai percakapan suara untuk pertama kalinya atau menggunakan suara tingkat lanjut untuk pertama kalinya, Anda akan diminta untuk memilih suara. Sekadar peringatan, volume pemilih mungkin sedikit berbeda dari yang Anda dengar dalam percakapan.

Layar smartphone menghadirkan mode suara canggih dengan caption "Sampaikan salam pada mode suara tingkat lanjut." Fitur utama meliputi "Percakapan alami" yang merespons gangguan dan humor, "Banyak suara" dengan lebih banyak pilihan suara, "Dipersonalisasi untuk Anda" menggunakan memori dan instruksi khusus, dan "Anda memegang kendali" memungkinkan Anda menyimpan atau menghapus rekaman audio. Di bawah, A "Melanjutkan" tombol akan ditampilkan. — Fitur mode suara lanjutan diluncurkan ke beberapa pengguna Plus. Kredit: Suswati Basu untuk ReadWrite

Anda selalu dapat mengubah suara Anda di pengaturan nanti, dan pengguna suara tingkat lanjut bahkan dapat menyesuaikan suaranya langsung dari layar obrolan melalui menu penyesuaian di kanan atas.

Pastikan Anda memberikan izin kepada aplikasi ChatGPT untuk menggunakan mikrofon Anda agar semuanya berjalan lancar.

Dan jika fitur ini belum tersedia untuk Anda, Anda akan melihat ikon headphone, bukan tombol on/off. Dengan versi mana pun, Anda dapat menghentikan percakapan dan mengarahkannya ke cara yang paling sesuai untuk Anda.

Apakah suara ChatGPT tersedia?

Jika Anda masuk ke ChatGPT melalui aplikasi iOS, macOS, atau Android, Anda sudah memiliki akses ke fitur suara standar. Namun, suara tingkat lanjut saat ini hanya tersedia untuk pengguna Plus dan Tim.

Ada batas harian untuk penggunaan suara tingkat lanjut, yang dapat berubah seiring waktu, tetapi Anda akan mendapat peringatan saat mendekati batas tersebut – dengan peringatan 15 menit. Ketika Anda mencapai batas, percakapan Anda akan otomatis beralih ke suara standar.

Advanced Voice belum mendukung hal-hal seperti gambar, sehingga pengguna hanya dapat melanjutkan percakapan Advanced Voice dengan teks atau suara standar, bukan sebaliknya. Percakapan yang dimulai dengan suara standar selalu dapat dilanjutkan menggunakan suara atau teks standar, namun tidak dengan suara lanjutan. Suara tingkat lanjut juga tidak tersedia dengan GPT – Anda harus beralih ke suara standar untuk itu.

OpenAI juga belum memperkenalkan beberapa fitur yang dapat diakses. Oleh karena itu, subtitle tidak tersedia selama percakapan suara, namun transkripnya akan muncul nanti dalam percakapan teks Anda. Selain itu, Anda hanya dapat melakukan satu obrolan suara dalam satu waktu.

Advanced Voice dapat membuat dan mengakses memori dan instruksi khusus seperti suara standar, yang memiliki fitur ini.

Apakah obrolan suara ChatGPT aman?

Pada bulan Agustus, OpenAI mengungkapkan bahwa ada beberapa kelemahan keamanan pada mode suara ChatGPT, namun meyakinkan bahwa mereka dapat mengatasinya. OpenAI telah menerbitkan laporan tentang fitur keamanan GPT-4o, yang membahas masalah umum yang muncul saat menggunakan model tersebut.

“Masalah keamanan” pada mode suara ChatGPT mencakup masalah umum seperti menghasilkan tanggapan yang tidak pantas, seperti konten erotis atau kekerasan, dan asumsi yang bias. OpenAI telah melatih model tersebut untuk memblokir keluaran tersebut, namun laporan tersebut mencatat bahwa suara yang tidak realistis seperti erangan erotis, jeritan bernada tinggi, dan suara tembakan tidak sepenuhnya tersaring. Artinya, permintaan dengan suara sensitif ini masih dapat memperoleh tanggapan.

Masalah lainnya adalah komunikasi dengan model dengan vokal. Penguji menemukan bahwa GPT-4o dapat diakali untuk meniru suara seseorang atau berpura-pura menjadi pengguna. Untuk mencegah hal ini, OpenAI hanya mengizinkan suara yang telah disetujui sebelumnya, tidak termasuk suara untuk Scarlett Johansson, yang telah dihapus oleh perusahaan. Selain itu, meskipun GPT-4o dapat mengenali suara lain, GPT-4o dilatih untuk menolak permintaan tersebut karena alasan privasi kecuali jika GPT-4o mengidentifikasi kutipan terkenal.

Tim merah juga mencatat bahwa GPT-4o bisa dikatakan lebih persuasif, mengingat dampak dari kata-kata yang diucapkan, dalam menyebarkan misinformasi atau teori konspirasi. Model ini dilatih untuk menolak permintaan konten berhak cipta dan memiliki filter tambahan untuk memblokir musik. Dan fakta menariknya, ia diprogram untuk tidak bernyanyi sama sekali. Namun, dalam contoh dari pengguna di X ini, suara membantu mereka menyetem gitar dengan bunyi nada.

Suara tingkat lanjut di ChatGPT menyetel gitar saya. pic.twitter.com/1H6mYZTCq7

– Pietro Schirano (@skirano) 24 September 2024

Bagaimana cara berhenti berbagi audio?

Anda dapat berhenti membagikan audio Anda kapan saja dengan membuka halaman pengelolaan data di pengaturan ChatGPT Anda. Matikan saja pengaturan “Tingkatkan suara untuk semua orang”.

Jika Anda tidak melihat “Tingkatkan audio untuk semua” di pengaturan pengelolaan data, itu berarti Anda belum membagikan audio Anda dengan OpenAI dan audio tersebut tidak digunakan untuk melatih model.

Jika Anda memutuskan untuk berhenti berbagi, audio dari obrolan suara di masa mendatang tidak akan digunakan untuk pelatihan model. Namun, klip audio yang sebelumnya diekstraksi dari akun Anda dapat digunakan untuk melatih model OpenAI.

OpenAI juga disebutkan bahwa meskipun Anda berhenti membagikan audio, transkripsi obrolan tersebut masih dapat digunakan untuk melatih model kami” jika setelan “Tingkatkan model untuk semua orang” masih aktif. Untuk tidak ikut serta sepenuhnya, nonaktifkan “Peningkatan Model untuk Semua”.

Klip audio dari obrolan suara lanjutan Anda akan tetap ada di riwayat obrolan Anda selama obrolan tersebut masih ada. Jika Anda menghapus obrolan, klip audio juga akan dihapus dalam waktu 30 hari, kecuali diperlukan karena alasan keamanan atau hukum. Jika Anda telah membagikan klip audio Anda sendiri dengan OpenAI untuk melatih model, klip tersebut masih dapat digunakan, tetapi hanya setelah sambungannya terputus dari akun Anda.

Gambar unggulan: Ideogram / Canva

Pos Cara Mengaktifkan Mode Suara Tingkat Lanjut di ChatGPT – Panduan Fitur AI Baru muncul pertama kali di ReadWrite.

Sumber