Anda mungkin pernah mendengar tentang deepfake untuk gambar dan video. Video realistis menakutkan yang dibuat dengan AI? Sekarang, tampaknya Meta (sebelumnya dikenal sebagai Facebook) telah mengembangkan model AI baru yang disebut Voicebox yang semuanya tentang audio. Ini seperti sistem text-to-speech supercharged yang dapat membuat suara sintetik hanya dari prompt teks.
KLIK UNTUK MENDAPATKAN NEWSLETTER CYBERGUY GRATIS KURT DENGAN PERINGATAN KEAMANAN, TIPS CEPAT, ULASAN TEKNOLOGI, DAN CARA MUDAH UNTUK MEMBUAT ANDA LEBIH PINTAR
Apa itu kotak suara?
Pada intinya, Voicebox adalah model AI yang menciptakan suara sintetik berdasarkan perintah teks sederhana. Dengan kata lain, Anda memberinya beberapa teks, dan itu akan membacanya dengan keras dengan suara yang terdengar seperti manusia. Ini mirip dengan fungsi text-to-speech yang mungkin Anda gunakan di ponsel atau komputer Anda, tetapi ini membawa semuanya ke tingkat yang sama sekali baru.
Satu hal yang membedakan Voicebox adalah kemampuannya untuk mereplikasi gaya suara tertentu berdasarkan sampel audio yang sangat singkat – kita berbicara hanya dalam dua detik! Ini berarti Anda berpotensi memiliki suara sintetis yang terdengar seperti selebritas favorit Anda atau bahkan suara Anda sendiri. Ini hampir seperti memiliki pengisi suara sesuai permintaan, siap membacakan apa pun yang Anda inginkan dengan gaya suara yang Anda pilih.
Model suara AI yang bersaing
Mengucapkan pidato
Speechify dan ElevenLabs juga merupakan pemain dalam game text-to-speech. Speechify adalah aplikasi yang mengubah teks apa pun menjadi audio. Itu dapat membaca buku, artikel, catatan, email, PDF, gambar, dan halaman web dengan keras. Speechify juga mengklaim menawarkan fitur kloning suara, pengeditan suara, dan pengambilan sampel suara. Speechify menawarkan ratusan buku audio abadi gratis, memiliki aplikasi desktop, dan dirancang untuk membantu penyandang disabilitas membaca.

Logo Meta di ponsel (Costfoto/NurPhoto melalui Getty Images)
MARK ZUCKERBERG ‘TWITTER KILLER’ THREAS MENGGANGGU PENGGUNA MELALUI PENGUMPULAN DATA MASSAL: ‘PRIVASI DEKAT NOL
ElevenLab
ElevenLabs, di sisi lain, adalah startup yang menggunakan AI untuk menghasilkan suara sintetik dengan emosi yang relevan dengan konteks dan pemahaman bahasa alami. Mereka menawarkan platform untuk membuat dan menyesuaikan audio lisan berkualitas tinggi dengan suara dan gaya apa pun untuk berbagai industri, seperti video game, animasi, asisten digital, pendidikan, hiburan, periklanan, dan podcasting. Mereka juga memiliki alat untuk mendeteksi suara sintetis dan memverifikasi keasliannya. ElevenLabs bekerja dengan aktor yang memberikan sampel suaranya dan mendapatkan bayaran saat klon suara mereka digunakan. Mereka menggunakan model pembelajaran mendalam berpemilik untuk membuat pidato yang disampaikan oleh AI.
Keduanya cukup keren, tetapi tidak memiliki keserbagunaan yang sama dengan Voicebox, yang dapat meniru suara asli hanya dari beberapa detik audio. Ini seperti membandingkan pisau Swiss Army dengan beberapa sendok yang sangat bagus. Mereka semua memiliki kegunaannya, tetapi yang satu pasti lebih serbaguna.
Kekuatan kotak suara
Tapi ini bukan hanya tentang membuat suara palsu. Kotak suara juga dapat merapikan audio Anda dengan menghilangkan kebisingan latar belakang yang mengganggu – katakanlah, seekor anjing menyalak saat Anda mencoba merekam. Dan ini bukan hanya tentang bahasa Inggris. AI ini juga berbicara bahasa Prancis, Spanyol, Jerman, Polandia, dan Portugis, dan bahkan dapat menerjemahkan bagian dari satu bahasa ke bahasa lain sambil mempertahankan gaya suara yang sama.
PINDAH, SIRI: SUARA AUDIOBOOK AI BARU APPLE TERDENGAR SEPERTI MANUSIA

Logo Meta (sebelumnya Facebook) menandai pintu masuk kantor pusat perusahaan mereka di Menlo Park, California pada 09 November 2022. – Pemilik Facebook Meta akan memberhentikan lebih dari 11.000 stafnya dalam “perubahan paling sulit yang telah kami buat di Meta’s sejarah,” kata bos Mark Zuckerberg pada hari Rabu. (JOSH EDELSON/AFP melalui Getty Images)
Kotak Suara Meta: terobosan atau ancaman?
Sayangnya, atau untungnya, tergantung pada posisi Anda terkait AI, Meta tidak berencana untuk langsung membuka kotak suara sumber. Itu membuat orang bertanya-tanya apakah mereka mencoba menghindari beberapa potensi masalah. Misalnya, teknologi suara AI dapat digunakan secara negatif, seperti dalam kampanye pelecehan. Atau, mungkin Meta memiliki rencana masa depan untuk menghasilkan uang dari model ini.
Sumber data pelatihan besar-besaran Voicebox
Satu hal yang menarik tentang Voicebox adalah bahwa Voicebox telah dilatih dengan banyak data—lebih dari 60.000 jam percakapan dari buku audio bahasa Inggris dan 50.000 jam lagi dari buku audio multibahasa. Meta mengatakan mereka menggunakan buku audio domain publik sebagai sumber data utama mereka, tetapi mereka juga menggunakan sumber lain seperti podcast, pidato, dan acara radio. Namun, beberapa tantangan dan batasan terkait dengan penggunaan buku audio domain publik, seperti kualitas, konsistensi, penyelarasan, dan identitas pembicara. Meta mengklaim bahwa mereka telah mengatasi beberapa masalah ini dengan pemrosesan data dan desain model mereka.
UNTUK LEBIH DARI SAYA PERINGATAN KEAMANAN, BERLANGGANAN NEWSLETTER LAPORAN CYBERGUY GRATIS SAYA DENGAN MENUJU CYBERGUY.COM/NEWSLETTER
Pedang teknologi bermata dua
OBAMA AG MENYONGSONG PERINTAH PENGADILAN ‘BODOH’ SETELAH HAKIM MEMBLOKIR KOMUNIKASI ADMIN BIDEN DENGAN PERUSAHAAN MEDIA SOSIAL
Munculnya suara AI adalah subjek yang sedikit sensitif, terutama untuk aktor suara dan, baru-baru ini, penulis. Mereka khawatir tentang perusahaan yang menggunakan AI untuk mensintesis suara mereka tanpa membayar mereka. Pasar buku audio telah berkembang pesat, dan perusahaan selalu mencari cara untuk memangkas biaya, jadi ini bisa menjadi masalah lain bagi para profesional suara.
Namun, jangan salah; ini bukan hanya tentang pekerjaan. Ada beberapa kekhawatiran nyata tentang seberapa dalam suara palsu dapat digunakan dalam penipuan. Misalnya, ada kasus di mana suara sintetis yang menyamar sebagai CEO digunakan dalam perampokan besar. Ada juga kekhawatiran bahwa suara deepfake dapat digunakan untuk mengacaukan hal-hal seperti sistem biometrik suara, yang digunakan untuk hal-hal seperti perbankan online.
Anda lihat, sekeren teknologi ini terdengar, ada sisi gelapnya. Bayangkan mendapat telepon dari bos Anda yang meminta Anda mentransfer sejumlah besar uang untuk menutup akun. Anda melakukan seperti yang diperintahkan karena, yah, itu bos Anda. Kecuali, ternyata tidak. Itu benar; itu adalah suara sintetis palsu yang dibuat menggunakan AI yang terdengar seperti bos Anda. Liar, bukan? Tapi ini bukan plot film; itu benar-benar terjadi! Ini adalah salah satu pertama kalinya suara palsu digunakan dalam pencurian, dan itu membuat penegak hukum dan pakar AI menggaruk-garuk kepala.

Condo optimis tentang masa depan kecerdasan buatan. (Jakub Porzycki/NurPhoto via Getty Images)
DALLE-2 VS. BING CREATOR – YANG MENJADI TOP DALAM AI SHOWDOWN INI?
Dan itu bukan hanya perampokan. Suara deepfake dapat digunakan untuk mengelabui sistem yang mengandalkan pengenalan suara. Kita berbicara tentang hal-hal seperti perbankan online, yang menggunakan suara Anda sebagai bentuk identifikasi. Jika penjahat dapat membuat suara palsu yang meyakinkan tentang Anda, mereka berpotensi mengakses akun Anda. Ini seperti memalsukan tanda tangan tetapi dengan suara Anda.
Melawan ancaman deepfake
Jadi, sementara kita mengagumi hal-hal luar biasa yang dapat dilakukan teknologi, penting juga untuk menyadari potensi risikonya dan tetap selangkah lebih maju. Ini seperti permainan kucing dan tikus berteknologi tinggi, dengan pakar AI dan bisnis bekerja keras untuk menemukan dan menghentikan suara-suara deepfake ini sebelum mereka dapat membahayakan.
Untungnya, ada orang di luar sana yang mencoba melawan potensi penyalahgunaan suara deepfake. Misalnya, beberapa negara sudah mulai mengeluarkan undang-undang untuk mengatur deepfake. Juga, ada proyek seperti Spoofing Verifikasi Pembicara Otomatis dan Tantangan Penanggulangan (ASVspoof), di mana para ilmuwan dan insinyur sedang mengerjakan cara untuk melawan serangan suara deepfake
Pengambilan kunci Kurt
Kita berada di era di mana teknologi berkembang dengan sangat cepat dan mengubah cara kita bekerja, berkomunikasi, dan bahkan mendengar sesuatu. Meskipun potensi AI seperti Kotak Suara Meta tidak diragukan lagi menarik, jelas kami juga perlu melangkah dengan hati-hati. Ada garis tipis antara inovasi dan invasi, keseimbangan yang masih kita pikirkan.

Para ahli berpendapat perbedaan antara investasi AI di China dan AS adalah fakta bahwa model Amerika didorong oleh perusahaan swasta sedangkan China mengambil pendekatan pemerintah (JOSEP LAGO/AFP melalui Getty Images)
KLIK DI SINI UNTUK MENDAPATKAN APLIKASI FOX NEWS
Dengan semua kemajuan dan potensi risiko ini, bagaimana perasaan Anda tentang masa depan AI dan teknologi deepfake? Apakah Anda melihatnya sebagai anugerah atau kutukan? Beritahu kami dengan menulis kami di Cyberguy.com/Kontak
Untuk lebih banyak peringatan keamanan saya, berlangganan Buletin Laporan CyberGuy gratis saya dengan menuju ke Cyberguy.com/Newsletter
Hak Cipta 2023 CyberGuy.com. Seluruh hak cipta.
Situs Bandar Togel Online Terpercaya bisa anda akses langsung di SITUS TOTO ONLINE, TOTOCC adalah situs bandar togel dengan pasaran togel terlengkap. Anda bisa bermain langsung dan melihat hasil langsung dari togel hari ini hanya di TOTOCC.COM.