Meta akan mendemonstrasikan model Movie Gen AI-nya, yang menggabungkan video dengan audio

Meta memperkenalkan Movie Gen, model generatif AI yang berfokus pada media yang dirancang untuk membantu dan menginspirasi pembuat film terlepas dari skala proyeknya.

Pesan teks akan diubah menjadi video dengan suara, tetapi calon pengguna yang tertarik harus menunggu beberapa saat karena belum ada rilis publik.

Namun, Meta mengklaim pada hari Jumat (4 Oktober) mereka “membagikan penelitian ini karena kami percaya pada kekuatan teknologi ini untuk membantu orang-orang mengekspresikan diri mereka dengan cara-cara baru dan untuk memberikan kesempatan kepada orang-orang yang sebelumnya tidak akan memiliki teknologi tersebut.”

Perusahaan tersebut berharap suatu hari nanti orang-orang dapat “mewujudkan visi artistik mereka” dengan akses semua orang ke aplikasi tersebut.

Movie Gen Meta bukan hanya model tingkat lanjut, karena ia menggabungkan “lemparan” model dasar dengan elemen teks-ke-video yang paling kuat. Saat memproduksi video AI, suara yang dihasilkan disesuaikan dengan setting atau tema video.

Bisa jadi suara kereta meninggalkan peron stasiun atau hujan lebat saat terjadi badai petir. Jika sesuai, musik juga ditambahkan.

Bagaimana film Gen Meta dilatih?

Movie Gen dan empat “kemampuannya” (pembuatan video, pembuatan video yang dipersonalisasi, pengeditan video presisi, dan pembuatan audio) dikatakan diperoleh menggunakan “kumpulan alat berlisensi dan tersedia untuk umum” dengan konten video. dari platform Meta seperti Facebook dan Instagram.

Tantangan sebelumnya bagi pembuat video adalah kemampuan mengedit. Hal ini sampai batas tertentu telah diselesaikan oleh perusahaan Mark Zuckerberg.

Movie Gen memperkenalkan metode pengeditan teks yang dapat Anda gunakan untuk pengeditan dasar. Bisa jadi “mengubah latar belakang langit malam pemandangan kota”, tapi itu hanya membuat perubahan spesifik.

Generator AI dapat menghasilkan konten video berdurasi hingga 16 detik pada 16 frame per detik, atau sebagai alternatif, Anda dapat memiliki video berdurasi 10 detik pada 24 frame per detik.

Output videonya memiliki lebar 768 piksel, yang setara dengan 1024 × 768, tetapi ini cukup untuk digabungkan dengan format HD lainnya.

Beberapa orang mungkin mengharapkan generasi suara, tetapi ada alasan bagus mengapa Meta tidak mengambil langkah itu. Pembuatan ucapan sangat sulit untuk dikuasai dan juga menjadi kontroversial dengan maraknya konten deepfake.

Faktor risikonya semakin meningkat menjelang pemilihan presiden akhir tahun ini dan iklim politik saat ini.

Meta mengungkapkan niatnya dengan menerbitkan penelitiannya tentang pembuatan video AI dan kemampuannya saat ini.

Kredit gambar: Meta

Pos Meta mendemonstrasikan model Movie Gen AI yang menggabungkan video dengan suara muncul pertama kali di ReadWrite.



Sumber