M.K.S.A (Mager Kepanjangan, Singkat Aja)
Intinya… Jumat lalu (4/10), Meta merilis Movie Gen sebagai tandingan OpenAI Sora, Runway Gen-3, dan Kling dalam AI generatif di bidang videografi. Seperti penyedia model lain, Movie Gen belum dirilis ke publik. Meta fokus untuk membuat video generator ini lebih humanis, seperti generator ucapan ulang tahun, dan lain sebagainya yang memanfaatkan input wajah.
Intinya… Jumat lalu (4/10), Meta merilis Movie Gen sebagai tandingan OpenAI Sora, Runway Gen-3, dan Kling dalam AI generatif di bidang videografi. Seperti penyedia model lain, Movie Gen belum dirilis ke publik. Meta fokus untuk membuat video generator ini lebih humanis, seperti generator ucapan ulang tahun, dan lain sebagainya yang memanfaatkan input wajah.
Meta baru-baru ini mengumumkan Movie Gen, sebuah rangkaian model AI yang dirancang untuk membuat dan memanipulasi video, audio, dan gambar. Salah satu kemampuannya adalah membuat video realistis dari hanya satu foto seseorang. Meta mengklaim bahwa Movie Gen lebih unggul dari model sintesis video lainnya berdasarkan penilaian manusia. Ini mendekatkan kita pada masa depan di mana siapa pun dapat membuat video lengkap tentang subjek apa pun sesuai permintaan.
Meskipun belum ada rencana untuk merilis kemampuan ini ke publik, Meta melihat Movie Gen sebagai alat yang dapat membantu orang meningkatkan kreativitas mereka. Mereka membayangkan aplikasi masa depan seperti membuat dan mengedit video "sehari-hari" untuk media sosial atau menghasilkan ucapan selamat ulang tahun animasi yang dipersonalisasi.
Movie Gen dibangun berdasarkan penelitian sebelumnya Meta dalam sintesis video. Menggunakan prompt teks sebagai panduan, sistem ini dapat menghasilkan video khusus dengan suara, mengedit dan menyisipkan perubahan ke video yang ada, serta mengubah gambar orang menjadi video yang dipersonalisasi.
Meta bukan satu-satunya yang mengembangkan sintesis video AI. Google juga telah memperkenalkan model bernama "Veo," dan Meta mengklaim bahwa Movie Gen lebih disukai manusia dibandingkan model-model seperti OpenAI Sora, Runway Gen-3, dan Kling.
Movie Gen dapat membuat video berdurasi hingga 16 detik dengan resolusi 1080p. Meta mengklaim model ini dapat menangani konsep kompleks seperti gerakan objek, interaksi subjek-objek, dan pergerakan kamera.
Namun, seperti model-model sebelumnya, kemampuan Movie Gen untuk menghasilkan adegan koheren mungkin bergantung pada konsep yang ditemukan dalam video pelatihan yang digunakan Meta. Hasil yang dipilih secara cermat sering kali berbeda dengan hasil yang biasa, dan mendapatkan hasil yang koheren mungkin memerlukan banyak percobaan.
Meta menyebutkan bahwa model-model ini dilatih menggunakan kombinasi dataset berlisensi dan publik, yang kemungkinan termasuk video yang diunggah oleh pengguna Facebook dan Instagram.
Selain itu, Meta telah menambahkan kemampuan sintesis audio ke Movie Gen. Model audio ini dapat menghasilkan suara latar, efek suara, dan musik latar yang disinkronkan dengan konten video berdasarkan prompt teks. Meta mengklaim model ini dapat menghasilkan audio untuk video dengan durasi berapa pun.