O Google mengumumkan, Selasa ini (14), model generatif video terbarunya, Veo, yang merupakan bagian dari alat VideoFX. Fitur baru ini akan memungkinkan pembuatan video berdasarkan perintah teks dan hadir sebagai pesaing sora da OpenAI.
Alat tersebut diumumkan dalam siaran langsung selama Google I / O 2024. Selain memungkinkan pembuatan konten, platform ini akan memungkinkan interaksi dengan teknologi perusahaan lainnya, seperti alat untuk membuat musik menggunakan AI.
Apa itu Veo?

Selama pengungkapan kecerdasan buatan terbaru yang dikembangkan oleh Google untuk pembuatan video, sebuah poin penting ditekankan: Veo melampaui durasi satu menit pada umumnya, menawarkan hasil dalam resolusi 1080p dan kemampuan untuk mengeksplorasi berbagai gaya dan visual sinematik.
Menurut perusahaan, AI ini memiliki pengetahuan tingkat lanjut dalam bahasa alami dan semantik visual, memungkinkan rendering yang lebih akurat bahkan dengan perintah yang lebih panjang dan detail.
Google mengklaim Veo mampu menghasilkan konten yang konsisten dan kohesif, di mana orang, hewan, dan benda bergerak secara realistis di sepanjang video. Selain itu, alat ini mampu memahami istilah-istilah spesifik dari dunia sinematik, seperti “timelapse” dan “rekaman lanskap dari udara”, sehingga memberikan kontrol kreatif yang lebih besar atas hasil yang diinginkan.
Presentasi AI baru ditujukan kepada sekelompok pembuat film dan pencipta, yang memiliki kesempatan untuk mencoba model tersebut dan memberikan umpan balik kepada perusahaan, sehingga berkontribusi terhadap kemungkinan perbaikan di masa depan.
Google juga mengumumkan bahwa beberapa fitur Veo akan diintegrasikan secara bertahap ke YouTube Shorts dan produk perusahaan lainnya, meski tanpa menentukan tanggalnya.
VideoFX
VideoFX adalah portal yang diakses melalui browser itu sendiri untuk menggunakan Veo, model generatif yang dibuat oleh perusahaan untuk bersaing dengan Sora, dari OpenAI. Saat ini, produk baru tersebut hanya tersedia dalam tahap percobaan di Amerika Serikat.
Hanya dengan perintah teks, gambar, atau video, fitur baru ini memungkinkan Anda membuat dan mengedit video berdurasi lebih dari 60 detik dalam gaya visual berbeda, memungkinkan pengguna menjelajahi berbagai ide.
Menurut Google, alat ini juga menawarkan beberapa opsi pengeditan, seperti mode Storyboard untuk mengerjakan adegan yang dihasilkan, selain penyertaan musik dan efek suara.
Penduduk Amerika Serikat dapat mengakses alat tersebut melalui a daftar tunggu. Saat ini, belum ada perkiraan peluncurannya di Brasil dan negara lain.
GambarFX
Google juga mengumumkan Image 3, tersedia di ImageFX dari Google Labs. Dengannya, dimungkinkan untuk membuat gambar yang benar-benar baru berdasarkan perintah teks, sesuatu yang sangat mirip dengan apa yang kita lihat di MidJourney, misalnya.
Dengan generasi ke-3, Google berjanji bahwa pengguna akan memiliki gambar yang sama persis dengan kenyataan, berkat peningkatan kualitas dan fidelitas pembuatan gambar.
Menurut raksasa Mountain View, Imagem 3 bahkan akan dapat menempatkan kata dan frasa dalam gambar, sesuatu yang masih menimbulkan beberapa masalah pada platform dengan proposal serupa.
MusikFX
Google juga telah mengumumkan alat AI generatif lainnya untuk membuat musik, MusicFX dengan AI Sandbox. Fitur baru yang hadir dalam kemitraan dengan YouTube ini akan bersaing langsung dengan perusahaan seperti Moises.ai, yang menggunakan AI untuk memisahkan trek dari lagu yang sama.
"Alat-alat ini dirancang untuk membuka arena kreativitas baru, memungkinkan orang membuat bagian instrumental baru dari awal, mengubah suara dengan cara baru, dan banyak lagi.“, kata Google saat presentasi.
PelajariLM

Terakhir, Google mengungkapkan rangkaian model AI generatif baru yang disesuaikan untuk pembelajaran. LearnLM dirancang untuk membimbing siswa dengan cara “percakapan” dalam berbagai mata pelajaran.
"LearnLM didasarkan pada penelitian pendidikan, menjadikan pengalaman belajar lebih pribadi dan menarik,” jelas James Manyika, wakil presiden senior penelitian, teknologi, dan masyarakat di Google Research, di Google I/O pada hari Selasa.
LearnLM saat ini didukung oleh fitur-fitur di seluruh produk Google, termasuk YouTube, aplikasi Google Gemini, Google Penelusuran, dan Google Kelas.
Dalam aplikasi Gemini, misalnya, dalam beberapa bulan mendatang, dimungkinkan untuk membuat chatbot yang dipersonalisasi yang dapat bertindak sebagai ahli dalam berbagai bidang. Chatbots akan memberikan panduan belajar dan kegiatan praktis, seperti kuis dan permainan, dengan menghormati preferensi individu setiap siswa.
Lihat juga:
Google menampilkan Astra, saingan GPT-4 yang melihat dunia nyata melalui kamera ponsel.
Sumber: Google.
Temukan lebih lanjut tentang Showmetech
Daftar untuk menerima berita terbaru kami melalui email.