
Ringkasan
- Pelanggan ChatGPT Plus mendapatkan tes rasa Sora berdurasi 5 detik, bukan klip berdurasi penuh 20 detik.
- Video Sora tetap untung-untungan karena masalah koherensi dan petunjuk visualisasi.
- Teknologi video Sora terasa kurang matang dibandingkan generasi gambar, tertinggal dari Veo 2.
Setelah berbulan-bulan digoda, teknologi pembuatan video Sora OpenAI tersedia untuk umum. Saya menghabiskan beberapa waktu bermain-main dengan teknologi yang sangat dinanti-nantikan ini, dan sejujurnya saya merasa sedikit kecewa.
Pelanggan ChatGPT Plus Dapatkan Tes Rasa Sora selama 5 Detik
Seperti pelanggan ChatGPT Plus lainnya, setelah Sora diluncurkan ke publik, saya mendapat akses untuk membuat video sendiri. Namun, ini lebih seperti penguji rasa daripada aslinya. Orang yang secara khusus membayar Sora dapat membuat klip berdurasi hingga 20 detik dan mengakses resolusi 1080p yang lebih tinggi. Untuk pelanggan Plus, Anda mendapatkan klip berdurasi 5 detik, dan kualitas hingga 720p.
Yang harus Anda lakukan adalah memasukkan perintah Anda ke dalam kotak teks, dan beberapa detik kemudian Anda memiliki klip video, tentang cara kerja Midjourney atau generator gambar AI lainnya dari sudut pandang pengguna.
Bahkan Klip Pendek pun Sangat Hit-and-Miss
Salah satu alasan utama pengalaman Sora “penuh” dibatasi hingga 20 detik adalah karena masih ada masalah signifikan dengan teknologi ini dalam hal koherensi. Semakin lama video berlangsung, semakin banyak kesalahan dan hal-hal aneh yang terjadi.
Selain masalah itu, sulit memvisualisasikan apa yang saya masukkan ke dalam perintah saya. Misalnya, saya meminta klip kapal luar angkasa yang sedang melengkung, yang merupakan kiasan fiksi ilmiah yang cukup umum.
Ya, itulah yang ada dalam pikiran saya, tapi saya tidak akan memasukkannya ke dalam video kepala bicara YouTube saya yang setengah matang.
Di lain waktu, ini cukup tepat. Seperti saat saya meminta logo HTG chrome berputar.
Masalah terakhir yang dialami Sora saat ini adalah dengan fisika apa pun. Saya telah melihat banyak video yang menampilkan hewan-hewan yang tidak bergerak dengan cara yang dapat dipercaya, dan ketika saya meminta sesuatu yang sederhana—sebuah bantalan bola yang berjalan di atas rel, saya mendapatkan video yang aneh ini.
Meskipun video secara visual sempurna, biasanya gerakanlah yang memberikannya sebagai klip yang dihasilkan AI.
Sora Merasa Jauh Lebih Dewasa Dibandingkan Image Generation
Saya tidak ingin menciptakan kesan bahwa Sora tidak mengesankan. Ini merupakan pencapaian besar, namun penggunaannya terasa seperti masa-masa awal pembuatan gambar. Hal ini tidak akan terlihat jelas jika bukan karena pengumuman Veo 2 yang dilakukan Google pada waktu yang tepat.
Video dari sistem tersebut terlihat jauh lebih baik daripada Sora, terutama dalam hal fisika objek bergerak yang terlihat benar.
Lihat saja kompilasi resmi dari Google ini.
Meskipun orang mungkin berpendapat bahwa ini adalah pilihan yang tepat, beberapa YouTuber telah memiliki akses ke Veo 2, dan tampaknya Veo 2 menjadi yang teratas dengan selisih yang cukup besar.
Untuk Saat Ini, Ini Hanya Mainan yang Menyenangkan
Bermain-main dengan Sora sebentar berkat langganan yang sudah saya miliki memang menyenangkan, tapi tentu saja saya tidak ingin membayar biaya $200 per bulan untuk produk ini dalam kondisi saat ini. Anda akan lebih baik hanya berlangganan layanan video stok.
Melihat apa yang telah dibuat oleh Google, dan mengingat ada pesaing lain di bidang ini seperti HeyGen dan Runway ML, saya berharap pembaruan dan peningkatan akan dilakukan dengan cepat dan sering. Tidak ada alasan lain selain OpenAI yang tiada henti dalam peningkatan ChatGPT.
Saya masih melihat masa depan jangka menengah di mana generasi video AI akan mampu melakukan lebih banyak hal, dan bahkan memungkinkan konten berdurasi lebih panjang dihasilkan dengan kepatuhan yang tepat, dan kemampuan untuk mengedit elemen dalam sebuah adegan. Namun, hari itu mungkin masih beberapa tahun lagi, dan untuk saat ini merupakan keingintahuan yang menarik namun tidak praktis.