
Microsoft mendemonstrasikan model whamm barunya dengan versi generatif real-time Gempa II. Anda dapat memainkan game yang dihasilkan AI di browser Anda, meskipun itu benar-benar hanya bukti konsep-itu tidak terlalu menyenangkan.
Game generatif real-time akan menghancurkan atau mengangkat industri game, tergantung pada siapa yang Anda minta. Bagaimanapun, pengembangan model game generatif semakin cepat. Para peneliti telah menemukan cara berlari Malapetaka Dalam model pembelajaran saraf gamengen Google, Oasis AI memungkinkan Anda memainkan versi generatif gila dari Minecraft Di browser, dan pada bulan Februari 2025, Microsoft memperkenalkan sistem permainan generatif Wham yang unik.
Model WHAM-1.6B yang dipamerkan Microsoft enam minggu lalu sangat mengesankan tetapi tidak praktis. Ini menghasilkan satu bingkai per detik pada resolusi 300 x 180, dan membutuhkan data pelatihan selama tujuh tahun untuk membuat game “dapat dimainkan”. Microsoft mulai bekerja pada WHAMM yang ditingkatkan (model World Human Action Maskgit) tak lama setelah memulai debutnya WHAM-1.6B, dan hasilnya agak mengejutkan. Whamm tidak hanya bekerja pada resolusi video 600 x 340 (dua kali lipat dari WHAM-1.6b), tetapi juga menghasilkan gambar minimal 10 fps dan berhasil menyalin Quake II hanya dengan satu minggu data pelatihan.
Arsitektur yang disempurnakan bertanggung jawab atas perbaikan ini. Alih-alih menggunakan sistem “seperti LLM” autoregresif khas di mana model AI menghasilkan satu token pada satu waktu, pengaturan Maskgit Whamm dapat “menghasilkan semua token untuk gambar dalam generasi sebanyak yang kita inginkan.” Dengan kata lain, model baru ini menggunakan pemrosesan paralel untuk meningkatkan kecepatan output, kualitas gambar, dan akurasi prediktif.
Game yang dihasilkan oleh Whamm, dari sudut pandang praktis, tidak terlalu menyenangkan untuk dimainkan. Itu terlihat buram, noda, dan kerak, frame rate tidak ideal (meskipun tidak jauh berbeda dari apa yang dialami gamer pada tahun 1997), dan musuh dalam game praktis tidak dapat dikenali. Demo ini juga sangat lamban, meskipun Microsoft menyalahkan “latensi yang nyata” pada pemain webnya, daripada model itu sendiri.
Whamm juga menderita masalah “memori jangka pendek” yang kita lihat pada model game generatif lainnya. Sebagai model prediktif, Whamm menghasilkan bingkai baru dengan melihat bingkai sebelumnya – buruk dalam melacak kesehatan dan amunisi, musuh mungkin hilang jika Anda memalingkan muka dari mereka (atau secara acak muncul tanpa alasan), dan jika Anda mendorong karakter Anda ke dinding atau menatap lantai, Anda mungkin teleportasi ke lokasi yang berbeda di peta.
Namun, dalam pengujian saya, WHAMM tampaknya memiliki lebih sedikit masalah “memori jangka pendek” daripada beberapa model lainnya. Panjang konteks 0,9 detiknya adalah hanya Cukup baik untuk mencegah kegilaan yang membengkokkan otak dan trippy yang saya alami ketika bermain dengan minecraft generatif, meskipun panjang konteks jelas merupakan tantangan besar yang perlu diatasi oleh Microsoft.
Saya juga harus mencatat bahwa Whamm hanya dilatih pada tingkat pertama Quake II. Jika Anda naik lift di ujung level, model membeku. Jadi, pernyataan Microsoft bahwa WHAMM dapat dilatih pada data video senilai satu minggu adalah semacam menyesatkan-model ini membutuhkan data pelatihan yang lebih sedikit daripada WHAM-1.6b, tetapi jumlah data yang diperlukan untuk menghasilkan permainan interaktif akan bervariasi berdasarkan panjang konten, kompleksitas permainan, dan faktor lainnya.

Terkait
6 perangkat yang tidak dapat menjalankan malapetaka
Mungkin Doom tidak bisa menjalankan semuanya.
Adapun bagaimana teknologi ini akan digunakan di masa depan-yah, Microsoft tahu bahwa AI generatif real-time dapat menghasilkan “jenis media interaktif baru,” tetapi masih mengeksplorasi apa yang seharusnya menjadi media itu.
Anda dapat memainkan versi real-time yang dihasilkan dari Quake II di situs web Copilot Labs. Game diatur waktunya dan akan diatur ulang saat timer habis. Sekali lagi, game ini hanyalah bukti konsep, jadi jangan berharap terlalu banyak darinya.
Sumber: Microsoft