Google DeepMind ha svelato all’inizio di agosto Genie 3, l’evoluzione del suo modello per creare ambienti interattivi a partire da semplici prompt testuali. Questo tool può generare mondi 3D esplorabili in tempo reale, con una coerenza visiva sorprendente e una memoria… beh, fino a un minuto. Ecco cosa cambia davvero con questa nuova versione, lo spieghiamo in cinque punti.
Navigazione in tempo reale a 720p e 24 fps
Genie 3 alza l’asticella: da statico a dinamico. Genera ambienti 3D a 720p e 24 fotogrammi al secondo, navigabili live, una novità rispetto alle versioni precedenti
Coerenza temporale e memoria visiva
Gli ambienti restano coerenti per qualche minuto, e Genie 3 ricorda ciò che hai lasciato invisibile per circa un minuto. Lo scenario mantiene i tuoi interventi — pitture, movimenti d’oggetti — anche fuori campo. Google riassume il tutto così: “Genie 3 è il nostro primo modello di mondo a consentire l’interazione in tempo reale, migliorando al contempo coerenza e realismo rispetto a Genie 2
Eventi generati via prompt
Non serve fermarsi per ri-generare l’ambiente: puoi modificare il mondo al volo. Cambiare tempo, aggiungere un oggetto o far succedere qualcosa di sorprendente: Genie 3 lo integra seamless
Addestramento per agenti
Questi scenari dinamici non sono solo per giocare. DeepMind li pensa come arene per addestrare agenti come SIMA, dove l’agente interagisce senza che Genie capisca i suoi obiettivi, ma mantiene coerenza sufficiente a compiere sequenze complesse. Un passo verso l’intelligenza generale (AGI).
I limiti — perché la magia ha i suoi confini
Come ha scritto la stampa specializzata esistono ancora dei limiti. Lo spazio d’azione diretto dell’agente per esempio è ancora limitato. La simulazione di agenti multipli e interazioni complesse è ancora traballante. La precisione geografica è approssimativa. E la durata interattiva si ferma a pochi minuti. E’ un inizio.
Per approfondire.
Ecco Genie di Google, il modello di Ai per creare videogiochi da una singola immagine
Come funziona Wham il modello di Ai di Microsoft che genera gameplay
Nasce Genie, il modello di Ai per creare videogiochi da una singola immagine
Come funziona Sima la nuova Ai di Google che completa i videogiochi al posto vostro
Come si producono (e si raccontano) i videogiochi? #PlayThinkTalk
Videogiochi diversamente progettati. Come è nato Promesa? #PlayThinkTalk
Nvidia lancia il nuovo assistente in-game per il videogioco. E potrebbe essere una rivoluzione
Videogiochi: gli Npc di Nvidia sono davvero diventati autonomi?
Le simulazioni di Doom e SuperMario realizzati dall’intelligenza artificiale “studiando” i gameplay
Chi è James? Ecco come si costruiscono gli umani digitali