La vera forza di Gemini Omni risiede nell’integrazione nativa dei modelli (testo, video, audio, fisica del mondo) e, soprattutto, nella sua capacità di eseguire editing video multimodale e incrementale.
A differenza dei modelli precedenti (come Veo), Omni non richiede che tu descriva ogni singolo fotogramma in modo prescrittivo. Al contrario, si affida alla sua comprensione del mondo e permette di modificare video esistenti o generazioni precedenti tramite step successivi (“conversational video editing”), mantenendo la coerenza temporale. Eccelle inoltre nella gestione della fisica complessa (fluidodinamica, gravità, interazioni dei materiali) e nell’integrazione di testo e audio nativo e sincronizzato.
Per metterlo davvero alla prova e testarne i limiti, ti suggerisco una serie di prompt divisi per tipologia di test.
Coerenza e modifiche.
Sopra il prompt era:
Qui la modifica: “Mantieni tutto esattamente identico (stesso signore, stessa luce, stesso movimento), ma aggiungi un effetto scia luminoso e animato in stile neon viola che esce dalle ruote dello skateboard durante il salto. Non alterare lo sfondo.”
Fisica e materiali.
Google Omni vanta un motore fisico notevolmente migliorato rispetto al passato. In questo video vediamo come il modello “capisce” come reagiscono i materiali. Questo il prompt: “Un video esplicativo educativo in stile stop-motion con oggetti fatti interamente di argilla e pongo. Mostra la simulazione del ripiegamento di una proteina (protein folding) che si muove in modo fluido ma scattante su un tavolo scuro, senza mani umane visibili. Movimenti fisici accurati e stile plastilina tattile.”
Orientamento della telecamera e materia. Una delle demo più sottolineate da DeepMind mostra la trasformazione della materia quando tocca una superficie. Puoi testarlo con video reali girati da te o su clip generate. Questo il prompt: “Quando la persona tocca lo specchio con la mano, fai in modo che la superficie del vetro si increspi magnificamente come se fosse liquido, e il braccio della persona si trasformi progressivamente in un materiale metallico riflettente. Mantieni il resto della stanza stabile.”
Qui sotto una variazione sul tema
Integrazione audio e testo.: Usa questo logo e poi parola per parola, una parola sullo schermo alla volta: Info Data, ogni giorno, dati, notizie e Ai . Ogni parola appare con uno stile di animazione diverso, ritmo perfetto, sizzle reel.
Qui sotto lo stesso video ma sincronizzato a tempo di rock
E infine, scienza, divulgazione e apprendimento. Google sta spingendo moltissimo per rendere la sua Ai uno strumento per le scuole. Ecco come se la cava negli “spiegoni”. Il prompt? Spiega la differenza tra informatica tradizionale e informatica quantistica. Visualizza questa frase utilizzando uno stile flat-media contemporaneo che fonde forme vettoriali minimaliste con ricche texture organiche. L’estetica è definita da una palette di colori “elettrica” ad alto contrasto, con rosa neon, ciano e verde lime su uno sfondo blu scuro. Un segno distintivo di questo stile è l’uso di ombreggiature a puntini e gradienti granulosi, che aggiungono una qualità tattile, simile alla risografia, alle forme geometriche altrimenti semplici. Combinando bordi netti con queste transizioni ammorbidite e punteggiate, l’illustrazione acquisisce un’atmosfera giocosa e editoriale.
Per approfondire.
Google I/O: In cinque annunci e dieci video tutto quello che è successo
Nano banana 2 vs ChatGpt Image 2.0: la sfida in cinque prompt (più uno)
Search Live è disponibile in Italia, cosa cambia in cinque punti
Google Earth diventa il “sistema operativo” del mondo: 5 punti per capire la svolta
Cosa sono Ask Maps e Immersive Navigation?
Tutto quello che c’è da sapere su Gemini 3.1 Flash-Lite
Tutto quello che c’è da sapere su Gemini 3.1 Pro
Ecco Lyria 3: Google con Gemini porta la musica generativa negli smartphone
Gemini 3 Deep Think si aggiorna: più ragionamento, più scienza, accesso selettivo in cinque punti
Google collega Gemini con foto e mail per creare un assistente davvero personale
Tutto quello che c’è da sapere su Nano Banana Pro in cinque punti
ChatGPT dichiara codice rosso: nasce GPT-5.2, anche per rispondere a Gemini 3
Buon compleanno ChatGPT. Tre candeline e tre grafici
Tono, personalizzazione e “umanità”: come è cambiato ChatGPT?
Nuove regole per ChatGPT: cosa cambia davvero per gli utenti in cinque punti
Tutto quello che c’è da sapere su Atlas il nuovo browser potenziato con l’Ai di OpenAi
Cosa c’è da sapere sul Dev Day 2025 di OpenAI
I cameo, il deepfake consensuale e quello che dobbiamo sapere dell’app Sora di OpenAI
Nasce ChatGPT Pulse, il “buongiorno” firmato OpenAI. In cinque punti
Perché tutti parlano di Codex di OpenAi?
ChatGpt-5, breve guida al prompting. Cosa c’è da sapere?
Tre prompt per mettere alla prova Gpt 5. Il confronto co ChatGpt 4o, Gemini e Claude.
GPT-5 è tra noi. Cosa cambia? In cinque punti, quattro video e qualche grafico
Aspettando ChatGpt5 OpenAI lancia modelli “open-weight” per fronteggiare DeepSeek e Meta
ChatGpt, OpenAI lancia la modalità studio per studenti
Arriva ChatGpt agent anche in Europa. Cosa sa fare? In cinque punti
Cosa è OpenAi Codex? #DatavizAndTools
Come funziona Operator l’Ai agent di OpenAi?
Cos’è Operator e come funziona l’Ai agent di OpenAi?
Tra qualche mese uscirà il prossimo Gpt-5 che integrerà o3 il modello di ragionamento più avanzato
ChatGpt su WhatsApp ascolta i vocali e legge le immagini #DatavizAndTools
Sam Altman dalla “parte sbagliata della storia”
OpenAi aggiorna Canvas. Ecco cosa cambia con o1
Come funziona Operator di OpenAi? #DatavizAndTools
ChatGpt Task è una to-do-list per le tue attività quotidiane
Come funziona Canvas la nuova interfaccia per ChatGpt? #DatavizAndTools
Ecco come funziona o1, il modello di OpenAi che “pensa” prima di rispondere
Disponibile ChatGpt per Windows. Ecco cosa cambia #DatavizAndTools
L’informazione, i giornali, i viaggi e il senso della vita. La prova di SearchGpt
SearchGpt sta arrivando. OpenAi sfida Google sui motori di ricerca. Ecco cosa sappiamo finora
Che fine ha fatto SearchGpt, il motore di ricerca di OpenAi?
Cosa è AI Overview? Ecco come sta cambiando il motore di ricerca di Google con Gemini
Cosa è WildChat? Più di un milione di prompt (e risposte) per allenare il vostro chatbot
Come si scrive un prompt per Midjourney?
L’Ai Gen si è convertita all’ideologia “woke”? #PromptAnalysis
Quali caratteristiche deve avere un cantante per vincere Sanremo? Risponde Gpt4