Indica un intervallo di date:
  • Dal Al
cronaca

Come funziona Google Omni? La nostra prova in cinque video

La vera forza di Gemini Omni risiede nell’integrazione nativa dei modelli (testo, video, audio, fisica del mondo) e, soprattutto, nella sua capacità di eseguire editing video multimodale e incrementale.

A differenza dei modelli precedenti (come Veo), Omni non richiede che tu descriva ogni singolo fotogramma in modo prescrittivo. Al contrario, si affida alla sua comprensione del mondo e permette di modificare video esistenti o generazioni precedenti tramite step successivi (“conversational video editing”), mantenendo la coerenza temporale. Eccelle inoltre nella gestione della fisica complessa (fluidodinamica, gravità, interazioni dei materiali) e nell’integrazione di testo e audio nativo e sincronizzato.

Per metterlo davvero alla prova e testarne i limiti, ti suggerisco una serie di prompt divisi per tipologia di test.

Coerenza e modifiche. 

Una delle funzioni più interessanti è quella di modificare un contenuto esistente (o una clip appena generata) senza dover riscrivere tutto il prompt da zero.

Sopra il prompt era:

Qui la modifica: “Mantieni tutto esattamente identico (stesso signore, stessa luce, stesso movimento), ma aggiungi un effetto scia luminoso e animato in stile neon viola che esce dalle ruote dello skateboard durante il salto. Non alterare lo sfondo.”

 

Fisica e materiali.

 

Google Omni vanta un motore fisico notevolmente migliorato rispetto al passato. In questo video vediamo come il modello  “capisce” come reagiscono i materiali. Questo il prompt: “Un video esplicativo educativo in stile stop-motion con oggetti fatti interamente di argilla e pongo. Mostra la simulazione del ripiegamento di una proteina (protein folding) che si muove in modo fluido ma scattante su un tavolo scuro, senza mani umane visibili. Movimenti fisici accurati e stile plastilina tattile.”

 

Orientamento della telecamera e materia. Una delle demo più sottolineate da DeepMind mostra la trasformazione della materia quando tocca una superficie. Puoi testarlo con video reali girati da te o su clip generate. Questo il prompt: “Quando la persona tocca lo specchio con la mano, fai in modo che la superficie del vetro si increspi magnificamente come se fosse liquido, e il braccio della persona si trasformi progressivamente in un materiale metallico riflettente. Mantieni il resto della stanza stabile.”

Qui sotto una variazione sul tema

Integrazione audio e testo.:  Usa questo logo e poi parola per parola, una parola sullo schermo alla volta: Info Data, ogni giorno, dati, notizie e Ai . Ogni parola appare con uno stile di animazione diverso, ritmo perfetto, sizzle reel.

Qui sotto lo stesso video ma sincronizzato a tempo di rock

E infine, scienza, divulgazione e apprendimento. Google sta spingendo moltissimo per rendere la sua Ai uno strumento per le scuole. Ecco come se la cava negli “spiegoni”. Il prompt? Spiega la differenza tra informatica tradizionale e informatica quantistica. Visualizza questa frase utilizzando uno stile flat-media contemporaneo che fonde forme vettoriali minimaliste con ricche texture organiche. L’estetica è definita da una palette di colori “elettrica” ​​ad alto contrasto, con rosa neon, ciano e verde lime su uno sfondo blu scuro. Un segno distintivo di questo stile è l’uso di ombreggiature a puntini e gradienti granulosi, che aggiungono una qualità tattile, simile alla risografia, alle forme geometriche altrimenti semplici. Combinando bordi netti con queste transizioni ammorbidite e punteggiate, l’illustrazione acquisisce un’atmosfera giocosa e editoriale.

Per approfondire.

Google I/O: In cinque annunci e dieci video tutto quello che è successo

Nano banana 2 vs ChatGpt Image 2.0: la sfida in cinque prompt (più uno)

Con Lyria 3 Pro è possibile chiedere anche di strutturare la canzone, prevedendo intro, ritornello e bridge

Search Live è disponibile in Italia, cosa cambia in cinque punti

Google Earth diventa il “sistema operativo” del mondo: 5 punti per capire la svolta

Cosa sono Ask Maps e Immersive Navigation?

Tutto quello che c’è da sapere su Gemini 3.1 Flash-Lite

Tutto quello che c’è da sapere su Gemini 3.1 Pro

Ecco Lyria 3: Google con Gemini porta la musica generativa negli smartphone

Gemini 3 Deep Think si aggiorna: più ragionamento, più scienza, accesso selettivo in cinque punti

Google collega Gemini con foto e mail per creare un assistente davvero personale

Tutto quello che c’è da sapere su Nano Banana Pro in cinque punti

ChatGPT dichiara codice rosso: nasce GPT-5.2, anche per rispondere a Gemini 3

Buon compleanno ChatGPT. Tre candeline e tre grafici

Tono, personalizzazione e “umanità”: come è cambiato ChatGPT?

Nuove regole per ChatGPT: cosa cambia davvero per gli utenti in cinque punti

Tutto quello che c’è da sapere su Atlas il nuovo browser potenziato con l’Ai di OpenAi

Cosa c’è da sapere sul Dev Day 2025 di OpenAI

I cameo, il deepfake consensuale e quello che dobbiamo sapere dell’app Sora di OpenAI

Nasce ChatGPT Pulse, il “buongiorno” firmato OpenAI. In cinque punti

Perché tutti parlano di Codex di OpenAi?

ChatGpt-5, breve guida al prompting. Cosa c’è da sapere?

Tre prompt per mettere alla prova Gpt 5. Il confronto co ChatGpt 4o, Gemini e Claude.

GPT-5 è tra noi. Cosa cambia? In cinque punti, quattro video e qualche grafico

Aspettando ChatGpt5 OpenAI lancia modelli “open-weight” per fronteggiare DeepSeek e Meta

ChatGpt, OpenAI lancia la modalità studio per studenti