Google annuncia Gemini 3 come “il (loro) modello più intelligente di sempre” e, questa volta, lo lancia subito ovunque: nella Ricerca, nell’app Gemini, negli strumenti per sviluppatori e in una nuova piattaforma agentica, Google Antigravity. A due anni dall’inizio dell’era Gemini, l’azienda rivendica numeri di scala enormi (2 miliardi di utenti al mese per AI Overviews, 650 milioni sull’app, 13 milioni di sviluppatori) e posiziona Gemini 3 come un passo in più verso l’AGI, con più ragionamento, più multimodalità e agenti software più autonomi. Qui sul Sole 24 Ore.com vi spiego quello che lo rende diverso. E qui le 10 cose da sapere.
Gemini 3 come tappa verso l’AGI
Google presenta Gemini 3 esplicitamente come “un altro grande passo sulla strada verso l’AGI”.
È descritto come il miglior modello al mondo per comprensione multimodale e ragionamento, capace di cogliere “profondità e sfumature”, leggere contesto e intento e persino “leggere la stanza”: non solo testo e immagini, ma tono della richiesta, ambiguità, sottointesi.
Numeri di adozione: l’era Gemini è già di massa
AI Overviews: 2 miliardi di utenti al mese.
App Gemini: 650 milioni di utenti mensili.
Oltre il 70% dei clienti Cloud usa l’AI di Google.
13 milioni di sviluppatori hanno già costruito con i modelli generativi.
L’idea è: Gemini 3 non è un esperimento di laboratorio, ma si innesta su un ecosistema già enorme.
Gemini 3 Pro alza l’asticella dei benchmark
La versione Pro del modello debutta con una serie di risultati che segnano un nuovo stato dell’arte nei test di ragionamento e multimodalità. Supera in modo netto la generazione 2.5 Pro, conquista la vetta di LMArena con un Elo di 1501 e mostra prestazioni di livello accademico avanzato in benchmark come Humanity’s Last Exam, GPQA Diamond e MathArena Apex. Anche sul fronte multimodale i progressi sono evidenti: punteggi record su MMMU-Pro e Video-MMMU e miglioramento dell’accuratezza fattuale su SimpleQA Verified. In altre parole, un modello costruito per affrontare problemi complessi con maggiore affidabilità.
Deep Think, la modalità che spinge sul ragionamento esteso
Accanto al modello principale arriva Deep Think, una variante che approfondisce ulteriormente le capacità di analisi e risoluzione dei problemi. Nei test interni ottiene risultati superiori persino a Gemini 3 Pro, inclusi punteggi senza precedenti su ARC-AGI-2, uno dei benchmark più impegnativi per la capacità di generalizzazione. La distribuzione sarà graduale, partendo dai tester di sicurezza e successivamente dagli abbonati alla fascia Ultra.
Multimodalità di nuova generazione e contesto gigantesco
Gemini 3 è progettato per lavorare senza soluzione di continuità tra testo, immagini, video, audio e codice, sostenuto da una finestra di contesto che arriva a un milione di token. È un approccio che amplia notevolmente il tipo di compiti che il modello può affrontare: dalla decodifica di ricette scritte a mano alla generazione di materiali didattici interattivi, fino all’analisi video per sport e attività motorie. Google punta su un’IA che assorbe informazioni eterogenee e produce risposte più ricche e personalizzate.
Gemini 3 entra pervasivamente nei prodotti Google
Il rollout è immediato e su larga scala. La Ricerca integra Gemini 3 nella nuova AI Mode, con layout dinamici, visualizzazioni generate al volo e strumenti interattivi modellati sulla query dell’utente. L’app Gemini adotta il modello come motore principale dell’esperienza quotidiana, mentre sviluppatori e imprese possono accedervi tramite AI Studio, Vertex AI e Gemini CLI. La strategia punta a un’adozione capillare, con presenza anche su piattaforme di terze parti come Cursor, GitHub, JetBrains, Manus e Replit.
Antigravity porta gli agenti software dentro l’IDE
Google presenta anche Antigravity, la nuova piattaforma agentica che trasforma l’IDE in un ambiente in cui gli agenti hanno accesso diretto a editor, terminale e browser. L’obiettivo è automatizzare fasi intere dello sviluppo software, dall’analisi alla scrittura del codice, includendo validazione e iterazione. Antigravity sfrutta le capacità agentiche e di uso degli strumenti di Gemini 3 insieme ai modelli per il controllo del browser e l’editing delle immagini, aprendo la porta a una programmazione più orientata agli obiettivi che ai singoli comandi.
Agenti più autonomi anche per le attività di tutti i giorni
Le capacità agentiche non si limitano al codice. Nei test di pianificazione prolungata, come quelli di Vending-Bench 2, Gemini 3 mostra un uso coerente degli strumenti su orizzonti di lungo periodo e produce risultati più stabili. Google immagina agenti in grado di gestire task complessi per conto dell’utente — dalla prenotazione di servizi all’organizzazione della posta — mantenendo un controllo umano costante. Le prime funzioni arrivano già oggi per gli abbonati AI Ultra tramite Gemini Agent.
Verso un’interazione più naturale, meno gestione del prompt
Google sostiene che Gemini 3 richieda meno sollecitazioni, grazie a una comprensione più profonda dell’intento e del contesto. Le risposte sono pensate per essere più dense, dirette e meno compiacenti, per avvicinare l’esperienza a quella di un vero partner cognitivo. Il filo conduttore del lancio è chiaro: un’IA più personale, più autonoma e più utile, in grado di ridurre la frizione nell’interazione e aumentare il valore delle attività quotidiane e professionali.
Per approfondire.
Tutto quello che c’è da sapere su Gemini Enterprise in cinque punti e quattro video
Gemini Robotics-ER 1.5: e la “generalizzazione fisica” dell’intelligenza artificiale
Gemini 2.5 Flash Image: cosa cambia, come funziona e cosa lo distingue dagli altri modelli
Aspettando ChatGpt 5 ecco Gemini 2.5 Deep Think il modello più potente di Google
Google lancia Gemini CLI, un agente AI open-source per sviluppatori #DatavizAndTools
In cinque punti cosa è Canvas Gemini
Come attivare Gemini “with personalization”?
Gemini 2.0 Flash Thinking è accessibile a tutti
Titan è il un modello di Ai di Google che ricorda come gli esseri umani
Le novità di Google: da Project Astra a Veo, in sei video
Gemini sbarca su iPhone. Ecco cosa cambia #DatavizAndTools
Gemini Live parla in italiano. I limiti e le potenzialità #DatavizAndTools
Gemini entra in Google Maps. Ecco cosa cambia e qualche altra novità
Le novità dell’Ai Gen arrivano su Google Maps
Arrivano le nuove mappe super-dettagliate di Google
Ecco come funziona l’immersive View di Google Maps che ora arriva a Firenze e Venezia
Meno soste ai semafori e più attenzioni ai consumi energetici. Le novità di Google Maps
Come funziona Veo, la nuova Ai generativa dedicata ai video?