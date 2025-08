Google ha annunciato nei primi giorni di agosto 2025 il lancio ufficiale di Gemini 2.5 Deep Think, un mode avanzato di ragionamento disponibile nell’app Gemini per gli abbonati al piano Google AI Ultra, che costa circa 250 dollari/mese. Si tratta della versione potenziata di Gemini 2.5 Pro, arricchita da un’architettura multi-agente in grado di esplorare simultaneamente diverse idee e arrivare a soluzioni più articolate e accurate. Diciamo che anticipa ChatGPt 5. Vi spieghiamo in cinque punti come è fatto e perché è interessante.

Cosa è i parallel thinking?

Deep Think adotta tecniche di parallel thinking e reinforcement learning, generando più ipotesi simultanee e combinandole per offrire risposte ottimizzate. Estende il tempo di inferenza rispetto alle versioni standard per produrre soluzioni più creative e approfondite

Quanto è intelligente? Cosa dicono i benchmark?

Sappiamo che non c’è modo di verificare i test che valutano l’intelligenza del modello. Come per gli altri dobbiamo fidarci di quello che dicono i costruttori. Gemini 2.5 Deep Think ha ottenuto il punteggio più alto mai registrato su benchmark come LiveCodeBench v6 (87,6%), Humanity’s Last Exam (34,8%) e la IMO 2025, dove ha raggiunto il livello medaglia di bronzo con un notevole 60,7%. Gemini 2.5 Deep Think super OpenAI o3 e Grok 4 in tutti i benchmark. Sul versante matematico, supera persino il livello minimo richiesto per ottenere una medaglia alla IMO.

Solo su abbonamento AI Ultra

Deep Think è disponibile solo per abbonati a Google AI Ultra a 249,99 dollari/mese. Per attivarlo basta selezionare “Deep Think” nel menu del modello quando si usa Gemini 2.5 Pro nell’app o su web . Google valuta l’estensione ad altri utenti in base ai feedback e alla diffusione futura

Applicazioni ideali: da coding a ricerca scientifica

Il modello si distingue nei task complessi come: sviluppo iterativo di interfacce web, risoluzione di problemi scientifici o matematici articolati, e design di algoritmi ottimizzati. Offre risposte più precise in contesti dove serve un ragionamento a più fasi

Affidabilità e sicurezza integrate

Durante lo sviluppo, Deep Think è stato sottoposto a rigorose valutazioni di sicurezza. Sebbene mostri occasionali rifiuti anche a richieste legittime, l’output è risultatone più neutro e responsabile rispetto alla modalità Pro standard. Ha superato i controlli di contenuti e tono oggettivo previsti per modelli di frontiera

