GPT-5 è tra noi. Cosa cambia? In cinque punti, quattro video e qualche grafico

A poco più di due anni e mezzo dal lancio di ChatGPT, OpenAI presenta GPT-5, il modello più evoluto mai rilasciato finora. Disponibile da oggi anche per gli utenti gratuiti, GPT-5 rappresenta secondo Sam Altman, CEO di OpenAI, «un passo importante verso l’intelligenza artificiale generale (AGI)». È più veloce, più intelligente, più preciso e — soprattutto — capace di ragionare meglio. A detta dello stesso Altman, «tornare a GPT-4 dopo aver provato GPT-5 sarà frustrante». Ma che cosa cambia davvero? E quanto siamo vicini all’AGI? Ecco GPT-5 in cinque punti.

Un solo sistema, più intelligenze

GPT‑5 è un sistema unificato che combina diversi livelli di intelligenza: risposte rapide per task semplici, ragionamento profondo per problemi complessi (“GPT-5 thinking”) e un router in tempo reale che decide quale modalità attivare in base al contesto. A differenza dei modelli precedenti, è in grado di adattarsi dinamicamente senza che l’utente debba scegliere manualmente il tipo di modello. Inoltre, integra miglioramenti nella capacità di seguire istruzioni e usare strumenti in modo agentico, rendendolo più autonomo nei compiti a più fasi.

Il miglior modello per la programmazione?

OpenAI definisce GPT‑5 il suo miglior modello di coding di sempre. Sa generare interfacce complesse, scrivere codice ben formattato e anche debuggare repository estesi. È in grado di creare in pochi secondi siti web e app responsive con sensibilità estetica: spaziatura, font e layout sono generati con gusto. Con un solo prompt, può trasformare un’idea grezza in un’applicazione funzionante: è il cosiddetto vibe coding, ovvero software on demand. I benchmark lo confermano: 74,9% su SWE-bench Verified e 88% su Aider Polyglot.

Meno errori, meno bugie, più trasparenza

GPT-5 riduce del 45% le allucinazioni rispetto a GPT-4o, e fino all’80% rispetto al modello o3 quando attiva la modalità “thinking”. Sa riconoscere quando non ha informazioni sufficienti per rispondere, evitando di inventare risposte. In test condotti su prompt impossibili, il tasso di risposte ingannevoli è sceso dal 4,8% al 2,1%. È anche meno servile: risponde con maggiore onestà e non cerca di compiacere l’utente a tutti i costi, grazie a una formazione mirata per ridurre la sycophancy.

Cosa dicono gli altri benchmark?

I modelli oggi sono valutati da benchmark che misurano la loro capacità di ragionamento e le prestazioni in campi come la programmazione e la matematica. E dalle caratteristiche agentiche che hanno, cioè dalla loro capacità di orchestrare funzioni in modo autonomo. Sappiamo che non c’è modo di verificare i test che valutano l’intelligenza del modello. Come per gli altri, dobbiamo fidarci di quello che dicono i costruttori. GPT-5, scrive OpenAi, è molto più intelligente su tutta la linea, come dimostrano le sue prestazioni nei benchmark accademici e con valutazione umana, in particolare in matematica, programmazione, percezione visiva e salute. Stabilisce un nuovo stato dell’arte in matematica (94,6% su AIME 2025 senza strumenti), nella programmazione reale (74,9% su SWE-bench Verified, 88% su Aider Polyglot), nella comprensione multimodale (84,2% su MMMU) e nel settore della salute (46,2% su HealthBench Hard) e questi miglioramenti si notano nell’uso quotidiano. Grazie al ragionamento esteso della versione Pro di GPT-5, il modello stabilisce un nuovo stato dell’arte anche su GPQA, ottenendo un punteggio dell’88,4% senza strumenti.

Le nuove funzionalità pensate per gli sviluppatori:

Chiamata di funzioni in formato libero → invia stringhe grezze (SQL, comandi shell, file di configurazione) direttamente ai tool, senza bisogno di incapsulamento in JSON.. Controllo della verbosità → è possibile scegliere quanto dettagliate debbano essere le risposte. Controllo dello sforzo di ragionamento → passa da risposte rapide e dirette (“minimali”) a un ragionamento più approfondito. Finestra di contesto di 256.000 token, rispetto ai 200.000 della versione o3. (Chi ha bisogno di una finestra di contesto da 1 milione di token può continuare a usare GPT-4.1, che OpenAI continuerà a supportare.) Affidabilità e stile: Meno allucinazioni, risposte più accurate e più fluide, con intelligenza emotiva. Disponibilità: Tre versioni API — gpt-5, gpt-5-mini e gpt-5-nano — per diverse esigenze di latenza/costi. Costi: Prezzi standard (più economico di GPT-4o) Input: $1,25 per ogni milione di token in input, con uno sconto del 90% per la cache. Output: $10 per ogni milione di token in output