OpenAI ha presentato GPT-5.4, una nuova versione del suo modello di intelligenza artificiale progettata soprattutto per fare un passo avanti verso gli AI agent, cioè sistemi capaci non solo di rispondere alle domande ma di svolgere azioni concrete sui computer e sui servizi online. La novità principale è che il modello integra in modo nativo la capacità di usare software, siti web e strumenti digitali: in pratica può operare come un assistente che lavora dentro le applicazioni. L’aggiornamento punta quindi meno sulla conversazione e più sull’automazione di compiti complessi, con miglioramenti anche nel ragionamento, nel coding e nella gestione di documenti lunghi.
Ecco in cinque punti cosa cambia davvero rispetto alle versioni precedenti.
1. Un modello che può usare direttamente il computer
La novità più importante è la cosiddetta computer use: GPT-5.4 è il primo modello general purpose di OpenAI progettato per controllare un computer in modo nativo. Può scrivere codice che interagisce con programmi e siti web, usare librerie di automazione e perfino generare comandi di mouse e tastiera a partire da screenshot dello schermo. In sostanza non si limita a spiegare cosa fare: può eseguire le azioni necessarie dentro applicazioni e interfacce.
2. È pensato per costruire agenti autonomi
OpenAI presenta GPT-5.4 come il modello più adatto a sviluppare agenti AI, cioè software capaci di completare compiti complessi in più passaggi. Un agente può per esempio aprire un sito, cercare informazioni, compilare moduli o usare strumenti diversi per arrivare a un risultato finale. L’idea è che il modello non sia più solo un chatbot ma un motore operativo che esegue lavori su più sistemi digitali.
3. Migliora l’uso di strumenti e API
Un’altra differenza riguarda l’integrazione con strumenti esterni. GPT-5.4 è stato progettato per chiamare API e tool in modo più preciso ed efficiente durante un compito. Questo significa che può orchestrare diversi servizi — browser, database, software aziendali — per portare a termine una richiesta complessa senza interventi manuali continui.
4. È molto più forte nei lavori su documenti complessi
Il modello è stato ottimizzato anche per analizzare testi lunghi e strutturati, come contratti o documenti legali. Nei benchmark dedicati al lavoro giuridico e documentale ottiene punteggi molto alti, soprattutto nella capacità di mantenere accuratezza e struttura su testi lunghi e articolati. In pratica è pensato per applicazioni professionali dove la precisione è più importante della semplice conversazione.
5. Arriva anche una versione “Thinking” per il ragionamento avanzato
Accanto al modello base viene introdotta una variante chiamata GPT-5.4 Thinking, dedicata ai compiti che richiedono più ragionamento e pianificazione. È la parte della famiglia GPT-5 progettata per analizzare problemi complessi prima di rispondere, mantenendo anche nuove mitigazioni di sicurezza, ad esempio in ambiti come la cybersecurity.
Per approfondire.
Tutto quello che c’è da sapere su OpenAI Frontier
Nasce il vibe coding applicato alla scienza. Ecco Prism di OpenAI
In cinque punti ecco come funziona il modello di pubblicità di ChatGPT?
Codice rosso in casa OpenAi. GPT-5.2 vs Gemini 3: chi vincerà? #Ascanio
ChatGPT Images sfida Google: in cinque punti il duello tra GPT Image 1.5 e Nano Banana Pro
Buon compleanno ChatGPT. Tre candeline e tre grafici
ChatGPT dichiara codice rosso: nasce GPT-5.2, anche per rispondere a Gemini 3
ChatGPT dichiara codice rosso: nasce GPT-5.2, anche per rispondere a Gemini 3
Buon compleanno ChatGPT. Tre candeline e tre grafici
Tono, personalizzazione e “umanità”: come è cambiato ChatGPT?
Nuove regole per ChatGPT: cosa cambia davvero per gli utenti in cinque punti
Tutto quello che c’è da sapere su Atlas il nuovo browser potenziato con l’Ai di OpenAi
Cosa c’è da sapere sul Dev Day 2025 di OpenAI
I cameo, il deepfake consensuale e quello che dobbiamo sapere dell’app Sora di OpenAI
Nasce ChatGPT Pulse, il “buongiorno” firmato OpenAI. In cinque punti
Perché tutti parlano di Codex di OpenAi?
ChatGpt-5, breve guida al prompting. Cosa c’è da sapere?
Tre prompt per mettere alla prova Gpt 5. Il confronto co ChatGpt 4o, Gemini e Claude.
GPT-5 è tra noi. Cosa cambia? In cinque punti, quattro video e qualche grafico
Aspettando ChatGpt5 OpenAI lancia modelli “open-weight” per fronteggiare DeepSeek e Meta
ChatGpt, OpenAI lancia la modalità studio per studenti
Arriva ChatGpt agent anche in Europa. Cosa sa fare? In cinque punti
Cosa è OpenAi Codex? #DatavizAndTools
Come funziona Operator l’Ai agent di OpenAi?
Cos’è Operator e come funziona l’Ai agent di OpenAi?
Tra qualche mese uscirà il prossimo Gpt-5 che integrerà o3 il modello di ragionamento più avanzato
ChatGpt su WhatsApp ascolta i vocali e legge le immagini #DatavizAndTools
Sam Altman dalla “parte sbagliata della storia”
OpenAi aggiorna Canvas. Ecco cosa cambia con o1
Come funziona Operator di OpenAi? #DatavizAndTools
ChatGpt Task è una to-do-list per le tue attività quotidiane
Come funziona Canvas la nuova interfaccia per ChatGpt? #DatavizAndTools
Ecco come funziona o1, il modello di OpenAi che “pensa” prima di rispondere
Disponibile ChatGpt per Windows. Ecco cosa cambia #DatavizAndTools
L’informazione, i giornali, i viaggi e il senso della vita. La prova di SearchGpt
SearchGpt sta arrivando. OpenAi sfida Google sui motori di ricerca. Ecco cosa sappiamo finora
Che fine ha fatto SearchGpt, il motore di ricerca di OpenAi?
Cosa è AI Overview? Ecco come sta cambiando il motore di ricerca di Google con Gemini
Cosa è WildChat? Più di un milione di prompt (e risposte) per allenare il vostro chatbot
Come si scrive un prompt per Midjourney?
L’Ai Gen si è convertita all’ideologia “woke”? #PromptAnalysis
Quali caratteristiche deve avere un cantante per vincere Sanremo? Risponde Gpt4