GPT-5.4, il modello che usa il computer: cinque cose che cambiano davvero

OpenAI ha presentato GPT-5.4, una nuova versione del suo modello di intelligenza artificiale progettata soprattutto per fare un passo avanti verso gli AI agent, cioè sistemi capaci non solo di rispondere alle domande ma di svolgere azioni concrete sui computer e sui servizi online. La novità principale è che il modello integra in modo nativo la capacità di usare software, siti web e strumenti digitali: in pratica può operare come un assistente che lavora dentro le applicazioni. L’aggiornamento punta quindi meno sulla conversazione e più sull’automazione di compiti complessi, con miglioramenti anche nel ragionamento, nel coding e nella gestione di documenti lunghi.

Ecco in cinque punti cosa cambia davvero rispetto alle versioni precedenti.

1. Un modello che può usare direttamente il computer
La novità più importante è la cosiddetta computer use: GPT-5.4 è il primo modello general purpose di OpenAI progettato per controllare un computer in modo nativo. Può scrivere codice che interagisce con programmi e siti web, usare librerie di automazione e perfino generare comandi di mouse e tastiera a partire da screenshot dello schermo. In sostanza non si limita a spiegare cosa fare: può eseguire le azioni necessarie dentro applicazioni e interfacce.

2. È pensato per costruire agenti autonomi
OpenAI presenta GPT-5.4 come il modello più adatto a sviluppare agenti AI, cioè software capaci di completare compiti complessi in più passaggi. Un agente può per esempio aprire un sito, cercare informazioni, compilare moduli o usare strumenti diversi per arrivare a un risultato finale. L’idea è che il modello non sia più solo un chatbot ma un motore operativo che esegue lavori su più sistemi digitali.

3. Migliora l’uso di strumenti e API
Un’altra differenza riguarda l’integrazione con strumenti esterni. GPT-5.4 è stato progettato per chiamare API e tool in modo più preciso ed efficiente durante un compito. Questo significa che può orchestrare diversi servizi — browser, database, software aziendali — per portare a termine una richiesta complessa senza interventi manuali continui.

4. È molto più forte nei lavori su documenti complessi
Il modello è stato ottimizzato anche per analizzare testi lunghi e strutturati, come contratti o documenti legali. Nei benchmark dedicati al lavoro giuridico e documentale ottiene punteggi molto alti, soprattutto nella capacità di mantenere accuratezza e struttura su testi lunghi e articolati. In pratica è pensato per applicazioni professionali dove la precisione è più importante della semplice conversazione.

5. Arriva anche una versione “Thinking” per il ragionamento avanzato
Accanto al modello base viene introdotta una variante chiamata GPT-5.4 Thinking, dedicata ai compiti che richiedono più ragionamento e pianificazione. È la parte della famiglia GPT-5 progettata per analizzare problemi complessi prima di rispondere, mantenendo anche nuove mitigazioni di sicurezza, ad esempio in ambiti come la cybersecurity.

Per approfondire.

Tutto quello che c’è da sapere su OpenAI Frontier

Nasce il vibe coding applicato alla scienza. Ecco Prism di OpenAI

In cinque punti ecco come funziona il modello di pubblicità di ChatGPT?

Codice rosso in casa OpenAi. GPT-5.2 vs Gemini 3: chi vincerà? #Ascanio

ChatGPT Images sfida Google: in cinque punti il duello tra GPT Image 1.5 e Nano Banana Pro

Buon compleanno ChatGPT. Tre candeline e tre grafici

ChatGPT dichiara codice rosso: nasce GPT-5.2, anche per rispondere a Gemini 3

Buon compleanno ChatGPT. Tre candeline e tre grafici

Tono, personalizzazione e “umanità”: come è cambiato ChatGPT?

Nuove regole per ChatGPT: cosa cambia davvero per gli utenti in cinque punti

Tutto quello che c’è da sapere su Atlas il nuovo browser potenziato con l’Ai di OpenAi