Arriva Claude Opus 4.8. Anthropic insiste sull'onesta del suo modello più potente

Anthropic aggiorna la famiglia Claude con Opus 4.8, una versione del modello pensata per attività lunghe, coding e gestione di agenti software. L’annuncio arriva insieme a nuove funzioni per controllare il livello di “sforzo” del modello e a un sistema di “dynamic workflows” che permette di coordinare più subagenti in parallelo. La società insiste soprattutto su un punto: ridurre le risposte formulate con sicurezza ma prive di basi verificabili. Ecco in cinque punti cosa abbiamo capito.

Claude Opus 4.8 punta sugli agenti

Con Opus 4.8 Anthropic rafforza la strategia già avviata con Claude Code: trasformare il modello da chatbot conversazionale a sistema capace di svolgere processi articolati. Il nuovo modello è pensato per workflow che richiedono pianificazione, memoria di contesto e coordinamento di strumenti esterni. Anthropic parla esplicitamente di “agentic workflows”, cioè sequenze operative in cui il modello può suddividere compiti, verificare risultati e continuare un lavoro per sessioni prolungate. Nel coding questo significa poter gestire migrazioni di codice, debugging e modifiche distribuite su repository molto grandi. Secondo Anthropic, Claude Code insieme a Opus 4.8 può operare su centinaia di migliaia di linee di codice mantenendo continuità tra le varie fasi del lavoro.

Cambia il modo in cui il modello “ragiona”

Una delle novità principali è il controllo dello sforzo computazionale. Gli utenti possono decidere quanto il modello debba approfondire un problema prima di rispondere. In pratica Anthropic introduce una regolazione del livello di reasoning: più analisi comporta tempi e costi maggiori, ma anche verifiche più estese. Questa impostazione era già comparsa nelle versioni precedenti, ma con Opus 4.8 viene resa più centrale sia nell’interfaccia Claude.ai sia nelle API. Il sistema serve soprattutto per attività tecniche come generazione di codice, revisione di documenti, analisi finanziarie o processi lunghi che richiedono controlli intermedi. Anthropic introduce anche una modalità “fast” con costi ridotti rispetto ai livelli di reasoning più elevati. L’obiettivo è permettere ai team di scegliere quando usare maggiore potenza di calcolo e quando privilegiare velocità e costo.

Anthropic insiste sul tema dell’onestà

L’elemento più evidenziato nella comunicazione di Anthropic riguarda la riduzione delle affermazioni non supportate. La società sostiene che Opus 4.8 sia meno incline a “inventare” informazioni o a ignorare errori nel codice generato. The Verge riporta che il modello sarebbe circa quattro volte meno propenso a trascurare bug rispetto alla versione precedente. Anthropic descrive questo approccio come un tentativo di rendere il modello più disposto ad ammettere incertezza. In pratica il sistema dovrebbe segnalare più spesso quando non possiede dati sufficienti o quando una risposta richiede verifica. È un tema rilevante soprattutto nei contesti professionali, dove la fiducia nell’output dipende dalla possibilità di distinguere tra informazioni verificate e inferenze del modello. La società collega questa scelta anche alla diffusione degli agenti AI: più un sistema può agire autonomamente, più diventa importante ridurre comportamenti che sembrano corretti ma producono errori operativi.

I “dynamic workflows” coordinano più subagenti

Viene introdotta in anteprima una funzione chiamata dynamic workflows. Il sistema consente al modello di distribuire un compito tra più subagenti che lavorano in parallelo e poi aggregano i risultati. L’idea è simile a quella già vista in altri strumenti agentici: invece di un singolo modello che affronta tutto il problema in sequenza, il task viene suddiviso in attività specializzate. Un subagente può controllare il codice, un altro cercare documentazione, un altro ancora verificare i risultati prodotti. Secondo Anthropic questo approccio serve soprattutto nei progetti lunghi, dove il limite non è la singola risposta ma la gestione della continuità operativa. I dynamic workflows sono quindi pensati più per team tecnici e imprese che per l’uso consumer del chatbot.

Dove Claude Opus 4.8 viene considerato più efficace

Anthropic presenta Opus 4.8 come un modello orientato a coding, documenti complessi e orchestrazione di strumenti. L’azienda cita benchmark legali e prestazioni elevate in task professionali che richiedono precisione e gestione di contesto lungo. Le aree in cui il modello viene descritto come più utile riguardano lo sviluppo software e la revisione di codice, la gestione di repository di grandi dimensioni, la produzione e l’analisi di documenti, le attività multi-step che richiedono memoria tra sessioni e l’automazione di workflow aziendali. Rispetto alle versioni precedenti, il cambiamento non riguarda tanto la conversazione quanto la capacità di sostenere lavori lunghi, verificare passaggi intermedi e coordinare strumenti esterni. In questo senso Opus 4.8 si inserisce nella trasformazione dei modelli linguistici in sistemi operativi per agenti software. Presto lo metteremo all’opera.

Per approfondire.

Come funziona Claude Design

Cosa è Claude Managed Agents di Anthropic?

Ora con Claude è possibile realizzare delle visualizzazioni interattive

Arriva Claude Code Security, l’AI che si occupa di cybersecurity

Anthropic, tutto quello che sappiamo di Claude Sonnet 4.6

Tutto quello che c’è da sapere di Claude Opus 4.6

L’intelligenza artificiale è arrivata su Marte

L’integrazione di Claude su Excel è disponibile anche per gli utenti Pro

Anthropic e OpenAI si sono sedute intorno a un tavolo per confrontare le proprie “coscienze”

Come funziona Claude Opus 4.5, il nuovo modello di Anthropic?

Abbiamo testato Claude Opus 4.5 per pesare il consenso di Luca Zaia in Veneto