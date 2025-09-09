NewsGuard ha monitorato per dodici mesi dieci tra i principali modelli di intelligenza artificiale generativa, mettendoli alla prova con centinaia di affermazioni false tratte dall’attualità. L’obiettivo: capire quanto spesso gli algoritmi confondano fatti e falsità.
Il confronto tra agosto 2024 e agosto 2025 racconta un dato netto: la percentuale di risposte che ripetono informazioni non vere è raddoppiata. Si passa dal 18% di un anno fa al 35% di oggi.
Per la prima volta sono stati resi noti i nomi dei sistemi testati. Anthropic Claude è il modello con il tasso più basso di errori (circa 10%), Google Gemini si ferma al 17%. Pi di Inflection invece supera il 57%, Perplexity il 46%. ChatGPT, Copilot e Le Chat di Mistral si collocano attorno al 35-40%.
Il quadro mostra un paradosso. I chatbot oggi rifiutano molto meno spesso di rispondere rispetto a un anno fa: il tasso di non risposta è crollato dal 31% a quasi zero. Ma la maggiore disinvoltura nel dare risposte si traduce in più errori, perché molte di queste risposte pescano da fonti non affidabili o inquinate da propaganda.
Questi strumenti sono sempre più centrali nell’informazione quotidiana: aiutano a cercare notizie, sintetizzare testi, fare fact-checking di base. Proprio per questo l’affidabilità è cruciale. Se un chatbot diffonde con sicurezza una notizia falsa su salute, politica o conflitti internazionali, l’effetto può essere dirompente.
L’audit di NewsGuard è un segnale: la promessa di chatbot più sicuri e precisi non è ancora stata mantenuta. Servono trasparenza sulle fonti, verifiche indipendenti e soprattutto un uso consapevole da parte di chi legge. L’intelligenza artificiale è un nuovo attore del sistema informativo: può essere una bussola, ma senza controlli rischia di diventare un’eco della disinformazione.
