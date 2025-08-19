Nell’infografica realizzata da Visual Capitalist sono presenti i siti più citati dai modelli di intelligenza artificiale. L’analisi non si limita alle curiosità ma illustra bene come si sta stabilizzando l’ecosistema informativo nell’era dell’Ai dove poche voci contano davvero. Vediamo chi c’è in cima, da chi si informa ChatGpt quando risponde alle nostre domande.

Le fonti più “frequentate” dai modelli IA:

L’analisi è di Semrush condotta a giugno di quest’anno, si basa su oltre 150.000 citazioni LLM. Sul podio troviamo Reddit (bacheca online in lingua inglese tra le più note nel mondo), Wikipedia (naturalmente) ma anche YouTube, Google e Yelp.

Il dominio di Reddit e Wikipedia è legato al fatto che a differenza dei giornali e di grandi editori che hanno bloccato l’accesso dei chatbot ai propri siti questi luoghi sono aperti e liberi e quindi sono oggetto primario di consultazione. Il resto della top 5 (probabilmente YouTube, Google, Yelp) suggerisce che i modelli attingono anche da multimedia, indicazioni geografiche e recensioni. Mapbox.com e openstreetmap.org, due piattaforme per la creazione di mappe interattive personalizzate, sono entrate nella top 10. Da rilevare anche che l’accordo di Google con Reddit sull’intelligenza artificiale ha sicuramente influenzato la sua posizione e la visibilità di Reddit probabilmente continuerà con una maggiore adozione della modalità AI. Il web non è una cattedrale, ma un bazar, e i modelli di Ai girano fra banchi rumorosi, raccogliendo citazioni a casaccio — eppure, efficaci.

Come si vede bene i domini che si posizionano bene nei primi 10 risultati organici di Google hanno molte più probabilità di essere citati nelle risposte generate dall’intelligenza artificiale. La relazione è risultata coerente in tutti gli Llm esaminati.

I ricercatori osservano anche che la forte correlazione con i domini che si posizionano bene nei risultati organici di Google, non vuole dire automaticamente la citazione degli stessi URL che vedi nella top 10. Al contrario, gli Llm spesso attingono da pagine diverse all’interno degli stessi domini attendibili. Ecco perché riscontriamo un’elevata correlazione a livello di dominio, ma una sovrapposizione meno diretta a livello di URL.

Resta una domanda: questi numeri riflettono affidabilità o semplicemente visibilità? Reddit, soprattutto su query di nicchia, offre esempi diretti, ma con rischi di distorsione. Wikipedia è accurata, ma standardizzata. I modelli non scelgono filosofia: scelgono densità, per un principio quasi darwiniano dell’“informazione più segnalata”. Se immaginiamo internet come un sistema solare, queste fonti sono i pianeti più massicci: attirano, riflettono e forniscono informazioni. L’informazione di qualità è altrove. Il motivo? Per sopravvivere economicamente non può essere intermediata da un chabtot.

Quale è il rapporto tra LLM e motori di ricerca?

Lo studio di Semrush approfondisce anche il rapporto tra l’algoritmo di ricerca di Google e la consultazione delle fonti degli LLM. La domanda che si sono posti è: quanto AI Mode e altri LLM rispecchiano fedelmente la tradizionale classifica top 10 di Google? Per misurarlo, hanno preso ogni query e contato il numero di domini e URL sovrapposti tra ciascuna piattaforma e le prime 10 classifiche organiche di Google.

Si evince una rilevante sovrapposizione tra le prime 10 classifiche organiche di Google e le citazioni LLM, tale sovrapposizione era tutt’altro che assoluta e variava a seconda della piattaforma. Perplexity ha mostrato il più forte allineamento con la top 10 di Google, con oltre il 91% di sovrapposizione di dominio e l’82% di sovrapposizione di URL . Ciò suggerisce che Perplexity si è basato in larga misura sulla top 10 di Google nella scelta di cosa citare. ChatGPT ha registrato la sovrapposizione più debole con le prime 10 posizioni di Google, con la più bassa sovrapposizione di domini e URL

