C’è una startup californiana che va tenuta sicuramente d’occhio. Si chiama FutureHouse, ed è stata fondata nel 2023 come organizzazione non profit e sostenuta da Eric Schmidt, ex CEO di Google, FutureHouse con una missione ambiziosa: creare un vero e proprio “scienziato artificiale”, in grado di gestire l’intero ciclo della ricerca scientifica — dalla formulazione delle ipotesi alla scrittura degli articoli.
Ether0 è il suo ultimo progetto: il primo modello linguistico progettato specificamente per ragionare in ambito scientifico, in particolare nella progettazione di molecole simili a farmaci. Accetta domande in linguaggio naturale, ragiona in linguaggio naturale, e a differenza di altri modelli specializzati, esplicita il suo ragionamento in linguaggio naturale, aprendo uno spiraglio nella “scatola nera” dell’intelligenza artificiale.
ether0 non è stato addestrato su manuali o articoli accademici, ma ha “imparato” risolvendo quasi 600.000 domande di chimica tratte da dati sperimentali. L’impatto reale nei laboratori resta limitato, almeno per ora. “Questi modelli sono ancora vincolati dalla quantità di dati chimici disponibili online.” Si tratta appunto ancora un prototipo, ma è stato rilasciato in open source.
Un nuovo approccio al ragionamento artificiale
Gli LLM oggi conoscono molto bene la chimica, ma sono carenti nel lavorare effettivamente con le molecole. Hanno difficoltà a contare il numero di ossigeni in una molecola, propongono strutture ad anello non plausibili e non sono bravi a nominare le molecole. “Abbiamo pensato che, poiché i moderni LLM hanno così tanta conoscenza latente immagazzinata nei loro pesi sul funzionamento della chimica, una piccola quantità di apprendimento per rinforzo potrebbe essere in grado di migliorare rapidamente le loro prestazioni in compiti che implicano il lavoro con le molecole” spiegano gli autori.
Come funziona ether0
I ricercatori di FutureHouse sono partiti da un modello linguistico di base fornito dalla start-up francese Mistral AI, molto più piccolo rispetto ai colossi del settore — circa 25 volte meno di DeepSeek-R1, tanto da poter girare su un semplice laptop. Anziché addestrarlo con testi accademici, hanno trasformato i risultati di laboratorio di 45 articoli scientifici in 577.790 domande verificabili, includendo proprietà molecolari come solubilità e odore.
Il modello è stato poi istruito a “pensare ad alta voce”, analizzando catene di ragionamento errate generate da altri modelli, come appunto DeepSeek-R1. Sette versioni specializzate del modello hanno affrontato diversi sottoinsiemi delle domande, ricevendo premi per ogni risposta corretta. Alla fine, le catene di ragionamento di ciascuna versione sono state fuse in un unico modello generalista, appunto ether0.
Ether0 è stato dunque messo alla prova con un nuovo set di domande, completamente diverse da quelle usate per l’addestramento, superando quasi in ogni categoria modelli avanzati come GPT-4.1 e DeepSeek-R1. In alcuni casi ha raddoppiato l’accuratezza dei suoi concorrenti, e con un’efficienza sorprendente: per ottenere prestazioni simili, un modello convenzionale avrebbe richiesto 50 volte più dati.
Secondo gli ideatori, ether0 sarebbe riuscito a dedurre strutture molecolari non presenti nel suo set di addestramento.
I quattro agenti IA progettati da FutureHouse
La piattaforma FutureHouse lavora con quattro agenti AI, ciascuno progettato con una specializzazione scientifica ben definita. Crow è un agente versatile, ideale per l’uso via API, capace di cercare nella letteratura scientifica e fornire risposte sintetiche ma rigorose. Falcon è pensato per revisioni approfondite: può esplorare e sintetizzare una quantità di letteratura superiore a qualsiasi altro agente noto, accedendo anche a database specialistici come OpenTargets. Owl (precedentemente noto come HasAnyone) risponde a una domanda cruciale per ogni ricercatore: “Qualcuno ha già fatto X?”. Infine, Phoenix — ancora in fase sperimentale — rappresenta la versione applicativa di ChemCrow, un agente dotato di strumenti specializzati per assistere nella pianificazione di esperimenti chimici.
Che cos’altro sta facendo FutureHouse
Nel maggio 2025, la start-up ha annunciato di aver contribuito a proporre un potenziale trattamento per la degenerazione maculare secca legata all’età, una delle principali cause di cecità. I risultati sono attualmente pubblicati in pre-print. Il loro sistema unificato chiamato Robin è stato in grado di automatizzare i passaggi intellettuali chiave di un processo scientifico. Nello specifico è stato usato Robin per identificare il ripasudil, un inibitore della Rho-chinasi (ROCK) clinicamente utilizzato per il trattamento del glaucoma, come nuovo candidato terapeutico per la degenerazione maculare secca legata all’età (dAMD), una delle principali cause di cecità irreversibile in tutto il mondo.
Come funziona? Robin ha condotto un’ampia revisione della letteratura e ha ipotizzato che il potenziamento della fagocitosi dell’epitelio pigmentato retinico (RPE) potesse fornire un beneficio terapeutico per la dAMD. Robin ha quindi utilizzato un altro sistema al suo interno per valutare una serie di molecole candidate potenzialmente in grado di svolgere questo compito, e ne ha testate dieci in laboratorio. Infine, Robin ha poi analizzato i dati di questi esperimenti per scoprire che un inibitore aumentava la fagocitosi dell’RPE in coltura cellulare.
Robin ha poi proposto un esperimento di sequenziamento dell’RNA per determinare se questo inducesse cambiamenti nell’espressione genica che potessero spiegare l’aumento della fagocitosi delle cellule RPE. L’esperimento ha mostrato che l’inibitore sovraregolava ABCA1, una pompa di efflusso lipidico critica nelle cellule RPE.
E non è finita qui: utilizzando i dati del primo ciclo di test sui farmaci candidati, Robin ha proposto una seconda serie di farmaci candidati, scoprendo che c’era un nuovo farmaco di successo: il ripasudil, un farmaco già utilizzato in ambito oculare.
Tutte le ipotesi, le scelte sperimentali, le analisi dei dati e le figure principali del testo contenute nel manoscritto che descrive questo lavoro sono state generate autonomamente da Robin. I ricercatori umani hanno eseguito gli esperimenti fisici, ma la struttura concettuale è stata interamente guidata dall’intelligenza artificiale.