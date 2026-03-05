Porta a termine i compiti più velocemente e, soprattutto, utilizzando meno token: Google presenta Gemini 3.1 Flash-Lite, il suo modello pensato per gli sviluppatori. Annunciato martedì 3 ottobre, per il momento è disponibile in preview atraverso le Api di Gemini in Google AI Studio e per le imprese attraverso Vertex AI.

Sul fronte dei costi, il nuovo modello di Big G ha un prezzo di 25 centesimi di dollaro per milione di token in input e 1,5 dollari per milione di token in output. Tra i competitor, solo Grok 4.1 Fast fa meglio, con costi rispettivamente di 20 e 50 centesimi. Mentre GPT-5 mini ugugaglia i costi di Gemini 3.1 Flash-Lite in input, ma ha un costo di 2 dollari per milione di token in output. Claude 4.5 Haiku è invece il più caro, con un costo rispettivamente di 1 e 5 dollari.

E poi c’è la velocità. Il Time to first answer token, ovvero il tempo di latenza tra il prompt e l’inizio dell’elaborazione da parte del modello è due volte e mezza più veloce rispetto a Gemini 2.5 Flash. Mentre la velocità di output è superiore del 45%. La stessa Big G cita Artificial Analysis, azienda che si occupa di confrontare le prestazioni degli LLM, come fonte di queste informazioni.

L’idea è che questo modello possa essere utilizzato per gestire compiti come la moderazione di contenuti o la traduzione di grandi volumi di testo, tutte attività che comportano un importante carico di lavoro. Ma può anche utilizzare le proprie capacità di ragionamento per dare vita a interfaccia utente o dashboard. Come detto, attualmente il modello è solo in fase di preview e il post con cui Google ha annunciato il suo arrivo non specifica quando verrà aperto a tutti gli sviluppatori.

