Google ha annunciato Nano Banana Pro, un nuovo modello di generazione e modifica di immagini basato su Gemini 3 Pro, pensato per passare dalla creatività casalinga a flussi di lavoro professionali e aziendali. L’idea è offrire immagini di qualità “studio”, con testo, localizzazione, più controllo creativo e supporto multi-lingua e multi-scena. In cinque punti quello che c’è da sapere.
Qualità e controllo creativo potenziati
Nano Banana Pro consente di generare immagini fino a 4K/2K (o comunque risoluzioni elevate) con un controllo molto maggiore: angolazione della camera, luce, stile, composizione, ecc. In più: puoi caricare fino a 6 immagini di riferimento per mantenere coerenza visiva (ad esempio per campagne di branding).
Testo dentro le immagini + localizzazione
Una delle novità più enfatizzate: Nano Banana Pro migliora drasticamente la resa del testo incorporato nell’immagine (es. poster, mock-up, infografiche) con caratteri, formattazione, multilingua, traduzioni e localizzazione. Questo è utile soprattutto per contesti aziendali, marketing, globalizzazione.
Migliore “knowledge-grounding” e utilizzo del contesto reale
Il modello è in grado di utilizzare conoscenza del mondo reale (grazie al collegamento a Google Search) per generare diagrammi, infografiche, mappe o scene che richiedono accuratezza nei contenuti (non solo estetica). Ad esempio creare un’infografica che mostra “come fare il chaì all’elaichi” o indicare dati reali in un grafico.
Accessibilità e integrazione nei prodotti Google e partner
Nano Banana Pro è accessibile tramite l’app Gemini (selezionando il modello “Thinking”). Inoltre viene integrato in: Google Slides (“Beautify this slide”), Google Vids, NotebookLM, nonché nella piattaforma enterprise Vertex AI. Anche partner creativi come Adobe Firefly/Photoshop hanno integrato Nano Banana Pro.
Limiti e considerazioni etiche
Proviamo a riassumere: quali sono gli ambiti d’uso? Editing d’immagine, generazione di asset visivi per campagne, prototipi, infografiche aziendali, localizzazione, design grafico professionale. Quali sono i limit? Come tutti i modelli generativi, non è perfetto: ad esempio può commettere errori nel riconoscimento dettagliato o nella coerenza assoluta, specialmente in contesti molto complessi. (Un test ha mostrato che “un cucchiaio” può essere etichettato erroneamente come “foglie d’autunno”). Ci sono poi questioni riguardanti filtri di sicurezza, uso improprio, disinformazione. Un articolo critica la facilità con cui è possibile generare immagini controverse o fuorvianti.
Per approfondire.
Da Antigravity a Deep Think: come è cambiato Gemini?
Tutto quello che c’è da sapere su Gemini Enterprise in cinque punti e quattro video
Gemini Robotics-ER 1.5: e la “generalizzazione fisica” dell’intelligenza artificiale
Gemini 2.5 Flash Image: cosa cambia, come funziona e cosa lo distingue dagli altri modelli
Aspettando ChatGpt 5 ecco Gemini 2.5 Deep Think il modello più potente di Google
Google lancia Gemini CLI, un agente AI open-source per sviluppatori #DatavizAndTools
In cinque punti cosa è Canvas Gemini
Come attivare Gemini “with personalization”?
Gemini 2.0 Flash Thinking è accessibile a tutti
Titan è il un modello di Ai di Google che ricorda come gli esseri umani
Le novità di Google: da Project Astra a Veo, in sei video
Gemini sbarca su iPhone. Ecco cosa cambia #DatavizAndTools
Gemini Live parla in italiano. I limiti e le potenzialità #DatavizAndTools
Gemini entra in Google Maps. Ecco cosa cambia e qualche altra novità
Le novità dell’Ai Gen arrivano su Google Maps
Arrivano le nuove mappe super-dettagliate di Google
Ecco come funziona l’immersive View di Google Maps che ora arriva a Firenze e Venezia
Meno soste ai semafori e più attenzioni ai consumi energetici. Le novità di Google Maps
Come funziona Veo, la nuova Ai generativa dedicata ai video?