Google ha lanciato un aggiornamento significativo alle sue capacità di generazione di immagini AI con il rilascio di Gemini 3 Pro Image, ampiamente noto come “Nano Banana Pro”. Questo nuovo modello, basato su Gemini 3, mira a risolvere i principali punti deboli delle immagini generate dall’intelligenza artificiale, in particolare la difficoltà nel creare testo leggibile, introducendo anche output a risoluzione più elevata e funzionalità avanzate di manipolazione delle immagini.
Funzionalità e accessibilità migliorate
L’aggiornamento si concentra su miglioramenti in tre aree principali: generazione di testo, gestione delle immagini di riferimento e risoluzione. Gli utenti possono ora generare immagini con testo più chiaro e accurato, una funzionalità che era problematica per i precedenti modelli di intelligenza artificiale. Gemini 3 Pro Image può utilizzare fino a 14 immagini di riferimento, consentendo composizioni più dettagliate e complesse. Infine, il modello supporta risoluzioni fino a 4K, offrendo immagini di qualità superiore.
L’aggiornamento è attualmente disponibile a livello globale all’interno dell’app Gemini. Per accedere al nuovo modello, seleziona “Crea immagini” (indicato da un 🍌 emoji) e passa all’opzione “Modello pensante” nella finestra di richiesta.
Costo e opzioni di accesso
While Nano Banana Pro is accessible for free, users will encounter generation limits more quickly than those with paid subscriptions. Gli abbonamenti a Google AI partono da $ 20 al mese. Una volta esauriti i crediti gratuiti il sistema ritorna al modello standard. Il modello è inoltre integrato nell’API Gemini, Google AI Studio e Flow.
Affrontare gli artefatti dell’immagine dell’IA
I generatori di immagini AI hanno storicamente difficoltà a riprodurre il testo in modo accurato, risultando in caratteri distorti o illeggibili. GPT-Image-1 di OpenAI ha fatto i primi progressi in quest’area, ma l’affidabilità è rimasta un problema. Google afferma che Nano Banana Pro migliora significativamente il rendering del testo, consentendo potenzialmente la creazione di infografiche generate dall’intelligenza artificiale con testo leggibile. L’integrazione di Gemini con Ricerca Google (e la modalità AI per gli abbonati Pro) migliora ulteriormente questa capacità.
Filigrane e rilevamento AI
Google sta anche modificando il suo approccio alle filigrane. Gli abbonati di livello alto (piano Ultra a $ 250 al mese) possono ora rimuovere le filigrane generate dall’intelligenza artificiale, rendendo più difficile distinguere tra immagini create dall’intelligenza artificiale e immagini reali. Nonostante ciò, Google afferma che il suo sistema SynthID, una filigrana invisibile incorporata nel contenuto generato, consentirà a Gemini di identificare le immagini create dall’intelligenza artificiale se caricate per la verifica. Resta da vedere l’efficacia di SynthID.
L’eredità della “nano banana”.
Il nome “Nano Banana Pro” deriva dalla precedente iterazione, Gemini 2.5 Flash Image, rilasciata all’inizio di questa estate. I primi tester ne hanno elogiato la coerenza dei caratteri, il che significa che il modello poteva modificare le foto esistenti senza distorcere le persone o gli oggetti al loro interno. Questa divertente convenzione di denominazione, rafforzata dai dirigenti di Google, prese rapidamente piede e divenne il soprannome non ufficiale del modello.
Gemini 3: un aggiornamento più ampio
Il lancio di Nano Banana Pro fa parte di un più ampio aggiornamento Gemini 3. Queste modifiche mirano a offrire un’esperienza AI più intelligente e meno distorta per gli utenti Gemini. Ciò include miglioramenti su molteplici aspetti del sistema AI, non solo sulla generazione di immagini.
In conclusione, Nano Banana Pro di Google rappresenta un passo avanti nella generazione di immagini tramite intelligenza artificiale, risolvendo problemi di vecchia data relativi alla chiarezza del testo, alla risoluzione e alla trasparenza della filigrana. L’aggiornamento sottolinea la rapida evoluzione degli strumenti di intelligenza artificiale e solleva interrogativi sulla crescente difficoltà nel distinguere tra contenuti creati dall’intelligenza artificiale e contenuti reali.






























