OpenAI ha svelato l’ultima iterazione del suo modello di generazione di immagini AI, ChatGPT Images 1.5, in una mossa ampiamente vista come un contrasto ai recenti passi avanti di Google nel campo, in particolare al successo virale della sua Nano Banana Pro. Il nuovo modello promette miglioramenti significativi in termini di velocità, seguito delle istruzioni e dettaglio delle immagini, posizionando OpenAI per riguadagnare terreno nel panorama in rapida evoluzione dell’intelligenza artificiale generativa.
Creazione di immagini più rapida e precisa
L’aggiornamento, ora disponibile a livello globale per gli utenti ChatGPT e tramite API (GPT-Image-1.5), introduce uno spazio dedicato alla creazione di immagini all’interno dell’interfaccia ChatGPT. Ciò segna un allontanamento dal metodo precedente di generazione di immagini tramite chat basate su testo, fornendo agli utenti stili preimpostati e design di tendenza per un’esperienza più snella. OpenAI afferma che il modello è quattro volte più veloce rispetto al suo predecessore, con funzionalità migliorate nell’editing preciso, consentendo l’aggiunta di oggetti, la manipolazione dello stile e la rimozione degli elementi.
Un obiettivo chiave è il miglioramento della leggibilità del testo nelle immagini generate, un’area in cui i modelli precedenti avevano costantemente difficoltà. I test iniziali suggeriscono progressi, anche se è in corso una valutazione approfondita. Questo è fondamentale perché la capacità di rendere testo chiaro e leggibile nelle immagini generate dall’intelligenza artificiale è stata un grosso ostacolo per la tecnologia, e il successo di Nano Banana Pro in quest’area ha messo pressione su OpenAI per recuperare terreno.
Partnership Disney e pressione competitiva
Il rilascio arriva poco dopo che OpenAI ha siglato un accordo con Disney per integrare oltre 200 personaggi iconici nei suoi strumenti di generazione di immagini e video, anche se l’accesso a tali personaggi non sarà disponibile fino all’inizio del 2026. Questa partnership sottolinea la crescente tendenza delle principali società di intrattenimento ad abbracciare l’intelligenza artificiale per applicazioni creative.
La timeline aggressiva di OpenAI suggerisce una risposta deliberata a Gemini 3 di Google, che ha alimentato Nano Banana Pro. I rapporti indicano che OpenAI ha emesso un “codice rosso interno” dopo il rilascio di Gemini 3, evidenziando l’urgenza di mantenere la competitività. Il lancio di GPT-5.2 la scorsa settimana è stato un altro passo in questo sforzo.
Preoccupazioni etiche e dibattito sui creatori
Il progresso nella generazione di immagini tramite intelligenza artificiale continua ad alimentare dibattiti etici. La facilità con cui è possibile creare immagini realistiche solleva preoccupazioni riguardo alla disinformazione, ai deepfake e al potenziale utilizzo non autorizzato di materiale protetto da copyright. La controversia sull’arte generata dall’intelligenza artificiale ha anche riacceso le discussioni sulla proprietà artistica e sull’impatto sui creatori umani.
Figure come Hayao Miyazaki, co-fondatore dello Studio Ghibli, hanno criticato apertamente gli strumenti di intelligenza artificiale, definendoli un “insulto alla vita stessa”. La comunità creativa più ampia ha espresso ansia per la capacità dell’intelligenza artificiale di replicare stili e somiglianze umane senza consenso, un sentimento amplificato dal generatore video di OpenAI, Sora.
Il rapido ritmo dello sviluppo dell’intelligenza artificiale richiede un’attenta considerazione delle sue implicazioni per gli artisti, i consumatori e la società nel suo insieme. L’ultima mossa di OpenAI sottolinea che la concorrenza tra i giganti della tecnologia probabilmente accelererà, costringendo l’innovazione continua e allo stesso tempo intensificando le questioni etiche e legali che circondano l’intelligenza artificiale generativa.
