OpenAI a dévoilé la dernière itération de son modèle de génération d’images IA, ChatGPT Images 1.5, dans une démarche largement considérée comme un contre-pied aux récents progrès de Google dans le domaine, en particulier le succès viral de son Nano Banana Pro. Le nouveau modèle promet des améliorations significatives en termes de vitesse, de suivi des instructions et de détails de l’image, permettant à OpenAI de regagner du terrain dans le paysage en évolution rapide de l’IA générative.
Création d’images plus rapide et plus précise
La mise à jour, désormais disponible dans le monde entier pour les utilisateurs de ChatGPT et via l’API (GPT-Image-1.5), introduit un espace dédié à la création d’images au sein de l’interface ChatGPT. Cela marque une rupture avec la méthode précédente de génération d’images via des discussions textuelles, offrant aux utilisateurs des styles prédéfinis et des designs tendance pour une expérience plus rationalisée. OpenAI affirme que le modèle est quatre fois plus rapide que son prédécesseur, avec des capacités améliorées d’édition précise, permettant l’ajout d’objets, la manipulation de style et la suppression d’éléments.
L’amélioration de la lisibilité du texte dans les images générées est un objectif clé, un domaine dans lequel les modèles précédents rencontraient constamment des difficultés. Les premiers tests suggèrent des progrès, même si une évaluation complète est en cours. Ceci est essentiel car la capacité de restituer un texte clair et lisible dans des visuels générés par l’IA a constitué un obstacle majeur pour la technologie, et le succès de Nano Banana Pro dans ce domaine a poussé OpenAI à rattraper son retard.
Partenariat Disney et pression concurrentielle
Cette sortie intervient peu de temps après qu’OpenAI a conclu un accord avec Disney pour intégrer plus de 200 personnages emblématiques dans ses outils de génération d’images et de vidéos, bien que l’accès à ces personnages ne soit disponible qu’au début de 2026. Ce partenariat souligne la tendance croissante des grandes sociétés de divertissement à adopter l’IA pour des applications créatives.
La chronologie agressive d’OpenAI suggère une réponse délibérée au Gemini 3 de Google, qui alimentait Nano Banana Pro. Les rapports indiquent qu’OpenAI a publié un « code interne rouge » après la sortie de Gemini 3, soulignant l’urgence de maintenir la compétitivité. Le lancement de GPT-5.2 la semaine dernière a constitué une autre étape dans cet effort.
Préoccupations éthiques et débat sur les créateurs
Les progrès de la génération d’images par l’IA continuent d’alimenter les débats éthiques. La facilité avec laquelle des images réalistes peuvent être créées soulève des inquiétudes concernant la désinformation, les deepfakes et le potentiel d’utilisation non autorisée de matériel protégé par le droit d’auteur. La controverse autour de l’art généré par l’IA a également relancé les discussions sur la propriété artistique et l’impact sur les créateurs humains.
Des personnalités comme Hayao Miyazaki, co-fondateur du Studio Ghibli, ont vivement critiqué les outils d’IA, les qualifiant d’« insulte à la vie elle-même ». La communauté créative au sens large a exprimé son inquiétude quant à la capacité de l’IA à reproduire des styles et des ressemblances humaines sans consentement, un sentiment amplifié par le propre générateur vidéo d’OpenAI, Sora.
Le rythme rapide du développement de l’IA exige un examen attentif de ses implications pour les artistes, les consommateurs et la société dans son ensemble. La dernière initiative d’OpenAI souligne que la concurrence entre les géants de la technologie va probablement s’accélérer, obligeant à une innovation continue tout en intensifiant simultanément les questions éthiques et juridiques entourant l’IA générative.
