Google hat mit der Veröffentlichung von Gemini 3 Pro Image, weithin bekannt als „Nano Banana Pro“, ein bedeutendes Upgrade seiner KI-Bilderzeugungsfunktionen auf den Markt gebracht. Dieses neue Modell, das auf Gemini 3 aufbaut, zielt darauf ab, wesentliche Schwachstellen in KI-generierten Bildern zu beheben – insbesondere die Schwierigkeit, lesbaren Text zu erstellen – und gleichzeitig Ausgaben mit höherer Auflösung und erweiterte Bildbearbeitungsfunktionen einzuführen.
Erweiterte Funktionen und Zugänglichkeit
Das Update konzentriert sich auf Verbesserungen in drei Hauptbereichen: Textgenerierung, Referenzbildverarbeitung und Auflösung. Benutzer können jetzt Bilder mit klarerem und genauerem Text generieren, eine Funktion, die bei früheren KI-Modellen problematisch war. Gemini 3 Pro Image kann bis zu 14 Referenzbilder verwenden und ermöglicht so detailliertere und komplexere Kompositionen. Schließlich unterstützt das Modell Auflösungen bis zu 4K und liefert so eine höhere Bildqualität.
Das Update ist derzeit weltweit in der Gemini-App verfügbar. Um auf das neue Modell zuzugreifen, wählen Sie „Bilder erstellen“ (gekennzeichnet durch ein 🍌-Emoji) und wechseln Sie im Eingabeaufforderungsfenster zur Option „Denkmodell“.
Kosten- und Zugangsoptionen
Während Nano Banana Pro kostenlos zugänglich ist, stoßen Benutzer schneller auf Generationsgrenzen als Benutzer mit kostenpflichtigen Abonnements. Google AI-Abonnements beginnen bei 20 $ pro Monat. Sobald die kostenlosen Credits aufgebraucht sind, kehrt das System zum Standardmodell zurück. Das Modell ist auch in die Gemini API, Google AI Studio und Flow integriert.
Behebung von KI-Bildartefakten
KI-Bildgeneratoren hatten in der Vergangenheit Schwierigkeiten, Text präzise wiederzugeben, was zu verzerrten oder unleserlichen Zeichen führte. GPT-Image-1 von OpenAI machte in diesem Bereich erste Fortschritte, die Zuverlässigkeit blieb jedoch ein Problem. Google behauptet, dass Nano Banana Pro die Textwiedergabe erheblich verbessert und möglicherweise die Erstellung von KI-generierten Infografiken mit lesbarem Text ermöglicht. Die Integration von Gemini in die Google-Suche (und den AI-Modus für Pro-Abonnenten) verbessert diese Funktion weiter.
Wasserzeichen und KI-Erkennung
Google ändert auch seine Herangehensweise an Wasserzeichen. High-Tier-Abonnenten (Ultra-Plan für 250 $/Monat) können jetzt KI-generierte Wasserzeichen entfernen, wodurch es schwieriger wird, zwischen KI-erstellten und echten Bildern zu unterscheiden. Dennoch behauptet Google, dass sein SynthID-System – ein unsichtbares Wasserzeichen, das in generierte Inhalte eingebettet ist – es Gemini ermöglichen wird, von KI erstellte Bilder zu identifizieren, wenn sie zur Überprüfung hochgeladen werden. Die Wirksamkeit von SynthID bleibt abzuwarten.
Das „Nano-Bananen“-Erbe
Der Name „Nano Banana Pro“ stammt von der vorherigen Iteration, Gemini 2.5 Flash Image, die Anfang des Sommers veröffentlicht wurde. Erste Tester lobten die Charakterkonsistenz, was bedeutete, dass das Modell vorhandene Fotos bearbeiten konnte, ohne die darin enthaltenen Personen oder Objekte zu verzerren. Diese spielerische Namenskonvention, die von Google-Führungskräften verstärkt wurde, setzte sich schnell durch und wurde zum inoffiziellen Spitznamen des Modells.
Gemini 3: Ein umfassenderes Upgrade
Die Einführung von Nano Banana Pro ist Teil eines größeren Gemini 3-Updates. Diese Änderungen zielen darauf ab, Gemini-Benutzern ein intelligenteres und weniger voreingenommenes KI-Erlebnis zu bieten. Dazu gehören Verbesserungen in mehreren Aspekten des KI-Systems, nicht nur bei der Bilderzeugung.
**Zusammenfassend lässt sich sagen, dass Googles Nano Banana Pro einen Fortschritt in der KI-Bildgenerierung darstellt und seit langem bestehende Probleme mit Textklarheit, Auflösung und Wasserzeichentransparenz angeht. Das Update unterstreicht die rasante Entwicklung von KI-Tools und wirft Fragen hinsichtlich der zunehmenden Schwierigkeit auf, zwischen KI-erstellten und echten Inhalten zu unterscheiden.





























