Firma Google wydała poważną aktualizację swoich możliwości generowania obrazów za pomocą Gemini 3 Pro Image, popularnie znanego jako „Nano Banana Pro”. Nowy model, oparty na Gemini 3, ma zaradzić kluczowym niedociągnięciom obrazów generowanych przez sztuczną inteligencję – w szczególności trudnościom w generowaniu czytelnego tekstu – a jednocześnie wprowadzić wyższą rozdzielczość wyjściową i zaawansowane możliwości manipulacji obrazami.
Ulepszone funkcje i dostępność
Aktualizacja koncentruje się na ulepszeniach w trzech głównych obszarach: generowanie tekstu, obsługa obrazu referencyjnego i rozdzielczość. Użytkownicy mogą teraz generować obrazy z wyraźniejszym i dokładniejszym tekstem, co było wyzwaniem w przypadku poprzednich modeli sztucznej inteligencji. Gemini 3 Pro Image może wykorzystać aż 14 obrazów referencyjnych, co pozwala na tworzenie bardziej szczegółowych i złożonych kompozycji. Wreszcie model obsługuje rozdzielczości do 4K, zapewniając wyższą jakość obrazu.
Aktualizacja jest już dostępna na całym świecie w aplikacji Gemini. Aby uzyskać dostęp do nowego modelu, wybierz „Utwórz obrazy” (oznaczone emoji 🍌) i w oknie żądania przejdź do opcji „Model myślący”.
Opcje kosztów i dostępu
Chociaż Nano Banana Pro jest dostępny bezpłatnie, użytkownicy napotkają ograniczenia generacji szybciej niż użytkownicy korzystający z płatnej subskrypcji. Subskrypcje Google AI zaczynają się od 20 USD miesięcznie. Po wyczerpaniu się darmowych kredytów system powraca do modelu standardowego. Model jest również zintegrowany z Gemini API, Google AI Studio i Flow.
Usuwanie artefaktów obrazu AI
W przeszłości generatory obrazów AI miały trudności z dokładnym renderowaniem tekstu, co skutkowało zniekształceniem lub nieczytelnością znaków. OpenAI GPT-Image-1 poczynił wczesne postępy w tej dziedzinie, ale niezawodność pozostała problemem. Google twierdzi, że Nano Banana Pro znacznie poprawia renderowanie tekstu, potencjalnie umożliwiając tworzenie infografik generowanych przez sztuczną inteligencję z czytelnym tekstem. Integracja Gemini z wyszukiwarką Google (oraz trybem AI dla abonentów Pro) dodatkowo rozszerza te możliwości.
Znak wodny i wykrywanie AI
Google zmienia także swoje podejście do znaków wodnych. Użytkownicy wyższego poziomu (plan Ultra za 250 USD miesięcznie) mogą teraz usuwać znaki wodne wygenerowane przez sztuczną inteligencję, co utrudnia rozróżnienie obrazów wygenerowanych przez sztuczną inteligencję od obrazów rzeczywistych. Mimo to Google twierdzi, że jego system SynthID – niewidoczny znak wodny osadzany w wygenerowanych treściach – pozwoli Gemini identyfikować obrazy wygenerowane przez sztuczną inteligencję podczas przesyłania ich do recenzji. Skuteczność SynthID dopiero się okaże.
Dziedzictwo „Nano Banana”
Nazwa „Nano Banana Pro” pochodzi od poprzedniej wersji, Gemini 2.5 Flash Image, wydanej wcześniej tego lata. Pierwsi testerzy chwalili spójność postaci, co oznacza, że model mógł edytować istniejące zdjęcia bez zniekształcania znajdujących się na nich osób lub obiektów. To zabawne nazewnictwo, wzmocnione przez kierownictwo Google, szybko się przyjęło i stało się nieoficjalną nazwą modelu.
Gemini 3: Większa aktualizacja
Premiera Nano Banana Pro jest częścią większej aktualizacji Gemini 3. Zmiany te mają na celu zapewnienie użytkownikom Gemini inteligentniejszego i mniej stronniczego korzystania z AI. Obejmuje to ulepszenia wielu aspektów systemu AI, a nie tylko generowania obrazu.
Podsumowując Google Nano Banana Pro stanowi krok naprzód w generowaniu obrazów AI, rozwiązując długotrwałe problemy z przejrzystością tekstu, rozdzielczością i przezroczystością znaku wodnego. Aktualizacja podkreśla szybką ewolucję narzędzi sztucznej inteligencji i rodzi pytania dotyczące rosnących trudności w rozróżnieniu treści generowanych przez sztuczną inteligencję od treści rzeczywistych.






























