Google випустила значне оновлення своїх можливостей для генерації зображень за допомогою Gemini 3 Pro Image, широко відомого як “Nano Banana Pro”. Нова модель, заснована на Gemini 3, спрямована на усунення ключових недоліків у зображеннях, створених ІІ, зокрема складнощів зі створенням розбірливого тексту, а також представляє вихідні дані вищої роздільної здатності та розширені функції маніпулювання зображеннями.
Поліпшені можливості та доступність
Оновлення зосереджено на покращеннях у трьох основних областях: генерація тексту, робота з довідковими зображеннями та дозвіл. Тепер користувачі можуть генерувати зображення з чіткішим і точнішим текстом, що було проблемою для попередніх моделей ІІ. Gemini 3 Pro Image може використовувати до 14 довідкових зображень, що дозволяє створювати більш детальні та складніші композиції. Нарешті, модель підтримує роздільну здатність до 4K, забезпечуючи візуальні ефекти вищої якості.
Оновлення вже доступне у всьому світі в додатку Gemini. Щоб отримати доступ до нової моделі, виберіть “Створити зображення” (позначено емодзі 🍌) і перейдіть на опцію “Thinking model” у вікні запиту.
Вартість та варіанти доступу
Хоча Nano Banana Pro доступний безкоштовно, користувачі швидше зіткнуться з обмеженнями генерації, ніж ті, хто має платну передплату. Підписки Google AI починаються від 20 доларів на місяць. Як тільки безкоштовні кредити буде вичерпано, система повертається до стандартної моделі. Модель також інтегрована в Gemini API, Google AI Studio та Flow.
Усунення артефактів зображень ІІ
Генератори зображень ІІ історично зазнавали труднощів з точним відмальовуванням тексту, що призводило до спотворених чи нерозбірливих символів. OpenAI GPT-Image-1 досягнув раннього прогресу в цій галузі, але надійність залишалася проблемою. Google стверджує, що Nano Banana Pro значно покращує відмальовування тексту, що потенційно дозволяє створювати інфографіку, згенеровану ІІ, з текстом, що читається. Інтеграція Gemini із Google Search (і режим AI для передплатників Pro) ще більше розширює ці можливості.
Водяні знаки та виявлення ІІ
Google також змінює свій підхід до водяних знаків. Користувачі високого рівня (Ultra-план за 250 доларів на місяць) тепер можуть видаляти водяні знаки, згенеровані ІІ, що ускладнює розрізнення між зображеннями, створеними ІІ, та реальними зображеннями. Незважаючи на це, Google стверджує, що його система SynthID — невидимий водяний знак, вбудований у згенерований контент, дозволить Gemini ідентифікувати зображення, створені ІІ, при їх завантаженні для перевірки. Ефективність SynthID ще доведеться побачити.
Спадщина “Nano Banana”
Назва “Nano Banana Pro” походить від попередньої ітерації, Gemini 2.5 Flash Image, випущеної раніше цього літа. Ранні випробувачі високо оцінили послідовність персонажів, тобто модель могла редагувати існуючі фотографії, не спотворюючи людей або об’єкти в них. Ця грайлива номенклатура, підкріплена керівниками Google, швидко прижилася та стала неофіційною назвою моделі.
Gemini 3: Більш масштабне оновлення
Запуск Nano Banana Pro є частиною масштабнішого оновлення Gemini 3. Ці зміни спрямовані на забезпечення більш інтелектуального та менш упередженого досвіду ІІ для користувачів Gemini. Це включає поліпшення по безлічі аспектів системи ІІ, а не тільки генерації зображень.
На закінчення, Nano Banana Pro від Google є крок вперед у генерації зображень ІІ, вирішуючи давні проблеми з чіткістю тексту, роздільною здатністю та прозорістю водяних знаків. Оновлення підкреслює стрімку еволюцію інструментів ІІ та ставить питання про зростаючі труднощі у розрізненні контенту, створеного ІІ, та реального контенту.


















































