OpenAI spouští ChatGPT Images 1.5: Přímá reakce na pokrok společnosti Google v obrázcích AI

15

OpenAI odhalila nejnovější verzi svého modelu generování obrázků AI, ChatGPT Images 1.5, v kroku, který mnozí považují za protiopatření nedávným úspěchům Googlu v této oblasti, zejména virální popularitě Nano Banana Pro. Nový model slibuje výrazné zlepšení rychlosti, přesnosti instrukcí a detailů obrazu, což umožňuje OpenAI získat zpět svou pozici v rychle se vyvíjejícím generativním prostředí AI.

Rychlejší a přesnější vytváření obrázků

Aktualizace, která je nyní celosvětově dostupná uživatelům ChatGPT a prostřednictvím API (GPT-Image-1.5), zavádí vyhrazený prostor pro vytváření obrázků v rozhraní ChatGPT. Jedná se o odklon od předchozí metody generování obrázků prostřednictvím textových chatů a nabízí uživatelům přednastavené styly a oblíbené designy pro efektivnější zážitek. OpenAI říká, že model je čtyřikrát rychlejší než jeho předchůdce, s vylepšenými možnostmi přesných úprav – umožňuje přidávat objekty, manipulovat se styly a odstraňovat prvky.

Klíčem je zlepšená čitelnost textu na generovaných obrázcích, což je oblast, kde předchozí modely důsledně bojovaly. Počáteční testy ukazují pokrok, i když komplexní hodnocení ještě nebylo dokončeno. To je zásadní, protože schopnost zobrazovat jasný a čitelný text ve vizuálech generovaných umělou inteligencí byla pro tuto technologii dlouho hlavní překážkou a úspěch Nano Banana Pro v této oblasti vyvíjel tlak na OpenAI, aby ji dohnala.

Partnerství s Disney a konkurenční tlaky

Vydání přichází krátce poté, co OpenAI uzavřelo dohodu s Disney o integraci více než 200 ikonických postav do svých nástrojů pro tvorbu obrázků a videí, i když přístup k těmto postavám nebude možný dříve než v roce 2026. Partnerství zdůrazňuje rostoucí trend velkých zábavních společností využívajících AI pro kreativní účely.

Agresivní plán OpenAI naznačuje záměrnou reakci na Gemini 3 od Googlu, který poháněl Nano Banana Pro. OpenAI údajně po vydání Gemini 3 oznámila „úroveň interního kódu“, což zdůrazňuje naléhavost zachování konkurenceschopnosti. Uvedení GPT-5.2 minulý týden bylo dalším krokem tímto směrem.

Etické problémy a diskuse o autorech

Vzestup generování obrázků AI nadále podněcuje etické debaty. Snadnost, s jakou lze vytvářet realistické obrázky, vzbuzuje obavy z dezinformací, deepfakes a potenciálu neoprávněného použití materiálu chráněného autorským právem. Kontroverze kolem umění generovaného umělou inteligencí také znovu vyvolala diskuse o uměleckém vlastnictví a dopadu na lidské tvůrce.

Postavy jako Hayao Miyazaki, spoluzakladatel Studia Ghibli, ostře kritizovaly nástroje AI a označily je za „urážku života“. Širší kreativní komunita vyjádřila obavy ohledně schopnosti umělé inteligence reprodukovat lidské styly a podoby bez souhlasu, což bylo umocněno vlastním generátorem videa OpenAI, Sora.

Rychlé tempo vývoje umělé inteligence vyžaduje pečlivé zvážení jeho důsledků pro umělce, spotřebitele a společnost jako celek. Nejnovější krok OpenAI podtrhuje, že konkurence mezi technologickými giganty se pravděpodobně zrychlí, což povede k pokračující inovaci a zároveň zesílí etické a právní problémy kolem generativní umělé inteligence.