OpenAI spouští nový model gpt-image-1.5, který zásadně vylepšuje generování a úpravy obrázků v ChatGPT. Reaguje tak na úspěch nástroje Gemini od Googlu a nabízí vyšší rychlost, přesnější editace i věrnější výsledky – vše přímo v konverzaci.
OpenAI pokračuje ve vydávání nových funkcí v nejoblíbenějším chatbotu poté, co na začátku měsíce aktivovala „červený kód“. Tehdy vyšlo najevo, že vzhledem k velkolepému růstu Gemini do roku 2025 a stagnaci ChatGPT Sam Altman nařídil změnu plánované roadmapy, aby se místo přidávání funkcí, jako je reklama, zaměřil na vylepšování chatbota.
Tento měsíc zatím společnost OpenAI upgradovala ChatGPT na verzi GPT-5.2, oznámila dohodu se společností Disney o využití více než 200 jejich postaviček v aplikaci Sora, zahájila integraci hlavních nástrojů Adobe (Photoshop, Acrobat a Express) a nyní představuje nový model generování obrázků, který má převzít Nano Banana používaný aplikací Gemini.
Tento krok není ojedinělý. OpenAI se již několik měsíců snaží posílit „multimodální“ část ChatGPT – tj. aby tentýž asistent rozuměl textu, hlasu, obrázkům i videu – a nezaostával tak za Googlem, Metou nebo Anthropicem. Generování obrázků se stalo jedním z velkých háčků pro přilákání uživatelů, a to jak jednotlivců, tak firem, a je to oblast, kde Google využil výhod Gemini.
Když OpenAI loni v březnu nahradila v GPT-4o model DALL-E nativním modelem generování obrázků, byla to pro ChatGPT samá chvála a usnadnilo mu to oslovit více uživatelů. Myšlenka byla jasná: uživatel nebude muset přepínat mezi nástroji pro vytvoření obrázku, ale udělá to ve stejné konverzaci, kde píše a klade otázky. V září však Google stejnou funkci v Gemini aktualizoval pomocí funkce Nano Banana, která se rychle stala virální pro kvalitu výsledků, rychlost a možnost upravovat obrázky podle představ uživatele. Minulý měsíc ji Google vylepšil o funkci Nano Banana Pro, čímž Gemini ještě více posílil.
Introducing ChatGPT Images, powered by our flagship new image generation model.
– Stronger instruction following
– Precise editing
– Detail preservation
– 4x faster than beforeRolling out today in ChatGPT for all users, and in the API as GPT Image 1.5. pic.twitter.com/NLNIPEYJnr
— OpenAI (@OpenAI) December 16, 2025
OpenAI však stále disponovala modelem gpt-image, který byl ve srovnání s Gemini mimořádně pomalý, méně realistický, a pokud jste jej požádali o úpravu obrázku, neudělal to, ale znovu jej vytvořil s požadovanými změnami a typickými nedůslednostmi AI. V praxi to znamenalo, že pokud jste nahráli fotografii, abyste „vyretušovali pozadí“ nebo „změnili barvu oděvu“, model vygeneroval nový obrázek, který vypadal jako původní, ale nebyl stejný: změnily se rysy obličeje, detaily prostředí nebo dokonce celá kompozice.
To se mění s verzí gpt-image-1.5, která je nyní k dispozici všem uživatelům a jejímž cílem je dohnat v tomto ohledu ztracené pozice proti Gemini tím, že zlepšuje svou schopnost řídit se pokyny uživatele, umožňuje úpravy obrázků a generuje výsledky až čtyřikrát rychleji.
Jak společnost vysvětluje na svém blogu, gpt-image-1.5 dokáže „lépe odpovídat vašemu záměru“ při úpravě nahraného nebo vytvořeného obrázku. Změny zahrnují užitečnější úpravy fotografií, věrohodnější korektury oblečení a účesů spolu se stylistickými filtry a koncepčními transformacemi, které zachovávají podstatu původního obrázku. Nabízí také lepší zachování log a obličejů a vylepšené vykreslování textu ve vygenerovaných obrázcích, zejména hustšího a menšího textu.
V praxi to znamená, že je nyní možné provádět věci, které byly dříve v aplikaci ChatGPT velmi nespolehlivé, například:
- Nahrát fotografii výrobku a požádat o změnu pozadí na neutrální pro použití v internetovém obchodě.
- Vyzkoušet si různé barvy stejných šatů nebo obleku, aniž by se změnila póza nebo tělo osoby.
- Retušování plakátu s velkým množstvím textu, aniž by písmena vypadala zkresleně nebo nečitelně.
- Použití uměleckého stylu (např. „akvarel“ nebo „komiks“) při zachování původní kompozice.
OpenAI zajišťuje, že model je schopen plnit složité pokyny v přirozeném jazyce, jako například „udělej, aby to vypadalo jako fotografie pořízená při západu slunce, ale beze změny výrazu osoby nebo zarámování“ nebo „přidej logo do pravého dolního rohu, aniž by zakryl text“. Tyto druhy nuancí byly jednou ze silných stránek aplikací Nano Banana a Nano Banana Pro v Gemini a nyní se stávají jejich přímou konkurencí.
Jak fungují nové úpravy obrázků v aplikaci ChatGPT
Společnost přepracovala prostředí v samotném chatbotu. Model přichází s novou vyhrazenou sekcí v chatbotu. Uživatel najde v postranním panelu možnost Obrázky, která zahrnuje předdefinované filtry a návrhy a nápady na podněty, které jsou trendy, a také je může provádět z konverzace vedené s ChatGPT. Z této části lze provádět tři základní akce:
- Vytvářet obrázky od začátku z textového popisu (což bylo možné již v předchozí verzi, nyní však s větší rychlostí a věrností).
- Nahrát vlastní obrázek (například fotografii z mobilního telefonu) a požádat o konkrétní změny: odstranit objekty, změnit barvy, upravit osvětlení, přidat prvky atd.
- Opakovaně upravovat obrázky vygenerované aplikací ChatGPT, řetězit několik verzí, dokud není dosaženo požadovaného výsledku, aniž by se ztratily klíčové detaily původního obrázku.
Úpravy lze provádět buď pomocí obecných pokynů („zesvětlete to“), nebo velmi konkrétních pokynů („odstraňte červené auto v pozadí a nahraďte ho stromem, ale zachovejte stíny na zemi“). Podle OpenAI je gpt-image-1.5 obzvláště dobrý v lokalizovaných úpravách, tj. změnách, které ovlivňují pouze jednu část obrázku, aniž by měnily zbytek.
Další důležitou změnou je rychlost. OpenAI tvrdí, že nový model je až čtyřikrát rychlejší než předchozí. To nejen zlepšuje uživatelský komfort pro koncového uživatele, ale také otevírá dveře složitějším pracovním postupům, jako je například vygenerování několika verzí stejného obrázku během několika sekund, aby bylo možné je porovnat a vybrat tu nejlepší.
Výhody pro tvůrce, podniky i „běžné“ uživatele
OpenAI prezentuje tuto verzi jako „krok od jednoduchého generování novinek k praktické vizuální tvorbě s vysokou věrností“ a uvádí, že díky ní se ChatGPT stává „rychlým a flexibilním kreativním studiem“ pro každodenní úpravy, expresivní transformace a reálné použití. Převedeno do konkrétních případů to znamená, že:
- Malé podniky mohou vytvářet materiály pro sociální média, katalogy nebo reklamy, aniž by musely ovládat návrhářský software. Stačí nahrát produktovou fotografii a požádat například o vytvoření verze pro Instagram s pastelovým pozadím a textem „-20%“ v horní části.
- Tvůrci obsahu mohou vytvářet náhledy videí, obálky podcastů nebo ilustrace článků tak, že upraví styl a text tak, aby vyhovoval jejich značce.
- Domácí uživatelé mohou retušovat osobní fotografie (odstraňovat nežádoucí prvky, opravovat osvětlení, zkoušet umělecké styly), aniž by museli procházet složitými editory.
- Marketingové a designérské týmy mohou ChatGPT používat jako nástroj pro rychlou tvorbu prototypů: generovat náčrty, testovat různé kompozice a výsledek pak doladit v profesionálních nástrojích, jako je například Photoshop, který je již s ChatGPT integrován prostřednictvím Adobe.
Vylepšené vykreslování textu je klíčové i pro „serióznější“ použití, jako je tvorba prezentací, infografik nebo plakátů, kde umělá inteligence dříve nedokázala napsat celá slova nebo zachovat konzistentní typografii. OpenAI tvrdí, že gpt-image-1.5 lépe zpracovává dlouhý a malý text, což bylo v minulosti slabinou generativních obrazových modelů.
Náklady a API: Levnější model pro vývojáře
Pro vývojáře je gpt-image-1.5 o 20 % levnější pro vstupy a výstupy obrázků než gpt-image-1. Stejně jako dříve mohou vývojáři řídit náklady na generování pomocí parametru kvality. OpenAI zajišťuje, že nový model zachová vysoký výkon i při nastavení nízké kvality.
V praxi to znamená, že aplikace integrující rozhraní API OpenAI – od editorů fotografií až po nástroje pro elektronické obchodování – budou moci nabízet levnější generování a úpravy obrázků nebo zachovat cenu pro koncové uživatele a zvýšit své marže. Parametr kvality umožňuje volit mezi:
- Vysoká kvalita, určená pro konečné výsledky, kde záleží na každém detailu (např. marketingové nebo tiskové materiály).
- Střední nebo nízká kvalita, která postačuje pro rychlé prototypování, interní testování nebo hromadné generování variant.
OpenAI trvá na tom, že i v nejlevnějších režimech model zachovává velkou část své schopnosti řídit se pokyny a udržovat vizuální konzistenci, což u předchozích generací s nižší kvalitou nebylo vždy pravidlem.
Kromě toho je model gpt-image-1.5 v rozhraní API nabízen jako „GPT Image 1.5“, což usnadňuje jeho integraci do pracovních postupů, kde se již používají jiné firemní modely, například GPT-4 nebo GPT-5.2 pro text. To odpovídá strategii společnosti OpenAI nabízet „katalog“ specializovaných modelů, které lze vzájemně kombinovat v rámci jedné aplikace.
Přímá konkurence společnosti Google: Nano Banana vs. gpt-image-1.5
Vydání gpt-image-1.5 přichází v době, kdy se společnost Google výrazně angažuje v oblasti integrovaného generování obrázků Gemini. Nano Banana a její vylepšená verze Nano Banana Pro se staly jedním z hlavních lákadel ekosystému Google, částečně proto, že se přímo integrují do produktů, jako jsou Fotky Google, Dokumenty nebo Prezentace Google, a částečně díky kvalitě jejich výsledků.
Velký rozdíl až dosud spočíval v tom, že Gemini umožňoval velmi přesné úpravy existujících obrázků s velmi nízkou dobou odezvy, zatímco ChatGPT zůstával jakýmsi „kreativním generátorem“ méně vhodným pro dolaďování úloh. S verzí gpt-image-1.5 se OpenAI snaží tento rozdíl odstranit:
- Rychlost: OpenAI hovoří o modelu, který je čtyřikrát rychlejší než předchozí model a blíží se době odezvy Nano Banana.
- Skutečné úpravy: Důraz na „zachování podstaty původního obrázku“ přímo ukazuje na jednu ze silných stránek společnosti Google.
- Kvalita textu a loga: Klíčová pro profesionální použití, kde Gemini také vynikal.
Souboj však není jen o technické kvalitě, ale také o integraci do každodenního života. Google má výhodu, že je přítomen v systémech Android, Gmail a Drive, zatímco OpenAI se snaží vytvořit z ChatGPT jakési kreativní „řídicí centrum“, které se propojí s nástroji třetích stran (např. Adobe) a s vlastním ekosystémem modelů.
Omezení, bezpečnost a odpovědné používání
Stejně jako u jiných nedávných verzí věnuje OpenAI část svého oznámení pojednání o bezpečnosti a zodpovědném používání. Společnost tvrdí, že gpt-image-1.5 obsahuje filtry, které zabraňují určitým typům obsahu, například:
- Násilné nebo extrémně explicitní obrázky.
- Sexuální obsah, zejména pokud zahrnuje nezletilé nebo postavy, které mohou vypadat jako nezletilé.
- Pokusy o vydávání se za skutečné osoby v citlivých kontextech (např. vytváření falešných obrázků politiků v kompromitujících situacích).
Kromě toho OpenAI zachovává svou politiku, podle níž není povoleno trénovat model pomocí obrázků vytvořených samotnými uživateli bez jejich výslovného souhlasu, což je v souladu se závazky, které v posledních měsících oznamovala. Na základě doporučení orgánů, jako je Evropská unie a Fórum pro správu umělé inteligence, byly rovněž posíleny systémy označování a sledovatelnosti obsahu generovaného umělou inteligencí.
Pro běžného uživatele to znamená, že ačkoli je nástroj výkonnější, stále budou existovat jasné limity toho, co dokáže. Nebude například možné vytvářet realistické deepfakes konkrétních osob z nahrané fotografie ani generovat loga, která přímo kopírují ochranné známky.
Co tento krok znamená pro budoucnost ChatGPT
Aktualizace gpt-image-1.5 zapadá do jasného trendu: velké modely umělé inteligence se již neomezují pouze na odpovídání na otázky nebo psaní textů, ale aspirují na to stát se obecnými asistenty schopnými pomoci s téměř jakýmkoli digitálním úkolem. Zobrazování je klíčovým dílem této skládačky. Tímto krokem se OpenAI snaží:
- Udržet si uživatele, kteří přešli na Gemini kvůli jeho vizuálním schopnostem.
- Zvýšit čas strávený používáním ChatGPT tím, že se z něj stane platný nástroj pro psaní i navrhování.
- Přilákat firmy, které potřebují rozsáhlá řešení pro generování vizuálního obsahu, ale nechtějí se spoléhat pouze na Google.
Uvidíme, jak Google zareaguje a zda se dočkáme nového kola vylepšení Nano Banana Pro nebo dalších zobrazovacích modelů. Zdá se však, že je jasné, že generování a úprava obrázků se staly jednou z nejrychleji se rozvíjejících oblastí generativní umělé inteligence, kde se konkurence mezi technologickými giganty stává pro koncového uživatele viditelnější.
Prozatím je gpt-image-1.5 k dispozici všem uživatelům a vývojářům ChatGPT prostřednictvím API. Poselství OpenAI je jasné: obrázek už není v rámci chatbota „navíc“, ale jednou z jeho základních funkcí.
