Zapomeňte na rozmazané hlouposti. Nano Banana Pro kreslí s mozkem

Zapomeňte na rozmazané hlouposti. Nano Banana Pro kreslí s mozkem

Zdroj obrázku: lanny photo / Shutterstock

Společnost Google oznámila představení svého nejpokročilejšího modelu pro tvorbu obrázků, který je nyní založen na modelu Gemini 3 Pro.


Jen před několika měsíci společnost Google vydala model Gemini 2.5 Flash Image, kterému láskyplně říkáme Nano Banana. Jednalo se o zásadní průlom, zaměřený na rychlé úpravy a nenáročnou kreativitu, který nám umožňoval vše od obnovy starých fotografií až po generování náhledů pro videa na YouTube. Ale pokud to byl předkrm, to, co přišlo dnes, je hlavní chod.

Společnost Google právě představila Nano Banana Pro (Gemini 3 Pro Image), svůj nový nejmodernější model pro generování a úpravu obrázků. Tento nový model, postavený na platformě Gemini 3 Pro, spoléhá nejen na vizuální výkon, ale také na pokročilé uvažování a znalosti reálného světa modelu LLM.

Související článek

Milion robotů na poštovní známce. Nový průlom mění svět mikrotechnologie
Milion robotů na poštovní známce. Nový průlom mění svět mikrotechnologie

Tým amerických vědců představil roboty menší než zrnko soli, kteří se dokáží sami rozhodovat, pohybovat a vnímat okolí bez vnější kontroly. Jde o zásadní milník v miniaturizaci, který otevírá nové možnosti v medicíně, výrobě i výzkumu na buněčné úrovni.

Poselství je jasné: éra krásných, ale nesourodých a chybami zatížených obrázků skončila. Nano Banana Pro nejen kreslí, ale také rozumí tomu, co kreslí. To znamená, že je připraven přejít z role zábavného nástroje na seriózní řešení pro vizualizaci dat, tvorbu prototypů a především skoncovat s tou opakující se noční můrou umělé inteligence: chybně napsanými písmeny.

Chytřejší model

Velkým omezením předchozích obrazových modelů byla jejich nedostatečná schopnost propojit vizuální reprezentaci se znalostmi. Pokud jste požádali o složitý diagram nebo recept, výsledek byl často vizuálně přitažlivý, ale koncepčně nesprávný. To se snaží Nano Banana Pro napravit díky pokročilému uvažování Gemini 3 Pro.

Díky tomuto modelu se obrázek mění z uměleckého díla na nástroj vizualizace informací:

  • Přesné infografiky a diagramy: Nyní můžeme vytvářet přesné a kontextuální výukové vysvětlivky, infografiky a diagramy, a to jak na základě poskytnutých informací, tak na základě skutečných faktů.
  • Připojení v reálném čase: Snad nejsilnější funkcí je možnost připojení k rozsáhlé znalostní databázi vyhledávače Google. To umožňuje zobrazit informace v reálném čase, například aktuální počasí nebo sportovní výsledky, nebo vygenerovat rychlý přehled receptů.
    • Můžete například požádat o infografiku ukazující, jak připravit „Elaichi Chai“ (čaj s kardamomem), nebo vytvořit pop-artovou grafiku s aktuální předpovědí počasí pro vaše město a model využije spojení s vyhledávačem k načtení dat.

Konec zkomolených písmen

Pokud jste někdy zkusili požádat umělou inteligenci, aby na plakát nebo logo napsala jednoduché slovo, víte, že výsledek často vypadal, jako by ho napsalo dítě na povzbuzovadle. Byla to Achillova pata generování obrázků.

Nano Banana Pro se může pochlubit dosud nejlepším modelem pro vytváření obrázků se správně vykresleným a čitelným textem přímo v obrázku, ať už jde o jednoduchou větu nebo celý odstavec. Dokáže to díky tomu, že umělá inteligence nyní rozumí „hloubce a nuancím“ textu, což otevírá fascinující možnosti.

Konzistentnější výsledky

Pro profesionální svět je rozhodující konzistence a jemná kontrola. Nano Banana Pro nabízí možnosti, které stírají hranici mezi konceptem a tvorbou připravenou k produkci:

  • Výrazná konzistence designu: Nyní je možné míchat více prvků než kdykoli předtím a udržet v komplexní kompozici konzistenci a podobnost u až 5 osob a až 14 vstupních obrázků. Už se vám nestane, že by vaše postavy měnily tváře nebo že by vaše produkty měly v různých úhlech nekonzistentní vzhled značky.
  • Pokročilé lokalizované úpravy: Vylepšené úpravy umožňují s chirurgickou přesností vylepšit a transformovat jakoukoli část obrázku. Můžeme použít studiové kontroly kvality:
    • Úhly kamery a zaostření: upravte hloubku ostrosti nebo ohnisko (vytvořte efekt bokeh).
    • Osvětlení: proměňte osvětlení scény (např. změna z denního na noční) nebo zaveďte dramatické efekty, jako je například chiaroscuro.
  • Rozlišení a přizpůsobení: výtvory jsou připraveny pro jakoukoli platformu, k dispozici je řada poměrů stran a možnost vytvářet obsah v rozlišení 2K a 4K.

Google zavádí Nano Banana Pro prakticky ve všech svých produktech a nabízí uživatelům možnost volby mezi původním modelem (Nano Banana) pro rychlé úlohy a modelem „Pro“ pro komplexní a vysoce kvalitní výsledky.

  • Uživatelé: globální nasazení v aplikaci Gemini (výběrem možnosti „Vytvářet obrázky“ u možnosti „Myšlení“). Předplatitelé služeb Google AI Plus, Pro a Ultra získají vyšší limity.
  • Profesionálové: Generování obrázků v Google Ads bude povýšeno na Nano Banana Pro. Model přibude také u klientů Workspace v aplikacích Google Slides a Vids.
  • Vývojáři: K dispozici v Gemini API a Google AI Studio a v podnikových nástrojích, jako je Vertex AI.

Význam umělé inteligence při generování obrázků

Umělá inteligence způsobila revoluci ve způsobu vytváření a úprav obrázků. S rozvojem modelů, jako je Nano Banana Pro, jsme svědky proměny způsobu, jakým mohou firmy i jednotlivci pracovat s vizuálním obsahem. Schopnost generovat obrázky, které jsou nejen esteticky příjemné, ale také koncepčně přesné, otevírá nový svět možností v oblastech, jako je vzdělávání, marketing a design.

Integrace umělé inteligence do každodenních nástrojů navíc znamená, že více lidí bude mít přístup k pokročilým technologiím, aniž by museli být odborníky v této oblasti. To demokratizuje přístup k tvorbě vysoce kvalitního obsahu a umožňuje malým podnikům konkurovat velkým korporacím za stejných podmínek.

Nano Banana Pro představuje významný krok směrem k budoucnosti, kdy umělá inteligence nejen pomáhá při tvůrčích úkolech, ale také je transformuje a činí tento proces efektivnějším, přesnějším a přístupnějším pro všechny.

Zdroje článku

deepmind.google
#