OpenAI spustila Sora 2 – výkonný model pro generování realistických videí z textu – spolu s mobilní aplikací ve stylu TikToku, kde hlavní roli hrajete vy sami. Videa, která vypadají jako profesionální produkce, jsou teď otázkou pár kliknutí – a zároveň otvírají debatu o digitální identitě, soukromí a budoucnosti obsahu.
Za pouhé tři roky urazila generativní umělá inteligence cestu, která se dříve zdála být sci-fi. Nejdříve přišel ChatGPT (2022), který zpopularizoval generování konverzačních textů a dostal umělou inteligenci do povědomí všech. Rychle následovaly obrazové modely – například DALL-E a MidJourney – a v únoru 2024 přišla první verze Sory, modelu AI schopného převádět popisy na (relativně) souvislé videoklipy.
Nyní, s příchodem Sory 2, se díky OpenAI objekty spíše odrážejí než teleportují, scény zachovávají kontinuitu mezi záběry, dialogy se synchronizují s pohybem rtů a přidávají se zvukové kulisy. Zkrátka věrohodnější a konzistentnější klipy. Tento vývoj nejen zlepšuje vizuální kvalitu, ale také rozšiřuje tvůrčí možnosti a umožňuje uživatelům experimentovat s různými žánry a filmovými styly.
Ve spojení s novou mobilní aplikací ve stylu TikToku chce společnost zopakovat dopad, který měla verze GPT-3.5 na svou oblast, a přinést hyperrealistické generování videí do kapsy každého uživatele s příslibem, že vy a vaše kontakty můžete hrát v klipech, které vypadají téměř jako profesionálně vyrobené. Přístupnost a snadné použití jsou klíčem k demokratizaci technologie a zdá se, že OpenAI je na dobré cestě k dosažení tohoto cíle.
Aplikace: TikTok vylepšený o umělou inteligenci
Revoluční není jen model AI, ale i sociální aplikace. Ve skutečnosti je to známá zkušenost: nekonečné posouvání videí, lajků, remixů a zpráv. Je tu však zásadní rozdíl: téměř veškerý obsah je generován umělou inteligencí a jeho protagonisty mohou být sami uživatelé. Tato integrace umělé inteligence do sociální platformy by mohla změnit způsob interakce s digitálním obsahem a nabídnout personalizovanější a poutavější zážitky.
Aplikace Sora 2, která je pro severoamerické uživatele iOS uvolněna pouze na základě pozvánek (Android bude následovat později), umožňuje vytvářet 10sekundová videa, do nichž můžete vkládáním svého obličeje a hlasu vytvářet camea. Tato funkce je nejen zábavná, ale také vyvolává zajímavé otázky týkající se digitální identity a soukromí ve virtuálním světě.
Postup je jednoduchý: nahrajete několik vteřin, jak kroutíte hlavou a říkáte několik vět, a aplikace vygeneruje vašeho digitálního avatara. Odtud se můžete vidět, jak bojujete v retro videohře, lezete na sopku nebo tančíte s přáteli na fiktivním koncertě. Tyto zážitky jsou nejen zábavné, ale lze je využít i ve vzdělávacím nebo marketingovém kontextu, což dále rozšiřuje jejich potenciál.
Aplikace navíc integruje kanál ve stylu TikTok nebo Reels s možností remixovat videa jiných uživatelů, přidávat jejich variace nebo se připojovat k virálním trendům. To, co bylo dříve doménou profesionálních střihačů videí, se nyní stalo společenskou hrou přístupnou z mobilního telefonu. Tato demokratizace tvorby obsahu by mohla vyvolat novou vlnu digitální kreativity.
Bezpečnost a kontrola: konsensuální deepfakes
První reakce mnohých je logická: co když se tento nástroj stane továrnou na škodlivé deepfakes? Společnost OpenAI si to uvědomuje a implementovala několik vrstev zabezpečení:
- Cameos jsou dobrovolné a vyžadují ověření obličeje a hlasu.
- Pokaždé, když je váš avatar použit ve videu přítele, obdržíte oznámení a můžete výtvor schválit nebo smazat.
- Stažené klipy obsahují viditelné vodoznaky a metadata o pravosti.
- K dispozici jsou limity a rodičovská kontrola pro teenagery, stejně jako lidští recenzenti pro případ obtěžování nebo zneužití.
Pokud jde o autorská práva, společnost zachovává stejnou politiku jako u obrázků: vyhrazuje si právo odstranit obsah, pokud o to vlastníci požádají, ale neblokuje ztvárnění populárních vesmírů, jako jsou Hvězdné války nebo Simpsonovi, mimo rámec. Tato flexibilní politika by mohla usnadnit kreativitu, ale také vyvolává právní problémy, které bude muset OpenAI řešit opatrně.
Závod o video generované umělou inteligencí
OpenAI není sama: Google (s Veo), Runway (Gen-4), Meta (Vibes ) a dokonce i MidJourney předložily návrhy, jak soutěžit na tomto vznikajícím trhu. Rozdíl (zatím) spočívá v tom, že OpenAI kombinuje technickou sílu Sora 2 se sociální sázkou své nové aplikace, což připomíná spuštění ChatGPT v roce 2022: proměna laboratorního prototypu v kulturní fenomén. Schopnost společnosti OpenAI vést tento závod bude záviset na její schopnosti inovovat a přizpůsobovat se měnícím se potřebám uživatelů.
