Nedostatek grafických procesorů způsobuje dlouhé čekání a kolísavý výkon vlajkové služby OpenAI. Sam Altman přiznává, že společnost není schopna uspokojit rostoucí poptávku po svém nejpokročilejším modelu.
Uživatelé ChatGPT zažívají stále delší čekací doby, protože společnost bojuje s vážným nedostatkem hardwaru. Situace nastala uprostřed zavádění verze 4.5, modelu, který vyžaduje mnohem větší výpočetní výkon než jeho předchůdci a během několika týdnů zahltil datová centra společnosti.
„Nemáme dostatečnou výpočetní kapacitu,“ přiznal Sam Altman v X a potvrdil tak to, co už tisíce uživatelů zažívaly v podobě pomalých reakcí a kolísavého výkonu. Generální ředitel OpenAI dodal, že „pracují na co nejrychlejším škálování naší infrastruktury“, aniž by však uvedl konkrétní časový plán řešení problému.
Nedostatek čipů zpomaluje rozšiřování AI
Situace OpenAI není ojedinělým případem. Společnost NVIDIA, která je hlavním výrobcem specializovaných grafických procesorů používaných těmito systémy, udržuje až devítiměsíční čekací lhůty na své čipy H100, které jsou nezbytné pro pokročilé trénování a odvozování modelů. Každý server ChatGPT-4.5 vyžaduje 4 až 8 těchto jednotek, přičemž cena jednoho čipu činí přibližně 25 000 USD (v přepočtu 596 000 korun).
Tato krize v zásobování se týká zejména ChatGPT-4.5, jehož vylepšení v oblasti uvažování a programování vyžaduje o 60 % vyšší výpočetní výkon než předchozí verze. Technická analýza ukazuje, že model při složitých operacích zpracovává až 300 000 tokenů za minutu, což nasytí i infrastrukturu Microsoft Azure vyhrazenou pro OpenAI.
Tento nedostatek způsobil, že se prosadili konkurenti, jako je Anthropic s Claudem a Google s Gemini, kteří mají zavedenější vlastní infrastrukturu nebo v případě Googlu vlastní interně vyvinuté čipy TPU.
Problém je umocněn skutečností, že ChatGPT-5 již má plánované datum uvedení na trh a bude vyžadovat ještě větší výpočetní výkon. Odhady průmyslu naznačují, že nový model bude potřebovat dvakrát více energie než jeho předchůdce, což vyvolává vážné pochybnosti o životaschopnosti jeho nasazení za současných tržních podmínek.
Přímý dopad na uživatele a obchodní strategii
Společnost OpenAI zavedla systém priorit, který jednoznačně zvýhodňuje platící účastníky. Interní údaje uniklé agentuře Bloomberg naznačují, že uživatelé, kteří využívají bezplatnou službu, mají až pětkrát delší čekací dobu než před třemi měsíci, zatímco pokročilé funkce, jako je analýza kódu, jsou ve špičce často omezeny.
To kontrastuje s Altmanovými prohlášeními o ChatGPT-4.5, kde sliboval demokratičtější přístup k „transformačním“ funkcím. Nezávislí vývojáři vyjadřují na technických fórech svou frustraci a poukazují na to, že současné omezení brání využití modelu pro konzistentní komerční aplikace.
Společnost Microsoft, hlavní investor OpenAI, vyčlenila dalších 3,5 miliardy dolarů (v přepočtu 83 miliard korun) na rozšíření datových center speciálně zaměřených na generativní AI. Zdroje z odvětví však uvádějí, že i s touto investicí by úplné vyřešení problému mohlo trvat 6-12 měsíců kvůli úzkým místům v dodavatelském řetězci polovodičů.
Krize v oblasti hardwaru také nutí společnost OpenAI přehodnotit strategii integrace mezi GPT-4.5 a GPT-5, potvrdil mluvčí společnosti. Nejpravděpodobnější variantou je, že upřednostní optimalizaci výkonu současného modelu před vyčleněním zdrojů na vývoj jeho nástupce.
Analytici Morgan Stanley odhadují, že tato situace by mohla společnost OpenAI stát 200 až 300 milionů dolarů (4,7 až 7,2 milionů korun) ušlých příjmů v průběhu roku 2024, což je pro společnost, která stále hledá svůj konečný obchodní model na stále konkurenčnějším trhu, významná částka.