DeepSeek představil model V3.1, který se má stát postrachem Západu

DeepSeek představil model V3.1, který se má stát postrachem Západu

Zdroj obrázku: maxxyustas / Depositphotos

Společnost DeepSeek dělá krok vpřed tím, že naznačuje novou cestu pro čínský software i hardware.


Když se DeepSeek objevil, působilo to jako vstup slona do obchodu s porcelánem, tedy vzrušující bitva o hegemonii globální AI, kterou do té doby ovládal (alespoň v očích galerie) Západ v rukou ChatGPT. Nuže, DeepSeek je zpět s verzí 3.1 a přichází s varováním: je připraven na novou generaci čínských čipů.

Toto prohlášení sice samo o sobě nepředstavuje revoluci na trhu, ale jasně a nahlas říká, jakým směrem se ubírá: směrem, který není pro NVIDII a výrobce mimo asijskou zemi zrovna pohodlný. Pokud se totiž tento vztah s čínským hardwarem zhmotní ve výkonu, změní se tyto rozhovory o tom, kdo pohání umělou inteligenci v Číně.

Související článek

Milion robotů na poštovní známce. Nový průlom mění svět mikrotechnologie
Milion robotů na poštovní známce. Nový průlom mění svět mikrotechnologie

Tým amerických vědců představil roboty menší než zrnko soli, kteří se dokáží sami rozhodovat, pohybovat a vnímat okolí bez vnější kontroly. Jde o zásadní milník v miniaturizaci, který otevírá nové možnosti v medicíně, výrobě i výzkumu na buněčné úrovni.

Jak se vysvětluje v tiskové zprávě společnosti, verze V 3.1 debutuje hybridním odvozováním podobným GPT-5 – tedy jedním systémem se dvěma cestami: hlubokým uvažováním a rychlou odezvou, které lze zvolit přepínačem ve webové i aplikační verzi. A tím to nekončí: společnost zdůrazňuje, že verze pro přemýšlení získává odpovědi za kratší dobu než její předchůdce.

Nový model pro nové čipy vyrobené v Číně

Společnost DeepSeek na svých sociálních sítích dává jasně najevo, pro koho je tento nový model určen, a to připnutou zprávou: „UE8M0 FP8 je pro novou generaci domácích čipů“. Mezi řádky lze vyčíst, že upravila formát dat pro novou generaci čínských čipů. A nezůstalo to bez povšimnutí: agentury Bloomberg i Reuters shrnuly, že verze V3.1 je „přizpůsobena pro práci s čínskými čipy příští generace AI“, tj. optimalizována pro domácí ekosystém.

Oficiální stránka modelu Hugging Face podrobně uvádí, že DeepSeek-V3.1 „byl vycvičen pomocí škálovacího formátu UE8M0 FP8“, z čehož vyplývá, že jak trénování, tak provádění je přizpůsobeno pro nativní běh. Na technické úrovni je FP8 8bitový formát, který má poloviční hmotnost než FP16/BF16. Při správné kalibraci a této nativní podpoře by umožnil vyšší výkon na cyklus a menší spotřebu paměti.

A co NVIDIA?

Stojí za to připomenout, že podle údajů z minulého fiskálního roku tvořila Čína přibližně 13 % příjmů americké společnosti. Dává smysl, že se asijský krajíc tohoto koláče zmenší, což odsunuje klasickou kombinaci GPU + CUDA ekosystému NVIDIA stranou ve prospěch těchto domácích řešení s UE8M0 FP8, pokud se jim bude dařit.

To samo o sobě naznačuje obrat událostí, ale hodně záleží na kontextu: vzhledem k tomu, že USA zavedly kontroly vývozu, čímž se snaží zablokovat přístup Číny ke špičkovým technologiím, působí tento scénář jako katalyzátor směrem k soběstačnosti. Dobrým příkladem, který vystihuje situaci, je případ čipu H20 společnosti NVIDIA, který Trumpova administrativa nejprve zablokovala a poté s podmínkami povolila. Tváří v tvář nepříznivému, měnícímu se a nestabilnímu politickému prostředí směřuje čínský průmysl k nezávislosti.

Podle Financial Times se společnost DeepSeek již dříve pokusila svůj připravovaný model R2 oficiálně trénovat s čipy Huawei Ascend, ale narazila na technické problémy, což ji přimělo vrátit se k tréninku s NVIDIA a zároveň pokračovat v prohlubování podpory inference. Tato situace jasně ukazuje jednu věc: migrace všech procesů není snadná a vyžaduje mimo jiné čas. Přesto společnost potvrdila své přizpůsobení pro nadcházející čínské čipy razantním způsobem.

To je o to důležitější, když si uvědomíme, kde DeepSeek soutěží. Platforma MathArena spojená se Švýcarským federálním technologickým institutem v Curychu, která testuje modely v reálných matematických soutěžích, vyzdvihuje ve svých testech GPT-5 jako celkového vítěze, ale DeepSeek-v3.1 (Think) je o něco pozadu.

#