Čína postavila konkurenci pro ChatGPT. A západní firmy začínají panikařit

Čína postavila konkurenci pro ChatGPT. A západní firmy začínají panikařit

Zdroj obrázku: MamunSheikh / Depositphotos

Čínský startup DeepSeek tvrdí, že překonal ChatGPT s rozpočtem jen 273 000 eur. Jeho vlajkový model R1 však čelí vážným obviněním z cenzury a ideologické předpojatosti – a svět začíná být na pozoru.


Technologický vývoj zahrnuje integraci umělé inteligence. Před třemi lety byl ChatGPT spíše pojmem zahaleným neznámou než jistotou, protože znalost její existence byla omezena na vyznavače technologického sektoru. Nyní je z něj gigant s více než 700 miliony uživatelů měsíčně. Není tedy divu, že země jako Čína pracují na domácí verzi této myšlenky.

Čína, známá rychlým zaváděním a vývojem pokročilých technologií, stojí v čele vytváření modelů umělé inteligence, které konkurují západním gigantům. Právě na tomto pozadí se objevil DeepSeek, startup zabývající se umělou inteligencí, který upoutal pozornost celého světa. Jen několik dní po jeho oznámení se giganti jako Nvidia rozloučili s miliardami eur, protože vývojáři modelů AI DeepSeek prohlásili, že dokázali zlepšit výkon ChatGPT investováním mnohem menšího kapitálu než OpenAI. Nyní, o půl roku později, členové DeepSeek opět vyzdvihují zásluhy, které stojí za jejich výtvorem.

Kolik peněz investovala Čína?

Podle členů čínského startupu nebyly náklady na R1 (vlajkový model DeepSeek) ani 300 000 eur (asi 7,3 milionu korun), protože do vývoje své umělé inteligence investovali 273 000 eur (asi 6,6 milionu Kč). Tato informace pochází z akademického časopisu Nature, který se stal dějištěm prvního veřejného prohlášení společnosti DeepSeek k této záležitosti. Tento údaj však čelně koliduje s informacemi, které jsme měli k dispozici doposud, neboť Čína tvrdila, že do tréninku modelů umělé inteligence společnosti DeepSeek bylo investováno 5 milionů eur (asi 121 milionů korun).

Související článek

Když technologie selžou: Švédské školy se vracejí k papíru a knihám
Když technologie selžou: Švédské školy se vracejí k papíru a knihám

Švédsko po letech digitálního experimentu přehodnocuje svou cestu – výměna učebnic za tablety vedla ke zhoršení výsledků žáků. Ve světle nových dat se znovu otevírá debata o tom, jakou roli by technologie měly ve vzdělávání hrát – a zda by neměly být pouze doplňkem, nikoliv náhradou tradiční výuky.

R1 je na rozdíl od jiných populárních modelů v tomto odvětví produktem zaměřeným na uvažování. Jako takový byl trénován na 512 čipech Nvidia H800 po dobu 80 hodin, ale členové společnosti DeepSeek přiznávají, že se spoléhali i na použití čipů A100 poté, co to několik měsíců popírali. Náklady ve výši 273 000 eur, pokud jsou pravdivé, kontrastují s tréninkem modelů, jako je ChatGPT, neboť Sam Altman v roce 2023 přiznal, že na trénink modelů umělé inteligence OpenAI bylo třeba investovat více než 100 milionů eur (asi 2,4 miliardy korun).

Odhalení společnosti DeepSeek proto oživuje debatu o postavení Číny v globálním závodě o umělou inteligenci. Při pohledu na možnosti nízkonákladového modelu se globální trh otřásl a přiměl investory prodávat své technologické akcie, aby se vyhnuli odvetě v podobě změny vedení v odvětví. Nyní, poté co se technologické zemětřesení DeepSeek stabilizovalo, společnost znovu potvrdila, že používá přesné techniky k udržení co nejnižších nákladů. Jako taková narážela na jevy, jako je destilace modelů, což je technika, která umožňuje, aby se jeden model učil z jiného.

Svět je vůči DeepSeek nedůvěřivý

Navzdory rozruchu, který vyvolala publikace časopisu Nature kvůli zmínce o ekonomických nákladech, se zprávy o DeepSeek vyznačují ještě jedním kontroverzním aspektem: možnou cenzurou čínské umělé inteligence. Zjištění společnosti CrowdStrike, která před necelým rokem přivedla svět na buben, když utrpěla havárii, při níž zkolabovala letiště a nemocnice, odhalila, že kvalita kódu DeepSeek závisí na faktorech, které jsou v souladu se zájmy čínské vlády. To jinými slovy znamená, že R1 mění své přednosti v závislosti na ideologii.

Aby společnost CrowdStrike ověřila svou hypotézu, zadala několik požadavků v angličtině pro různá použití a regiony. Zjistila, že žádost o kódy pro průmyslové řídicí systémy vrátila chyby ve 22,8 % odpovědí, přičemž toto číslo vzrostlo na 42,1 %, pokud jste uvedli, že kód je pro jakoukoli skupinu Islámského státu. Ve skutečnosti dotaz na kód určený pro regiony, jako je Tchaj-wan, Falun Gong nebo Tibet, zvýšil produkci chybných zpráv.

Společnost CrowdStrike během svého výzkumu zjistila, že DeepSeek odmítl pomoc v 61 % případů spojených s Islámským státem, což naznačuje možnou cenzuru, ale také ve 45 % případů, pokud byla pomoc zaměřena na Falun Gong. Pro firmu zabývající se kybernetickou bezpečností je to s největší pravděpodobností strategie, jak sladit umělou inteligenci s politickou linií Komunistické strany Číny, a proto by se neštítila sabotovat některé skupiny, které nejsou ve shodě s vládou. To však není jediné vysvětlení, které je na stole.

Přesah do politické situace

Poté, co poukázali na hypotézu Komunistické strany Číny, také tvrdí, že tréninková data obsahují méně kvalitní materiál v marginalizovaných regionech, což je možnost, která by mohla vysvětlit špatný výkon DeepSeek za určitých okolností. Společnost CrowdStrike totiž zjistila, že naopak nejbezpečnější kód byl generován pro Spojené státy, což dávají do souvislosti se snahou získat podíl na trhu v USA. Zároveň také poukazují na možnost, že se engine může rozhodnout „zhoršit“ kód záměrně v konfliktních oblastech.

Není to tedy poprvé, co čínský původ DeepSeek vyvolává obavy mezi společnostmi nebo vládami, neboť Spojené státy již vyzvaly své občany, aby čínskou umělou inteligenci nepoužívali. Kromě toho se k práci DeepSeek stavělo odmítavě i Německo, které dokonce požádalo společnosti Google a Apple, aby aplikaci stáhly kvůli nelegálnímu přenosu uživatelských dat. Zatímco tedy Asiaté tvrdí, že je trénink jejich hvězdného modelu stál 273 000 eur, výzkumníci CrowdStrike narážejí na cenzuru, která zasahuje do výsledků AI.

Rozvoj umělé inteligence v Číně a její rostoucí vliv na globální trh vyvolává důležité otázky týkající se etiky, transparentnosti a bezpečnosti těchto systémů. S rozvojem této technologie bude zásadní, aby společnosti a vlády spolupracovaly a zajistily, že tyto nástroje budou používány zodpovědně a spravedlivě.

Zdroje článku

reuters.com, techspot.com
#