Komentář: Rok 2025 měl přinést AI agenty, kteří nahradí lidi. Co se s nimi stalo?

Rok 2025 měl být přelomem pro agentní umělou inteligenci – místo toho přišlo vystřízlivění. Nová studie ukazuje, že i nejlepší AI modely zvládly uspokojivě splnit jen zlomek reálných pracovních zadání.

Letošní rok měl být podle mnoha prognóz rokem agenta: umělé inteligence schopné převzít celé projekty, plánovat úkoly, koordinovat zdroje a podávat profesionální výsledky bez lidského dohledu. Tento humbuk nebyl jen ve vzduchu: Microsoft mluvil o pracovnících s umělou inteligencí.

Skutečnost je prozatím jiná. Nová studie společnosti Scale AI chtěla otestovat, do jaké míry mohou dnešní skvělé modely plnit skutečné pracovní úkoly. Žádné nesrozumitelné benchmarky: testovány byly skutečné projekty na volné noze, které hodnotila skupina 40 porotců, jako by to byli lidští klienti. Jejich rozsah sahal od produktového designu a vývoje videoher až po analýzu dat a vědecké psaní. Pro odborníky, jako je Andrej Karpathy, spoluzakladatel OpenAI, agenti prostě nejsou.

Kolik z těchto úloh by dosáhlo „přijatelné“ úrovně pro běžného zákazníka. Nejlépe si vedl model Manus, který v rozporu se sliby nijak neoslnil: pouze 2,5 % jeho dodávek bylo považováno za přijatelné. Dál už to šlo z kopce: Grok dosáhl 2,1 %, Claude zůstal na podobných číslech, GPT-5 na 1,7 % a Gemini 2.5 Pro skončil poslední s 0,8 %.

Realita plně agentní umělé inteligence v roce 2025. Podle důkazů by méně než tři z každé stovky projektů předložených nejvyspělejšími modely světa prošly filtrem skutečného zákazníka. Není to však tak, že by AI byla k ničemu. Ve skutečnosti je 2,5 % velmi vysoké číslo vzhledem k tomu, odkud pocházíme a jakým tempem se toto odvětví vyvíjí. Skutečné zadání však vyžaduje více než technickou přesnost prokazatelnou v benchmarcích.

Dnešní modely a agenti jsou rychlí, všestranní a stále více koherentní, ale k autonomní práci a lidskému úsudku mají ještě daleko. Neurčují priority, neumějí se dobře orientovat v souvislostech a nerozumějí nuancím a očekáváním.

Navíc je třeba vzít v úvahu, že umělá inteligence se navzdory svému pokroku stále potýká se značnými omezeními, pokud jde o chápání souvislostí a kreativitu. Schopnost interpretovat složité situace a reagovat na ně podobně jako člověk zůstává výzvou. Umělá inteligence dokáže zpracovávat velké množství dat a rychle provádět specifické úkoly, ale emoční inteligenci a empatii, klíčové prvky mnoha lidských interakcí, je stále obtížné replikovat.

Na druhou stranu zavádění umělé inteligence na pracovišti vyvolává etické a bezpečnostní otázky. Jak zajistíme, aby rozhodnutí učiněná umělou inteligencí byla spravedlivá a nestranná? Co se stane, pokud umělá inteligence udělá chybu v kritickém prostředí? To jsou otázky, kterými se technologický průmysl a regulační orgány začínají zabývat.

Ačkoli umělá inteligence urazila dlouhou cestu, stále jsme daleko od budoucnosti, kdy stroje budou moci zcela nahradit člověka při řešení složitých úkolů. Jejich role jako asistenta a podpůrného nástroje však stále roste a jejich vliv na efektivitu a produktivitu je nepopiratelný.

Mnozí z nás si ještě před pár měsíci mysleli, že rok 2025 přinese revoluci, kdy nám agentní umělá inteligence ulehčí život tím, že převezme složité projekty s grácií a autonomií. Dnes ale přichází tvrdé vystřízlivění, a to přímo z pera nové studie společnosti Scale AI. Když jsme se podívali na to, jak si ty nejlepší AI modely vedou v reálných úkolech – mluvím o projektovém designu, analýze dat, zkrátka o věcech, za které byste platili freelancery – výsledky byly zarážející. Nejlepší AI zvládl uspokojivě splnit jen 2,5 % zadání. Vidíme, že AI sice rychle zpracovává data a učí se, ale tam, kde je potřeba skutečný lidský úsudek, schopnost porozumět nuancím a komplexnímu kontextu, tam prostě stále tápe. Nejde jen o technickou přesnost, ale o to „něco navíc“, co z člověka dělá spolehlivého partnera. A to je prozatím doména nás, lidí. Přestože je pokrok nepopiratelný, plná autonomie a nahrazení člověka v komplexních rolích je stále hudbou vzdálené budoucnosti, a to je pro nás dobrá zpráva.

Komentář: Rok 2025 měl přinést AI agenty, kteří nahradí lidi. Co se s nimi stalo?

Zdroje článku

Jaderné zbraně USA blízko nás? Informace z Polska a Litvy se fatálně rozcházejí...

Cena za pasivitu světa: Ruské elity už neskrývají plány na budoucí kolonizaci

Předzvěst konfliktu? USA stahují síly od Íránu a posílají 2 000 mariňáků k Číně...

Diplomatické tání skončilo. Trumpova volební podpora Espriellovi zničila dohody s Bog...

Zásahy z Washingtonu svazují Izraeli ruce. Diplomatické hry s Íránem brzdí tažení...

Klimatizace jako čistička vzduchu. Režim samotného větrání filtruje pyly téměř bez sp...

Ventilátor při teplotách nad 26 stupňů neuleví. Proudící teplý vzduch pouze vysušuje ...

Od testování k trvalému životu: Jak chce NASA do roku 2032 postavit základnu na Měsíc...

Ukrajinská auta v Česku tvrdě narazí: Bez registrace a STK hrozí pokuta 50 000 Kč...

Němečtí politici v Rusku: Nechávají se dvořit Putinovým aparátem

„Jsi šílený, sabotuješ dohodu“: Trump v ostrém hovoru s Netanjahuem stopnul údery na ...

Pozdní procitnutí státu: Stovky mladých Čechů už doplatily na chybějící regulaci krat...

Rusko vyhlásilo historicky první nouzový stav u Moskvy. Lidé museli prchat do krytů...

Putin těží ze západní neschopnosti: Škrty v obraně teď platí Ukrajinci krví

Byla to jejich volba, tvrdí Putin. Rusko hází vinu za stovky raket na Kyjev

Vývojáři totálně pohořeli. Ruská armáda vyřadila algoritmy dronů levnou čmáranicí...

Satelity NASA omylem odkryly vojenské cíle. Data jsou navíc všem dostupná

Zničené lesy a pokuty za tisíce. Češi kvůli hřebenům přicházejí o borůvkový ráj...

Vědci nasimulovali 10 scénářů budoucnosti lidstva: Udržitelné jsou pouze dva

Sovětská zbraň zkázy znovu ožívá. Čína tajně vyvíjí neviditelné monstrum

Tesla v Evropě vyklízí pole. Čínští výrobci se spojují s Mercedesem i Volkswagenem...

Odsaje 200 tun vody za sekundu. Pod Tokiem funguje obří lapač záplav

Klíč zasunutý v zámku může v případě požáru nebo nehody vytvořit nebezpečnou past...

Čínská dálnice s 50 pruhy je fikce: Skutečný rekord patří USA

Vrací se El Niňo s extrémní silou: V roce 1877 jeho hladomor zabil 50 milionů lidí...

Putin prověřuje sousedy. Levné ruské drony od...

Střely Cirkon v dosahu Londýna. Rusko zbraněm...

Společně proti vesmíru: Američané, Evropané i...

Revoluce ve stomatologii: Vědci dokážou vypěs...

Zapomenutá fronta za Gibraltarem. Zatímco Evr...

Zaspali jsme ruskou hrozbu. Proč Evropa ignor...

Každý stupeň pod 23 °C zvyšuje spotřebu klima...

Vaše domácí kamera může špehovat i vás. Stačí...

Amerika prodává kusy své soběstačnosti Číně. ...

Budoucnost je tady: Roboti vám uvaří i uklidí...

Zničená poliklinika a hořící domy. Ruský nále...

Sbohem, věrný společníku: Proč musíte vyhodit...

Komentář: Rok 2025 měl přinést AI agenty, kteří nahradí lidi. Co se s nimi stalo?

Související článek

Komentář: Sex ve vesmíru? Věda zatím ani neví, jak na to

Zdroje článku