Rok 2025 představuje klíčový milník ve vývoji umělé inteligence, když startup Anthropic uvádí na trh novou generaci svých modelů, které se již nyní řadí na špičku v tomto odvětví a vyzývají giganty, jako jsou OpenAI a Google.
Společnost Anthropic uvedla na trh dlouho očekávanou řadu Claude 4, která se skládá z modelů Claude Opus 4 a Claude Sonnet 4 (třetí řada Claude, Haiku, lehčí, ale s menší kontextovou kapacitou, si bude muset na upgrade ještě chvíli počkat). Tyto modely, představené během první vývojářské konference („Code with Claude“), slibují posunout spolupráci člověka a stroje na novou úroveň, zejména ve třech oblastech: programování, komplexní uvažování a využívání autonomních agentů. Oznámení Claude 4 přichází v době, kdy své nabídky generativních modelů zintenzivnili i konkurenti, jako jsou OpenAI, Google a Microsoft.
Nový standard v oblasti jazykových modelů
Claude Opus 4, klenot v koruně společnosti Anthropic, je svými vývojáři označován za „nejlepší kódovací model na světě“, což je z marketingového hlediska očekávatelné tvrzení, které však zřejmě potvrzují výsledky v benchmarcích, jako jsou SWE-bench (72,5 %) a Terminal-bench (43,2 %). Tyto výsledky naznačují výrazné zlepšení schopnosti modelu pochopit a efektivně generovat kód, což z něj činí neocenitelný nástroj pro vývojáře, kteří chtějí optimalizovat své pracovní postupy.
Podle společnosti již model není pouhým nástrojem pro automatické dokončování, ale inteligentním spolupracovníkem, který je schopen vést rozhovory, uvažovat, provádět složité úlohy a udržovat kontextovou paměť. Tato kontextová paměť je pro programátorské úlohy klíčová, protože umožňuje modelu zapamatovat si předchozí interakce a využít je ke zvýšení přesnosti svých návrhů.
Introducing the next generation: Claude Opus 4 and Claude Sonnet 4.
Claude Opus 4 is our most powerful model yet, and the world’s best coding model.
Claude Sonnet 4 is a significant upgrade from its predecessor, delivering superior coding and reasoning. pic.twitter.com/MJtczIvGE9
— Anthropic (@AnthropicAI) May 22, 2025
Ve skutečnosti je tento model speciálně navržen tak, aby mohl provádět složité úlohy po celé hodiny, aniž by ztratil soudržnost nebo výkon, což je pozoruhodný pokrok oproti předchozím generacím, které dokázaly udržet výkon sotva hodinu nebo dvě.
Například společnost Rakuten zveřejnila, že použila Opus 4 k autonomnímu refaktoringu kódu po dobu sedmi hodin v kuse s vysokým výkonem. Tento druh autonomie je klíčový pro společnosti, které zpracovávají velké objemy kódu a potřebují efektivní řešení pro údržbu a zlepšování svých systémů.
Claude Sonnet 4 je výraznou evolucí svého předchůdce 3.7 (čímž je odůvodněno jeho přečíslování): dosahuje 72,7 % v benchmarku SWE-bench a nabízí lepší odezvu na složité instrukce a větší stabilitu v každodenních úlohách. Tato stabilita je zásadní pro vývojáře, kteří se při každodenních úlohách spoléhají na nástroje umělé inteligence a zajišťuje, že model zvládne různé úlohy, aniž by došlo ke snížení výkonu.
Přední společnosti, jako jsou GitHub, Replit, Cursor, Rakuten a Block, již tyto modely integrují do svých produktů. Například společnost GitHub použije Claude Sonnet 4 jako základ pro svého nového kódovacího agenta v systému Copilot. Tato integrace podtrhuje důvěru, kterou mají významné technologické platformy ve schopnosti modelů Anthropic.
Rozšířené myšlení a používání nástrojů
Jednou z nejvýznamnějších novinek je zavedení režimu „rozšířeného myšlení s využitím nástrojů“, kdy modely mohou přepínat mezi interním uvažováním a využitím externích nástrojů, jako je například vyhledávání na webu. Tato schopnost umožňuje modelům nejen generovat odpovědi na základě jejich předchozího školení, ale také je aktualizovat a přizpůsobovat novým informacím v reálném čase.
Tato funkce umožňuje sofistikovanější řešení problémů a kombinuje kroky uvažování s praktickými akcemi, jako je spouštění kódu nebo parsování souborů. Vývojář může například požádat model, aby vyhledal nejnovější dokumentaci k rozhraní API, a poté na základě těchto informací vygenerovat část kódu, která toto rozhraní API implementuje.
Oba modely navíc mohou paralelně používat více nástrojů, přistupovat k místním souborům a vytvářet a udržovat kontextovou paměť v průběhu času, což zlepšuje jejich výkonnost u dlouhých, kontinuálních projektů. Tato schopnost multitaskingu je užitečná zejména v prostředí společného vývoje, kde může probíhat více procesů současně.
Claude Code: nový programovací agent
Spolu s modely zpřístupnila společnost Anthropic svůj nástroj Claude Code, rozhraní určené k integraci s prostředími, jako jsou VS Code a JetBrains, které umožňuje asistované programování přímo v IDE vývojáře. Tato přímá integrace usnadňuje vývojářům přístup k pokročilým možnostem umělé inteligence, aniž by museli měnit pracovní prostředí.
Tento nástroj nejenže navrhuje změny v reálném čase, ale může také pracovat na pozadí prostřednictvím GitHub Actions, reagovat na zpětnou vazbu recenzentů, opravovat chyby CI a spravovat složité vývojové úlohy. Díky tomu je Claude Code komplexním asistentem, který zvládne více aspektů vývojového cyklu softwaru, od psaní kódu až po kontinuální integraci.