Mistral Devstral 2: Nový kódovací AI model, který překvapuje velikostí i silou

Mistral Devstral 2: Nový kódovací AI model, který překvapuje velikostí i silou

Zdroj obrázku: sdecoret / Depositphotos

Francouzská Mistral AI představila Devstral 2 – otevřený model pro asistované programování, který i přes kompaktní velikost překonává mnohé konkurenty. Evropě se tak daří vstoupit do první ligy vývoje AI a nabízet důstojnou alternativu k americkým i čínským gigantům.


V roce 2023 našly OpenAI a ChatGPT svého konkurenta v Evropě: francouzská společnost Mistral AI uvedla na trh svou novou umělou inteligenci. Nyní společnost představila svůj nový model, který vyniká otevřeností ve stylu známých modelů z Číny, jako je DeepSeek. Nový Devstral 2 je prezentován jako „nejmodernější otevřený kódovací model a agent CLI (rozhraní příkazového řádku)“. Jak vysvětlují oficiální webové stránky:

Je k dispozici ve dvou velikostech: Devstral 2 (123B) a Devstral Small 2 (24B). Devstral 2 je šířen pod upravenou licencí MIT, zatímco Devstral Small 2 používá Apache 2.0. Oba jsou open source a mají permisivní licence pro urychlení distribuované umělé inteligence.

Jak připomíná Xataka, elitou otevřených modelů pro asistované programování se staly modely z Číny (kromě DeepSeek jsou to Kimi a Qwen). Příchodem Devstralu 2 se Mistral stává, jako evropská společnost, skutečným soupeřem v oblasti, která se dosud zdála být vyhrazena jiným„.

Devstral 2 překonává přední světové technologie

V ověřených údajích SWE-Bench, které společnost zveřejnila, dosáhl Devstral 2 skóre 72,2 %. Při pohledu na výkon je jen o něco málo nižší než DeepSeek V3.2 a poráží Kimi K2 Thinking, což jsou oba otevřené modely jako návrh Mistral.

Související článek

Čtyři dny práce, pět dní života navíc. AI otevírá dveře pracovní revoluci
Čtyři dny práce, pět dní života navíc. AI otevírá dveře pracovní revoluci

Rok 2026 může být zlomem pro budoucnost práce – umělá inteligence se stává nástrojem nejen efektivity, ale i rovnováhy. Model 100-80-100 nabízí realistickou cestu ke čtyřdennímu pracovnímu týdnu bez ztráty produktivity – a možná i klíč ke smíření lidí s AI.

Jeho Devstral 2 se tak umisťuje na silném druhém místě. Z amerických technologií jsou nejvýkonnější proprietární software (Gemini, GPT 5, Claude a Grok). Navíc se ukazuje, že umělá inteligence Grok Elona Muska je ve srovnání s evropskými technologiemi nedostatečně výkonná.

SWE-Bench se zaměřuje na hodnocení schopnosti systémů AI zvládat složité a autonomní úkoly. „Hodnocení AI v softwarovém inženýrství je obzvláště náročné vzhledem ke komplexní povaze kódovacích problémů a potřebě přesného hodnocení generovaných řešení,“ jak vysvětluje OpenAI.

Jak dodává Xataka, SWE-Bench Verified je test určený k vyhodnocení, zda model dokáže řešit skutečné programovací úlohy. „Cílem hodnocení je změřit, zda systém rozumí struktuře projektu, identifikuje příčinu problému a navrhuje koherentní řešení.“

Menší velikost bez kompromisů

Modely Devstral 2 (123B) a Devstral Small 2 (24B) jsou 5krát a 28krát menší než DeepSeek V3.2 a 8krát a 41krát menší než Kimi K2. Podle společnosti to dokazuje, že kompaktní modely se mohou vyrovnat mnohem větším konkurentům nebo je dokonce předčí. Díky jejich malým rozměrům je lze snadno nasadit na omezeném hardwaru, což snižuje bariéry pro vývojáře, malé firmy a amatérské uživatele„.

Sleduje závislosti na frameworcích, odhaluje chyby a opakuje pokusy s opravami, což řeší problémy, jako je oprava chyb. „Model lze vyladit tak, aby upřednostňoval konkrétní jazyky nebo byl optimalizován pro velké podnikové kódové báze,“ uvedl.

Společnost Mistral vyhodnotila Devstral 2 oproti DeepSeek V3.2 a Claude Sonnet 4.5 pomocí lidských hodnocení nezávislým poskytovatelem anotací, přičemž úlohy byly strukturovány pomocí Cline.

Devstral 2 vykazuje jasnou převahu nad DeepSeek V3.2 s mírou úspěšnosti 42,8 % oproti míře neúspěšnosti 28,6 %. Claude Sonnet 4.5 však zůstává výrazně preferován, což ukazuje na přetrvávající rozdíl oproti modelům s uzavřeným zdrojovým kódem.“

Význam open source v oblasti umělé inteligence

Přístup společnosti Mistral AI k otevřenému zdrojovému kódu nejen demokratizuje přístup k pokročilé umělé inteligenci, ale také podporuje inovace založené na spolupráci. Tím, že společnost uvolňuje své technologie pod permisivními licencemi, umožňuje globální komunitě vývojářů přispívat k modelu a vylepšovat jej, čímž vytváří pozitivní zpětnou vazbu, která urychluje technologický pokrok. Tento přístup má zásadní význam v době, kdy umělá inteligence mění celá průmyslová odvětví, od zdravotnictví po automobilový průmysl.

Kromě toho by otevřený zdrojový kód modelu Devstral 2 mohl být klíčovým faktorem pro jeho přijetí vládami a organizacemi, které usilují o transparentnost a kontrolu nad nástroji AI, které používají. Ve světě, kde jsou soukromí a bezpečnost dat stále důležitější, nabízí open source atraktivní alternativu k proprietárním řešením.

Dopad na globální trh s umělou inteligencí

Zavedení Devstralu 2 na globální trh s AI by mohlo mít významné důsledky. Tím, že Devstral 2 nabízí konkurenceschopný výkon při zlomku velikosti svých konkurentů, zpochybňuje představu, že pouze největší modely mohou být nejefektivnější. To by mohlo vést k přehodnocení strategií vývoje AI po celém světě a podpořit efektivnější a udržitelnější přístup.

Devstral 2 představuje nejen významný technologický průlom pro Evropu, ale mohl by být také katalyzátorem změn ve způsobu vývoje a nasazení umělé inteligence na celém světě.

Zdroje článku

mistral.ai, openai.com
#