OpenAI otevírá brány: Nové modely GPT jsou konečně open source

OpenAI otevírá brány: Nové modely GPT jsou konečně open source

Zdroj obrázku: iama_sing / Depositphotos

Poprvé od vydání GPT-2 vydala společnost OpenAI nové jazykové modely pod open source licencí.


Společnost OpenAI oznámila vydání gpt-oss-120b a gpt-oss-20b, dvou výkonných jazykových modelů s licencí open source (přesněji pod licencí Apache 2.0), které slibují nově definovat hranice výkonu v oblasti uvažování, používání nástrojů a efektivity provozu.

Tímto oznámením se společnost OpenAI vrací do ekosystému otevřených modelů, což je její první příspěvek do této oblasti od uvedení modelu GPT-2 v roce 2019. Rozhodnutí otevřít tyto modely široké veřejnosti je v souladu s cílem demokratizovat přístup k pokročilé umělé inteligenci a umožnit širokému spektru uživatelů, od výzkumníků po nezávislé vývojáře, experimentovat s těmito modely a zlepšovat je.

Oba modely (které jsou nyní k dispozici ke stažení) byly vycvičeny pomocí technik hlubokého učení inspirovaných sofistikovanějšími interními modely OpenAI, jako jsou o3 a o4-mini. Slovy generálního ředitele společnosti OpenAI Sama Altmana,

Související článek

Jeden klik a pár slov: Vznikne svět, kde se realita mísí s fantazií
Jeden klik a pár slov: Vznikne svět, kde se realita mísí s fantazií

Funkce Storybook umožňuje během několika sekund vytvořit personalizované příběhy s ilustracemi a vyprávěním pomocí umělé inteligence.

„Jsme nadšeni, že můžeme tento model – výsledek výzkumu za miliardy dolarů – zpřístupnit světu, aby se umělá inteligence dostala k co největšímu počtu lidí.

Jakýkoli vývojář, organizace nebo země bude moci tyto modely spouštět, upravovat a nasazovat na své vlastní infrastruktuře bez komerčních omezení, což představuje významný krok k vytvoření inkluzivnějšího a spolupracujícího ekosystému AI.

Výkon a efektivita pro všechna prostředí

  • gpt-oss-120b: V úlohách uvažování se vyrovná modelu o4-mini od OpenAI a díky efektivnímu návrhu založenému na směsi expertů (MoE) může běžet na jediném 80GB GPU. Tento přístup umožňuje rozdělit práci mezi více expertů, čímž se optimalizuje využití zdrojů a zvyšuje výkon. Je přístupný výzkumným centrům, univerzitám a startupům se středně pokročilými zdroji.
  • gpt-oss-20b: Je navržen pro zařízení s pouhými 16 GB paměti a v benchmarcích týkajících se témat, jako je zdraví a matematika, dokonce překonává proprietární modely, jako jsou o1 a GPT-4o. Díky své efektivitě a výkonu je ideálním nástrojem pro decentralizovaná prostředí nebo prostředí s omezenou infrastrukturou a umožňuje i skromnějším zařízením spouštět složité úlohy umělé inteligence.

Z hlediska pokročilých schopností oba modely vynikají např:

  • Řetěz myšlenek (Chain-of-Thought, CoT), který umožňuje modelům rozložit složité problémy do lépe zvládnutelných kroků, což zvyšuje přesnost a porozumění.
  • Nativní podpora strukturovaných funkcí a volání nástrojů, jako je vyhledávání na webu nebo spouštění kódu v jazyce Python, což výrazně rozšiřuje praktické využití těchto modelů v každodenních i specializovaných úlohách.
  • Optimalizace pro různé úrovně uvažování (nízká, střední, vysoká) s laděním prostřednictvím jednoduché výzvy, která uživatelům umožňuje přizpůsobit chování modelu svým specifickým potřebám.

Oba modely jsou určeny k přímému použití nebo k vyladění vývojáři podle jejich specifických potřeb, takže jsou ideální jak pro individuální uživatele, tak pro podniky a státní správu. Tato flexibilita je klíčová ve světě, kde se aplikace umělé inteligence musí rychle přizpůsobovat různým kontextům a požadavkům.

Nástroje pro vývojáře

S cílem usnadnit přijetí a odpovědné používání modelů zveřejnila společnost OpenAI také:

  • technické příručky pro „dolaďování“ modelů, které vývojářům poskytují nástroje potřebné k přizpůsobení modelů jejich specifickým potřebám.
  • Integrace s populárními platformami, jako jsou Hugging Face, vLLM, Ollama, llama.cpp a přední prostředí GPU a akcelerátorů, které zajišťují, že uživatelé mohou tyto modely snadno implementovat do svých stávajících systémů.

Tento ekosystém podpory zajišťuje, že týmy všech velikostí, od startupů po velké organizace, mohou začít pracovat s těmito modely od prvního dne, což zkracuje dobu implementace a zvyšuje kontrolu nad jejich nasazením. Snadná integrace a přizpůsobení jsou klíčem k maximalizaci dopadu těchto modelů v různých odvětvích.

Nové bezpečnostní protokoly

Jedním z hlavních bodů této verze je její zaměření na bezpečnost. OpenAI nejenže vyhodnotila své modely v rámci standardních testů, ale vyvinula a zveřejnila specifickou metodiku pro simulaci extrémních scénářů škodlivého použití (tzv. „protokol nejhoršího scénáře„), jako jsou aplikace v biotechnologiích nebo ofenzivní kybernetická bezpečnost.

Tato metodika má zásadní význam pro předvídání a zmírnění potenciálních rizik spojených se zneužitím umělé inteligence.

„Od našeho založení v roce 2015 je posláním OpenAI zajistit, aby umělá obecná inteligence (AGI) přinášela prospěch celému lidstvu. V tomto smyslu nás těší, že svět může stavět na základech otevřené infrastruktury AI, která je vytvořena v USA, je založena na demokratických hodnotách, je volně dostupná a zaměřená na kolektivní prospěch.“

Tímto spuštěním OpenAI nejen potvrzuje svůj závazek k inovacím a dostupnosti, ale také stanovuje nový průmyslový standard pro odpovědný a etický vývoj umělé inteligence.

Zdroje článku

huggingface.co, openai.com
#