Samsung vyvinul miniAI, která poráží i ty největší giganty

Samsung vyvinul miniAI, která poráží i ty největší giganty

Zdroj obrázku: Joeppoulssen / Depositphotos

Samsung překvapil svět umělé inteligence modelem TRM – drobným rekurzivním systémem s pouhými 7 miliony parametry. Přesto dokázal porazit mnohem větší jazykové modely v komplexních logických úlohách a ukázal, že budoucnost AI nemusí být nutně o velikosti, ale o chytrosti architektury.

Divize fotoaparátů společnosti Samsung sice v současné době postrádá převratné inovace, ale to se nedá říct o jejím pokroku v oblasti umělé inteligence. Jasně to dokazuje její nejnovější model umělé inteligence, který překonal některé jiné velké jazykové modely (LLM), které jsou přibližně 10 000krát větší!

V přelomovém článku nazvaném Méně je více společnost Samsung představila inovativní architekturu svého nového drobného rekurzivního modelu (TRM). Tento model je založen na kompaktní dvouvrstvé struktuře:

  1. TRM je pozoruhodně malý, má pouhých 7 milionů parametrů ve srovnání s miliardami parametrů, kterými jsou naplněny velké LLM.
  2. Model využívá svůj vlastní výstup k určení svých následných kroků, čímž vytváří sebezdokonalující se smyčku zpětné vazby.
  3. Iterativním zpracováním každého výstupu může model napodobovat mnohem hlubší architekturu, aniž by s tím byly spojeny paměťové nebo výpočetní náklady.
  4. S každým rekurzivním cyklem model zpřesňuje své předpovědi nebo výsledky, čímž zvyšuje přesnost a efektivitu.

Přístup společnosti Samsung je podobný tomu, jako když člověk znovu čte svůj vlastní návrh a při každém průchodu opravuje chyby. Tato metoda se ukazuje jako lepší než tradiční přístupy, kdy LLM často selhávají v logických problémech, pokud je jediný krok chybný, což způsobí kolaps celého procesu uvažování. Přestože řetězení myšlenek může pomoci, zůstává poněkud křehké.

Související článek

Americký štít C-RAM v akci: Automatický kanon vypálí tisíce střel za minutu a tvoří neprostupnou zeď
Americký štít C-RAM v akci: Automatický kanon vypálí tisíce střel za minutu a tvoří neprostupnou zeď

V moderních konfliktech existuje zvuk, který vojáci nikdy nezapomenou. Kovový řev obranného systému C-RAM totiž znamená jediné – někde nad hlavou právě ničí přilétající rakety.

Závěr: Udržujte jednoduchost

Společnost Samsung experimentovala se zvětšováním počtu vrstev modelu, ale zjistila, že to vede ke snížení generalizace v důsledku nadměrného přizpůsobení. Naopak snížení počtu vrstev při současném zvýšení počtu rekurzí výrazně zlepšilo celkový výkon modelu TRM.

Výsledky:

  1. V případě modelu Sudoku-Extreme byla přesnost 87,4 %, zatímco u hierarchických modelů uvažování to bylo jen 55 %.
  2. 85procentní přesnost u hádanek Maze-Hard.
  3. 45procentní přesnost u ARC-AGI-1.
  4. 8procentní přesnost u ARC-AGI-2.

Pozoruhodné je, že TRM společnosti Samsung buď překonává, nebo se těsně vyrovná výkonnosti různých LLM, včetně DeepSeek R1, Gemini 2.5 Pro společnosti Google a o3-mini společnosti OpenAI, přestože využívá jen nepatrný zlomek jejich parametrů. Tento úspěch poukazuje na potenciál kompaktních modelů v umělé inteligenci a zpochybňuje představu, že větší je vždy lepší.

V širším kontextu by úspěch společnosti Samsung s modelem TRM mohl vydláždit cestu k efektivnějším modelům AI, které budou nejen nákladově efektivní, ale také šetrné k životnímu prostředí, protože budou vyžadovat méně výpočetního výkonu a energie. To by mohlo mít významné důsledky pro budoucnost vývoje umělé inteligence, díky čemuž by se pokročilé technologie umělé inteligence staly dostupnějšími a udržitelnějšími.

Zdroje článku

arxiv.org, medium.com
#