Samsung vyvinul miniAI, která poráží i ty největší giganty

Samsung vyvinul miniAI, která poráží i ty největší giganty

Zdroj obrázku: Joeppoulssen / Depositphotos

Samsung překvapil svět umělé inteligence modelem TRM – drobným rekurzivním systémem s pouhými 7 miliony parametry. Přesto dokázal porazit mnohem větší jazykové modely v komplexních logických úlohách a ukázal, že budoucnost AI nemusí být nutně o velikosti, ale o chytrosti architektury.

Divize fotoaparátů společnosti Samsung sice v současné době postrádá převratné inovace, ale to se nedá říct o jejím pokroku v oblasti umělé inteligence. Jasně to dokazuje její nejnovější model umělé inteligence, který překonal některé jiné velké jazykové modely (LLM), které jsou přibližně 10 000krát větší!

V přelomovém článku nazvaném Méně je více společnost Samsung představila inovativní architekturu svého nového drobného rekurzivního modelu (TRM). Tento model je založen na kompaktní dvouvrstvé struktuře:

  1. TRM je pozoruhodně malý, má pouhých 7 milionů parametrů ve srovnání s miliardami parametrů, kterými jsou naplněny velké LLM.
  2. Model využívá svůj vlastní výstup k určení svých následných kroků, čímž vytváří sebezdokonalující se smyčku zpětné vazby.
  3. Iterativním zpracováním každého výstupu může model napodobovat mnohem hlubší architekturu, aniž by s tím byly spojeny paměťové nebo výpočetní náklady.
  4. S každým rekurzivním cyklem model zpřesňuje své předpovědi nebo výsledky, čímž zvyšuje přesnost a efektivitu.

Přístup společnosti Samsung je podobný tomu, jako když člověk znovu čte svůj vlastní návrh a při každém průchodu opravuje chyby. Tato metoda se ukazuje jako lepší než tradiční přístupy, kdy LLM často selhávají v logických problémech, pokud je jediný krok chybný, což způsobí kolaps celého procesu uvažování. Přestože řetězení myšlenek může pomoci, zůstává poněkud křehké.

Související článek

Milion robotů na poštovní známce. Nový průlom mění svět mikrotechnologie
Milion robotů na poštovní známce. Nový průlom mění svět mikrotechnologie

Tým amerických vědců představil roboty menší než zrnko soli, kteří se dokáží sami rozhodovat, pohybovat a vnímat okolí bez vnější kontroly. Jde o zásadní milník v miniaturizaci, který otevírá nové možnosti v medicíně, výrobě i výzkumu na buněčné úrovni.

Závěr: Udržujte jednoduchost

Společnost Samsung experimentovala se zvětšováním počtu vrstev modelu, ale zjistila, že to vede ke snížení generalizace v důsledku nadměrného přizpůsobení. Naopak snížení počtu vrstev při současném zvýšení počtu rekurzí výrazně zlepšilo celkový výkon modelu TRM.

Výsledky:

  1. V případě modelu Sudoku-Extreme byla přesnost 87,4 %, zatímco u hierarchických modelů uvažování to bylo jen 55 %.
  2. 85procentní přesnost u hádanek Maze-Hard.
  3. 45procentní přesnost u ARC-AGI-1.
  4. 8procentní přesnost u ARC-AGI-2.

Pozoruhodné je, že TRM společnosti Samsung buď překonává, nebo se těsně vyrovná výkonnosti různých LLM, včetně DeepSeek R1, Gemini 2.5 Pro společnosti Google a o3-mini společnosti OpenAI, přestože využívá jen nepatrný zlomek jejich parametrů. Tento úspěch poukazuje na potenciál kompaktních modelů v umělé inteligenci a zpochybňuje představu, že větší je vždy lepší.

V širším kontextu by úspěch společnosti Samsung s modelem TRM mohl vydláždit cestu k efektivnějším modelům AI, které budou nejen nákladově efektivní, ale také šetrné k životnímu prostředí, protože budou vyžadovat méně výpočetního výkonu a energie. To by mohlo mít významné důsledky pro budoucnost vývoje umělé inteligence, díky čemuž by se pokročilé technologie umělé inteligence staly dostupnějšími a udržitelnějšími.

Zdroje článku

arxiv.org, medium.com
#