Samsung vyvinul miniAI, která poráží i ty největší giganty

Samsung překvapil svět umělé inteligence modelem TRM – drobným rekurzivním systémem s pouhými 7 miliony parametry. Přesto dokázal porazit mnohem větší jazykové modely v komplexních logických úlohách a ukázal, že budoucnost AI nemusí být nutně o velikosti, ale o chytrosti architektury.

Divize fotoaparátů společnosti Samsung sice v současné době postrádá převratné inovace, ale to se nedá říct o jejím pokroku v oblasti umělé inteligence. Jasně to dokazuje její nejnovější model umělé inteligence, který překonal některé jiné velké jazykové modely (LLM), které jsou přibližně 10 000krát větší!

V přelomovém článku nazvaném Méně je více společnost Samsung představila inovativní architekturu svého nového drobného rekurzivního modelu (TRM). Tento model je založen na kompaktní dvouvrstvé struktuře:

TRM je pozoruhodně malý, má pouhých 7 milionů parametrů ve srovnání s miliardami parametrů, kterými jsou naplněny velké LLM.
Model využívá svůj vlastní výstup k určení svých následných kroků, čímž vytváří sebezdokonalující se smyčku zpětné vazby.
Iterativním zpracováním každého výstupu může model napodobovat mnohem hlubší architekturu, aniž by s tím byly spojeny paměťové nebo výpočetní náklady.
S každým rekurzivním cyklem model zpřesňuje své předpovědi nebo výsledky, čímž zvyšuje přesnost a efektivitu.

Přístup společnosti Samsung je podobný tomu, jako když člověk znovu čte svůj vlastní návrh a při každém průchodu opravuje chyby. Tato metoda se ukazuje jako lepší než tradiční přístupy, kdy LLM často selhávají v logických problémech, pokud je jediný krok chybný, což způsobí kolaps celého procesu uvažování. Přestože řetězení myšlenek může pomoci, zůstává poněkud křehké.

Závěr: Udržujte jednoduchost

Společnost Samsung experimentovala se zvětšováním počtu vrstev modelu, ale zjistila, že to vede ke snížení generalizace v důsledku nadměrného přizpůsobení. Naopak snížení počtu vrstev při současném zvýšení počtu rekurzí výrazně zlepšilo celkový výkon modelu TRM.

Výsledky:

V případě modelu Sudoku-Extreme byla přesnost 87,4 %, zatímco u hierarchických modelů uvažování to bylo jen 55 %.
85procentní přesnost u hádanek Maze-Hard.
45procentní přesnost u ARC-AGI-1.
8procentní přesnost u ARC-AGI-2.

Pozoruhodné je, že TRM společnosti Samsung buď překonává, nebo se těsně vyrovná výkonnosti různých LLM, včetně DeepSeek R1, Gemini 2.5 Pro společnosti Google a o3-mini společnosti OpenAI, přestože využívá jen nepatrný zlomek jejich parametrů. Tento úspěch poukazuje na potenciál kompaktních modelů v umělé inteligenci a zpochybňuje představu, že větší je vždy lepší.

V širším kontextu by úspěch společnosti Samsung s modelem TRM mohl vydláždit cestu k efektivnějším modelům AI, které budou nejen nákladově efektivní, ale také šetrné k životnímu prostředí, protože budou vyžadovat méně výpočetního výkonu a energie. To by mohlo mít významné důsledky pro budoucnost vývoje umělé inteligence, díky čemuž by se pokročilé technologie umělé inteligence staly dostupnějšími a udržitelnějšími.

Samsung vyvinul miniAI, která poráží i ty největší giganty

Zdroje článku

Čínský algoritmus tvrdí, že sledoval americké letouny B-2 během ...

NASA analyzuje návrat jevu El Niño Godzilla, který zásadně změní počasí na celé planetě

Americký radarový štít v Asii má trhliny a Kim Čong-un toho využívá k nasazení jaderného torpédoborce

Březnový zvrat: Od víkendu se vrací sníh až do nížin, noční teploty spadnou pod nulu

Čínský algoritmus tvrdí, že sledoval americké letouny B-2 během útoku na Írán: zveřejnil i zvukový záznam

Dokumenty

Samsung vyvinul miniAI, která poráží i ty největší giganty

Související článek

Americký štít C-RAM v akci: Automatický kanon vypálí tisíce střel za minutu a tvoří neprostupnou zeď

Zdroje článku

Dokumenty