Rychlejší než grafická karta: Vědci použili světlo k výpočtům neuronových sítí

Rychlejší než grafická karta: Vědci použili světlo k výpočtům neuronových sítí

Zdroj obrázku: agsandrew / Depositphotos

Vědci z Aalto University vyvinuli metodu, která provádí složité tenzorové výpočty pomocí jediného průchodu světla. Tento objev slibuje revoluci v rychlosti a efektivitě výpočetní techniky, zejména pro aplikace umělé inteligence.


Tenzorové operace tvoří základ téměř všech moderních technologií, zejména umělé inteligence, a přesahují základní matematiku, kterou známe. Zjednodušeně řečeno, tenzory by v moderní výpočetní technice, zejména v umělé inteligenci, byly něco jako atomové cihly. A tenzorové operace jsou „nástroje“ (kladiva, pily, šrouby), které používáme k sestavování, tvarování a přetváření těchto cihel do složitých a užitečných struktur, jako jsou modely, které rozpoznávají náš hlas, doporučují filmy nebo řídí autonomní auta.

Na tenzorových operacích dnes závisí všechny úlohy umělé inteligence, od rozpoznávání obrazu po zpracování přirozeného jazyka. Exploze dat však dotlačila konvenční digitální výpočetní platformy, jako jsou grafické procesory, na jejich hranice, pokud jde o rychlost, škálovatelnost a spotřebu energie. Zatímco lidé a konvenční počítače musí tyto operace provádět postupně, světlo je může provádět všechny najednou.

Související článek

Satelitní snímky odhalily obří hnědý pás mezi Afrikou a Amerikou: Odborníci nevěří svým očím
Satelitní snímky odhalily obří hnědý pás mezi Afrikou a Amerikou: Odborníci nevěří svým očím

Satelitní snímky odhalily masivní pás hnědých řas, který se táhne mezi Afrikou a Amerikou. Tento jev, známý jako Velký atlantický Sargasový pás, je varovným signálem dopadů lidské činnosti na oceány i klima.

Aby tento problém vyřešil, objevil mezinárodní tým vědců pod vedením Yufenga Zhanga z Photonics Group na katedře elektroniky a nanoinženýrství Aalto University novou metodu, která provádí komplexní tenzorové výpočty pomocí jediného šíření světla. Výsledkem je jednoprůchodový výpočet tenzorů rychlostí světla.

„Naše metoda provádí stejné operace jako současné grafické procesory, ale rychlostí světla,“ řekl Zhang. Místo toho, abychom se spoléhali na elektronické obvody, využíváme fyzikální vlastnosti světla k provádění více výpočtů současně.“

Aby toho Zhangův tým dosáhl, zakódoval digitální data do amplitudy a fáze světelných vln a převedl čísla na fyzikální vlastnosti optického pole. Když se tato světelná pole vzájemně ovlivňují a kombinují, přirozeně provádějí matematické operace, jako je násobení matic a tenzorů, které tvoří základ algoritmů hlubokého učení. Zavedením více vlnových délek světla tým rozšířil tento přístup tak, aby zvládal operace s tenzory vyššího řádu.

„Představte si, že jste celník, který musí každý balíček zkontrolovat pomocí několika strojů s různými funkcemi a pak je roztřídit do správných kontejnerů,“ vysvětluje Zhang. Za normálních okolností byste zpracovávali každý balík po jednom. Nová optická výpočetní metoda integruje všechny balíčky a všechny stroje: vytváří několik optických spojů, které propojí každý vstup se správným výstupem. Jedinou operací, jediným průchodem světla, se všechny kontroly a klasifikace provádějí okamžitě a paralelně.

Další klíčovou výhodou této metody je její jednoduchost. Optické operace probíhají pasivně při šíření světla, takže během výpočtu není nutné žádné aktivní řízení ani elektronické přepínání.

„Tento přístup lze implementovat na téměř jakékoli optické platformě,“ dodává Zhipei Sun, vedoucí skupiny Photonics Group na Aalto University. „V budoucnu plánujeme integrovat tento výpočetní rámec přímo do fotonických čipů, což umožní světelným procesorům provádět složité úlohy umělé inteligence s extrémně nízkou spotřebou energie.“

V konečném důsledku je cílem implementovat tuto metodu na stávajícím hardwaru nebo platformách velkých společností, říkají autoři, kteří konzervativně odhadují, že tento přístup bude do takových platforem integrován během 3-5 let.

„Vznikne tak nová generace optických výpočetních systémů, která výrazně urychlí komplexní úlohy umělé inteligence v mnoha oblastech,“ uzavírá studie.

Zdroje článku

nature.com, Autorský text
#