Společnost Google se spojila se skupinou výzkumníků zabývajících se delfíny, aby vytvořila umělou inteligenci, která dokáže porozumět tomu, co mezi sebou delfíni komunikují.
Google oznámil svůj nový výtvor: DolphinGemma, jazykový model (LLM neboli large linguistic model), který má vědcům pomoci studovat, jak delfíni komunikují a „snad“ (podle vlastních slov společnosti) také zjistit, co říkají.
Firma vysvětluje, že „po celá desetiletí bylo porozumění delfínímu klikání, pískání a pulzování vědeckou hranicí“, a to je překážka, kterou chce společnost nyní překonat: nejen poslouchat delfíny, ale také porozumět jejich složitým komunikačním vzorcům dostatečně přesně, aby bylo možné generovat realistické odpovědi.
Nový model umělé inteligence byl vycvičen tak, aby se naučil strukturu delfíních vokálů a generoval nové sekvence zvuků podobných delfínům. Podle společnosti jde o důležitý krok v hledání mezidruhové komunikace a posouvá hranice umělé inteligence.
Google has unveiled DolphinGemma, an open-source AI model designed to decode dolphin communication by analyzing their clicks, whistles, and burst pulses. https://t.co/v3rgN7TsNT
— Decrypt (@DecryptMedia) April 15, 2025
Sen o schopnosti porozumět zvířatům není ničím novým. A je zajímavé zde připomenout příběh, kdy byl odposloucháván delfín, který byl po léta sám před Dánskem. Nahraný rozhovor byl velmi překvapivý, protože se zdálo, že mluví sám se sebou.
Jak funguje nová umělá inteligence Google DeepMind
Projekt Wild Dolphin Project neboli WDP provádí od roku 1985 podmořský výzkum, v rámci kterého studuje specifické společenství volně žijících delfínů skvrnitých (Stenella frontalis) na Bahamách po celé generace a s přístupem, o kterém tvrdí, že je neinvazivní. Vycházejí přitom z desítek let pořízených podvodních videozáznamů a zvukových záznamů, které pečlivě párují s individuální identitou delfínů, jejich životními příběhy a pozorovaným chováním.
WDP se tak snaží pozorovat a analyzovat přirozenou komunikaci a sociální interakce delfínů. Práce pod vodou umožňuje výzkumníkům přímo spojit zvuky s konkrétním chováním, čehož pozorování na hladině nemůže dosáhnout.
Již desítky let korelují typy zvuků s jejich chováním. Vědí, že existují charakteristické pískání, které používají matky a mláďata ke shánění nebo rozpoznávají určité bzučivé zvuky, které se často používají při námluvách nebo při pronásledování žraloků.
„Tato dlouhodobá analýza přirozené komunikace tvoří základ výzkumu WDP a poskytuje základní kontext pro jakoukoli analýzu umělé inteligence,“ vysvětluje společnost Google.
Jak DolphinGemma funguje
Na základě těchto cenných informací nyní společnost Google představuje nástroj DolphinGemma, vytvořený pro analýzu přirozené a složité komunikace delfínů, kterou označuje za „monumentální úkol“.
Tento model umělé inteligence využívá zvukové technologie specifické pro Google: tokenizér SoundStream efektivně reprezentuje zvuky delfínů, které jsou následně zpracovány architekturou modelu přizpůsobenou složitým sekvencím.
Tento model o přibližně 400 milionech parametrů je optimálně dimenzován tak, aby mohl běžet přímo na telefonech Pixel, které WDP používá při svém výzkumu. Google tvrdí, že DolphinGemma navrhl tak, aby využíval specifickou zvukovou technologii společnosti, což znamená, že použití telefonů Pixel snižuje potřebu vlastního hardwaru, zlepšuje schopnost udržet systém v chodu, snižuje spotřebu energie a náklady.
Odborné znalosti modelu Gemma
Tento model je založen na poznatcích z Gemmy, sbírky lehkých otevřených modelů společnosti Google, vytvořené na základě stejného výzkumu a technologie, která pohání naše modely Gemini. Nyní byl vycvičen na akustické databázi volně žijících delfínů atlantských společnosti WDP. Jak vysvětluje společnost Google:
„DolphinGemma funguje jako zvukový vstupně-výstupní model, který zpracovává sekvence přirozených zvuků delfínů, aby identifikoval vzory, strukturu a nakonec předpověděl pravděpodobné další zvuky v sekvenci, podobně jako velké lingvistické modely pro lidský jazyk předpovídají další slovo nebo fragment věty“.
WDP nyní začíná implementovat DolphinGemma. Jak vysvětlují, model může výzkumníkům pomoci odhalit skryté struktury a možné významy v přirozené komunikaci delfínů, což je úkol, který dříve vyžadoval obrovské lidské úsilí.
Kromě analýzy přirozené komunikace se WDP vydává i jinou paralelní cestou: zkoumá možnou obousměrnou interakci prostřednictvím technologií v oceánu.
Potenciál systému DolphinGemma se neomezuje pouze na delfíny. Tato technologie by mohla položit základy pro budoucí výzkum komunikace s dalšími živočišnými druhy, což by mohlo přinést převrat v našem chápání chování zvířat a mezidruhových vztahů. Schopnost překládat řeč zvířat by mohla mít významný dopad na ochranu druhů, protože by umožnila lepší správu přírodních stanovišť a hlubší pochopení potřeb ohrožených zvířat.
Vývoj této technologie navíc vyvolává etické otázky týkající se interakce s volně žijícími zvířaty. Možnost „mluvit“ se zvířaty je sice vzrušující, ale je také nezbytné zvážit dopad takové interakce na jejich přirozené chování a životní podmínky. Výzkumníci se budou muset těmito problémy pečlivě zabývat, aby zajistili, že používání této technologie bude prospěšné jak pro lidi, tak pro zvířata.