Myslíte si, že kreativita je jen lidská? Tahle studie vám to zkomplikuje

Myslíte si, že kreativita je jen lidská? Tahle studie vám to zkomplikuje

Zdroj obrázku: Alexander Sikov / iStockphoto

Kreativita byla vždy považována za jeden z nejhlubších znaků našeho druhu a za jednu z nejčastěji se opakujících možností při konstatování: Lidé jsou jediní živočichové…, kteří mají kreativitu (v tomto případě).


Po staletí tato myšlenka fungovala téměř jako psychologické útočiště: i když stroje počítají rychleji, i když si algoritmy zapamatují více dat, jiskra představivosti – ta směs intuice, hry, zkušenosti a překvapení – jako by zůstala výhradně lidská. Filozofové, psychologové a umělci tvrdili, že tvořit neznamená jen kombinovat věci, ale propůjčit jim smysl, emoce a účel.

Když se tedy ptáme, zda může být umělá inteligence kreativní, vlastně narážíme na otázku: může stroj napodobit to, co chápeme pod pojmem představivost, intuice nebo genialita? Nedávná studie, kterou v časopise Scientific Reports publikoval mezinárodní tým vedený Antoinem Bellemare-Pepinem z Montrealské univerzity, se pokusila na tuto otázku odpovědět v nebývalém měřítku: porovnávala kreativitu nejpokročilejších modelů umělé inteligence s kreativitou více než 100 000 lidí při řešení nejrůznějších úkolů generujících nápady.

Tato práce doplňuje řadu výzkumů, které se již léta snaží změřit něco tak neuchopitelného, jako je kreativita. Tradičně se používaly testy, jako je Torranceův test kreativního myšlení nebo úloha Alternativní využití (např. „vyjmenuj všechna možná využití cihly“). Tyto testy jsou však určeny pro lidi, nikoli pro algoritmy. Úkolem Bellemare-Pepina a jeho týmu bylo navrhnout hrací pole, kde by se lidé a stroje mohli porovnávat podle stejných pravidel.

Související článek

Astronauti NASA si berou na Měsíc mobily. Vy byste jim to ještě nedávno zakázali
Astronauti NASA si berou na Měsíc mobily. Vy byste jim to ještě nedávno zakázali

Astronauti mise Artemis II a Crew-12 si nově budou moci vzít do vesmíru chytré telefony. NASA tím otevírá cestu pro moderní technologie na palubách lodí a symbolicky přibližuje vesmír běžnému světu, který známe ze Země.

Za tímto účelem Bellemare-Pepinův tým navrhl sérii testů navržených tak, aby měřily kreativitu rovnoměrně u lidí i strojů. Hlavní složkou byl test Divergent Association Task (DAT), který vyžaduje vytvoření seznamu slov nebo pojmů co nejrůznějších a nesouvisejících s jedním podnětem, čímž se testuje schopnost divergentního myšlení – schopnost otevřít mysl nečekaným a originálním asociacím.

Test DAT původně navrhl psycholog Jay Olson jako rychlý a automatizovaný způsob měření verbální kreativity. Na rozdíl od jiných delších a subjektivnějších testů se DAT opírá o kvantifikovatelné metriky: „sémantická vzdálenost“ mezi slovy vytvořenými každým účastníkem se vypočítává pomocí jazykových modelů vyškolených na rozsáhlých korpusech textů. Tímto způsobem lze test standardizovaně aplikovat na tisíce lidí – a nyní také na modely umělé inteligence.

Pro představu, jak DAT funguje, je účastníkovi (člověku nebo umělé inteligenci) zadáno podnětné slovo, například „voda“. Instrukce je jednoduchá: napište seznam slov, která spolu pokud možno nesouvisejí a také co nejméně souvisejí s podnětem, přičemž se vyhněte zjevným asociacím. Nevyhrává ten, kdo napíše „cizí“ slova, ale ten, komu se podaří zajistit, že viděno jako celek jsou od sebe sémanticky vzdálená.

„Špatnou“ odpovědí by bylo něco jako moře, řeka, déšť, vlna, protože všechna obíhají kolem stejného pojmového pole. Odpověď považovaná za kreativní by mohla být smlouva, kaktus, housle, hranice, stůl. Na první pohled se zdá, že nemají nic společného ani mezi sebou, ani s „vodou“, a právě o to se test snaží : změřit, do jaké míry je mysl schopna prolomit snadnou cestu automatických asociací a prozkoumat nečekaná území.

Tyto seznamy jsou pak analyzovány pomocí výpočetních nástrojů, které měří sémantickou vzdálenost mezi slovy pomocí velkých jazykových modelů jako významových map, a v některých případech jsou také podrobeny lidskému posouzení. Čím větší je průměrná vzdálenost mezi výrazy, tím vyšší je skóre divergentního myšlení. Jinými slovy: jde o to, jak dalece je systém – mozek nebo algoritmus – schopen „vybočit“ z typických asociací, které všichni sdílíme.

Výsledek je sugestivní a mohl by být odpovědí, kterou už nějakou dobu hledáme: současné generativní umělé inteligence, včetně modelů, jako je GPT-4 a jeho současníci, dosáhly v těchto úlohách úrovně kreativity, která překonává průměrného člověka, a generují asociace a texty schopné vyrovnat se nebo dokonce překonat průměrnou kreativitu těch, kteří se testů zúčastnili. Ve studii se několik velkých jazykových modelů umístilo na vrcholu rozdělení skóre DAT, v rozmezí 1-2 % od nejlépe skórujících lidí.

Tato „remíza“ však není absolutní a studie zdůrazňuje něco zásadního: nejkreativnější lidé nadále překonávají stroje, zejména ve složitějších a nuancovanějších úlohách, jako je psaní poezie, povídek nebo scénářů. Když byli lidští porotci požádáni, aby ohodnotili texty vytvořené lidmi a umělou inteligencí z hlediska originality, hloubky a estetické hodnoty, nejlepší lidské výtvory nadále vynikaly, zejména ve schopnosti zprostředkovat prožitek, jemnou ironii nebo nejednoznačné emoce.

Tento vzorec (AI na stejné úrovni jako většina, ale pod úrovní nejlepších lidských textů) poukazuje na zajímavý trend. Stroje mají přístup k rozsáhlým databázím a dokáží kombinovat asociace s rychlostí a rozsahem, kterému se žádný lidský mozek nemůže rovnat. To jim umožňuje dosahovat mimořádně dobrých výsledků ve strukturovaných testech divergentní kreativity, kde lze formálně měřit originalitu. Skutečná lidská tvořivost však není jen záležitostí vytváření originálních kombinací; zahrnuje také prvky životní zkušenosti, kulturního kontextu, emocí, záměru a tvůrčího rizika, které stroje nemají.

Psychologie tvořivosti často rozlišuje mezi „malou tvořivostí “ (originální nápady každodenního života: řešení problému v domácnosti, improvizace receptu) a „velkou tvořivostí“ (velká umělecká nebo vědecká díla, která mění obor). Zdá se, že modely umělé inteligence si vedou velmi dobře v první kategorii, pokud jde o vytváření variací, návrhů nebo nových kombinací. Druhá kategorie však zahrnuje dlouhodobou vizi, hluboké porozumění oboru, riskování a zpochybňování norem, což je něco, co je dnes stále spojeno s lidskými životními dráhami, nikoli se statistickými tréninkovými procesy.

Tým Bellemare-Pepin upozorňuje, že kreativita umělé inteligence do značné míry závisí na tom, jak je řízena: technické nastavení a instrukce, které jí jsou dány, ji mohou učinit odvážnější nebo konzervativnější, objevitelštější nebo konvenčnější. Tato závislost na lidském prostředí při „odemykání“ kreativity jasně ukazuje jednu skutečnost: UI sama o sobě bez lidského vedení netvoří, ale bude odrážet vynalézavost, s níž je používána a řízena.

V praxi se to projevuje zcela konkrétně: podnět je součástí díla. Umělá inteligence sama může vytvářet ploché nebo překvapivé výsledky podle toho, jak je jí úkol zadán, jaké příklady jí jsou poskytnuty, jaká omezení jsou na ni kladena nebo jaké iterace jsou prováděny na jejích odpovědích. V tomto smyslu funguje lidský uživatel jako dirigent a model jako mimořádně všestranná nástrojová sekce, která však nemá vlastní úsudek o tom, kterou symfonii stojí za to hrát.

To neznamená, že by umělá inteligence byla jen mechanickým nástrojem bez tvůrčí hodnoty; naopak, mnozí odborníci ji považují za „zesilovač“ lidské představivosti. Díky spolupráci s těmito stroji mohou lidé zkoumat kombinace nápadů, o kterých by sami nikdy neuvažovali, a rozšiřovat tak rozsah svých vlastních tvůrčích procesů. Například v grafickém designu umožňují generativní nástroje iteraci během několika sekund nad desítkami skic; při psaní mohou jazykové modely navrhovat alternativní dějové zvraty, postavy nebo styly, které pak autor vybere, přepracuje a upřesní.

Nedávné studie totiž ukazují, že lidské týmy využívající umělou inteligenci pro tvůrčí úkoly (například psaní reklamních kampaní nebo sloganů) vytvářejí výsledky, které hodnotitelé považují v průměru za originálnější než výsledky týmů pracujících bez umělé inteligence, a to v kratším čase. Připomeňme, že když mají hodnotitelé vybrat skutečně výjimečné nápady, jedinečné „skvosty“, ty obvykle vznikají na základě intenzivních lidských procesů, často s podporou AI, ale nikoliv automaticky a bez filtrování.

Kdo je tedy kreativnější: lidé nebo AI? Odpověď není jednoznačná. Stroje se dnes dokáží vyrovnat většině lidí a dokonce je překonat ve strukturovaných úlohách divergentního myšlení a generovat originální nápady netušenou rychlostí a v netušeném rozsahu. Když se však zvýší sázky, pokud jde o hlubokou, kontextově bohatou a nuancovanou kreativitu, lidé (přinejmenším takříkajíc „kreativní výběr“) nadále určují standard. A poslední fakt: měřit kreativitu pomocí testu je jako dělat degustaci tak, že si přečtete pouze jídelní lístek.

Samotné nástroje hodnocení mají své limity. DAT měří sémantickou originalitu, ale nedokáže zachytit, zda je nápad užitečný, etický, dojemný nebo transformativní. Básnický verš může obsahovat slova, která jsou si velmi blízká, a přesto může jít o mistrovské dílo. Vědecký objev může vycházet z blízce příbuzných pojmů, ale přeuspořádaných tak, že otevírají celou oblast výzkumu. Žádný algoritmus vzdálenosti slov sám nepozná, kdy si myšlenka „zaslouží existovat“.

Dnešní modely umělé inteligence jsou navíc trénovány na obrovském množství lidského obsahu: knih, článků, kódů, obrázků, hudby. Jejich „kreativita“ je do značné míry statistickou destilací kolektivní kreativity milionů lidí. Když model přijde s chytrou metaforou nebo nečekanou kombinací stylů, děje se tak proto, že se naučil vzory z tisíců předchozích metafor a stylů. To neznehodnocuje jeho užitečnost, ale vyvolává to nepříjemnou otázku: srovnáváme kreativitu jednotlivého člověka s kreativitou stroje, který kondenzuje celé lidstvo?

Na druhou stranu lidský mozek není prázdné plátno. Také se živí tím, co vidí, čte a prožívá. Rozdíl je v tom, že v našem případě se tyto informace mísí s těly, emocemi, osobními příběhy, strachy a touhami. Když někdo píše báseň o dešti, nekombinuje jen slova: vzpomíná na vůni, ztrátu, konkrétní odpoledne. Tato vrstva ztělesněné zkušenosti – to, co někteří filozofové nazývají „situovaná mysl“ – je něco, co prozatím algoritmy nemají.

V příštích letech se pravděpodobně dočkáme ještě výkonnějších modelů, které budou schopny překonat většinu lidí v mnoha testech formalizované kreativity. To však neznamená, že lidská představivost bude zastaralá. Spíše nás to staví před nový scénář: kreativitu jako hybridní spolupráci. Spíše než se ptát, kdo „vyhraje“, by bylo rozumnější se ptát, jak chceme spojit to nejlepší z obou světů: rychlost a asociační šíři strojů s hloubkou, úsudkem a citlivostí lidí.

Nakonec otázka, kdo si lépe představuje – mozek nebo algoritmus – může být špatně položená. Mozek není jen generátorem nápadů; je také filtrem, editorem, vypravěčem, který rozhoduje, které příběhy vyprávět a které zavrhnout. Algoritmy jsou naproti tomu mimořádnými generátory možností, ale stále závisí na nás, abychom rozhodli, co stojí za to zachovat. Skutečná tvůrčí revoluce možná nespočívá v tom, že nás umělá inteligence nahradí, ale v tom, že nás donutí znovu definovat, co rozumíme pod pojmem lidská představivost ve světě, kde už nejsme jediní, kdo je schopen vytvářet neočekávané.

Zdroje článku

nature.com, sciencedaily.com, Autorský text
#