Apple zůstává v hudební AI pozadu. Konkurence mezitím generuje celé skladby

Apple zůstává v hudební AI pozadu. Konkurence mezitím generuje celé skladby

Zdroj obrázku: burdun / Depositphotos

Apple právě představil generování playlistů podle textu, zatímco Google už pomocí AI skládá celé písně na základě obrázku. Zatímco konkurence mění hudební svět, Apple dál volí opatrný přístup, který klade důraz na soukromí – ale přichází o tempo i pozornost.


Pokud byste potřebovali vědět, jak moc je Apple v současné době v závodě s umělou inteligencí pozadu, stačí se podívat na nepatrné možnosti umělé inteligence, které výrobce iPhonů právě s velkou slávou zavedl do své aplikace Apple Music, a pak je porovnat s nejnovějším modelem společnosti Google, který nyní vytváří celé skladby od nuly.

Jak jsme nedávno poznamenali, s aktualizací iOS 26.4 vám aplikace Apple Music umožní vytvořit seznam skladeb pomocí textové výzvy. V podstatě můžete slovy vysvětlit svůj nápad nebo konkrétní téma a aplikace pomocí umělé inteligence automaticky sestaví seznam odpovídajících skladeb.

V praxi jde v podstatě o chytřejší verzi staré funkce „Genius“, kterou Apple představil před lety: zůstanete v rámci stávajícího katalogu Apple Music a systém se pokusí najít skladby, které odpovídají vaší náladě, činnosti nebo krátkému popisu typu „noční jízda, alternativa 90. let, bez vokálů“ nebo „optimistické cvičení s převážně popem a EDM“. Je to užitečné, ale stále je to jen doporučení a kurátorství. Nic zásadně nového se nevytváří, umělá inteligence jen přeskupuje to, co už má Apple licencované ve své knihovně.

Související článek

Black Mirror se stává realitou: Umělá inteligence shodila síť Amazonu
Black Mirror se stává realitou: Umělá inteligence shodila síť Amazonu

Třináctihodinový výpadek části AWS v Číně odhalil, jak snadno může lidská chyba spojená s automatizací způsobit rozsáhlé škody. Případ agenta Kira otevírá širší debatu o bezpečném nasazení AI ve firemních systémech – a o tom, proč kontrola zůstává klíčem.

Apple implemented this feature using apple intelligence then why ytm cant do the same using gemini power because its too much powerful compared to apple intelligence , fun fact still in 2026 no crossfade in ytm😂
byu/legendary_warrior_1 inYoutubeMusic

Apple se také u mnoha funkcí „Apple Intelligence“ opírá o zařízení, což znamená, že tyto nástroje pro tvorbu playlistů jsou navrženy tak, aby byly relativně lehké a zachovávaly soukromí. To je filozoficky v souladu s širším postojem společnosti Apple k umělé inteligenci a uživatelským datům, ale také to znamená, že společnost zatím neposouvá hranice toho, co je v oblasti generativní hudby technicky možné. Apple sice mluví o „personalizaci“, ale to, co dnes uživatelé ve skutečnosti dostávají, má blíže k rafinovanému tlačítku shuffle než ke skutečnému skladateli s umělou inteligencí.

Společnost Google mezitím právě představila svůj model Lyria 3, který k vytváření 30sekundových skladeb používá buď textové, nebo obrazové podněty. Google k tomu dále uvádí:

Jedná se o zásadně odlišnou kategorii schopností. Namísto vybírání z existujících skladeb generuje Lyria 3 zcela nový zvuk – melodii, harmonii, instrumentaci a vokály – od základu, pouze na základě krátkého popisu nebo obrázku. Google označuje Lyrii za svůj „nejpokročilejší model generování hudby“ a již nyní ji zapojuje do svého širšího ekosystému Gemini, takže stejný asistent, který odpovídá na vaše e-maily, dokáže během několika vteřin vyplivnout vlastní znělku, doprovodnou skladbu ve stylu filmové hudby nebo parodickou píseň připravenou pro meme.

Aby bylo jasno, Lyria 3 je v současné době ve fázi beta a je zaváděna opatrně prostřednictvím řízených experimentů a nástrojů s omezeným přístupem. Společnost Google opakovaně zdůraznila, že zabudovává vodoznaky a bezpečnostní filtry, aby zabránila zjevnému zneužití, a že není určena k vydávání se za konkrétní umělce bez povolení. I tak ale kontrast mezi rychle se rozšiřujícími možnostmi umělé inteligence společnosti Google a odpovídajícími „dětskými krůčky“ společnosti Apple nemůže být výraznější.

Na jedné straně tu máme Google, Meta a rostoucí seznam startupů, které se předhánějí v budování plnohodnotných generativních zvukových systémů – modelů, které si poradí s textem, kompozicí i produkcí v jednom zátahu. Na druhé straně Apple stále považuje umělou inteligenci za zákulisního pomocníka, který spíše vylepšuje stávající zážitky, než aby je znovu vymýšlel. Dokonalým příkladem jsou playlisty Apple Music s umělou inteligencí: pohodlné, to ano, ale sotva půjde o funkci, která bude definovat příští desetiletí digitální hudby.

Proč jsou AI hudební funkce Apple tak omezené

Důvodem, proč Apple vypadá tak pozadu, je zčásti to, že si vybral velmi úzkou a málo riskantní aplikaci umělé inteligence v hudbě. Generování playlistů na základě textových pokynů je z právního a etického hlediska relativně bezpečné: Apple doporučuje pouze skladby, na jejichž streamování již má práva, a nemusí se pohybovat v minovém poli vokálů generovaných umělou inteligencí, které znějí podezřele podobně jako skuteční umělci.

Naproti tomu Lyria 3 od Googlu se nachází přímo uprostřed tohoto minového pole. Trénování modelu pro generování hudby ve velkém měřítku vyvolává zřejmé otázky: čí nahrávky byly použity k jeho trénování, jak jsou kompenzováni držitelé práv a co se stane, když model dokáže přesvědčivě napodobit styl slavného zpěváka? To je důvod, proč Google zavádí model Lyria pod přísnými omezeními a proč neustále zdůrazňuje, že spolupracuje s vydavatelstvími a organizacemi pro ochranu práv.

Zdá se však, že Apple využívá tyto nevyřešené otázky jako důvod k pomalému – téměř ledovému – postupu v oblasti generativní hudby. Společnost má peníze, hardware a ekosystém na to, aby udělala něco mnohem ambicióznějšího, ale místo toho se rozhoduje dodávat postupné funkce s nízkými nároky, které neohrozí labely ani regulační orgány. Možná je to dobré řízení rizik, ale Apple kvůli tomu také vypadá jako následovník v oblasti, kde uživatelé stále více očekávají odvážné a experimentální nástroje.

Je tu také technický aspekt. Veřejné snahy společnosti Apple v oblasti umělé inteligence se dosud zaměřovaly na menší a efektivní modely, které mohou běžet na iPhonech, iPadech a počítačích Mac, aniž by vše posílaly do cloudu. To je skvělé z hlediska soukromí a latence, ale není to způsob, jak se dostat k nejmodernějšímu generativnímu zvuku, který v současnosti vyžaduje masivní klastry GPU nebo TPU a obrovské tréninkové běhy. Naproti tomu společnost Google se v případě Lyrie a její rodiny Gemini bezvýhradně orientuje na cloud, což jí dává mnohem větší prostor k posouvání hranic.

Širší mezera v umělé inteligenci: Apple vs. Google

Příklad Apple Music je ve skutečnosti jen příznakem širšího strategického rozdílu. Společnost Google strávila posledních několik let agresivním přeorientováním celé své produktové řady na Gemini, svou vlajkovou modelovou řadu AI. Vyhledávání, Android, Workspace, YouTube a nyní i hudba jsou přepracovány tak, aby generativní AI byla v popředí zájmu. Google také provádí veřejné iterace: Gemini 1.0, 1.5, 2.0 a nyní hudební model Lyria 3 přicházejí v rychlém sledu a každý z nich je viditelně schopnější než ten předchozí.

Naproti tomu Apple je mnohem opatrnější a neprůhlednější. Vydal výzkumné dokumenty a v tichosti koupil startupy zabývající se umělou inteligencí, ale většina této práce zůstala pro uživatele neviditelná. Teprve nedávno začal Apple otevřeně mluvit o „Apple Intelligence“ jako o jednotícím konceptu, a i tehdy funkce, které dosud dodal – souhrny, nástroje pro psaní, úpravy obrázků a nyní i generování playlistů – působí spíše jako sázky na stůl než jako průlomové objevy.

Proto se zdá, že rozdíl je tak velký: ne proto, že by Apple neměl talent na umělou inteligenci, ale proto, že se rozhodl většinu této práce skrýt za kulisami, zatímco konkurenti proměňují své modely v titulní funkce. Ve světě, kde uživatelé mohou požádat model Googlu, aby na základě vtipné výzvy napsal, zazpíval a vytvořil 30sekundovou skladbu, „AI playlisty“ jednoduše nezaregistrujeme jako působivé.

Naděje vkládané do Siri s podporou Gemini

Nezbývá než doufat, že se společnosti Apple podaří překlenout chronické nedostatky související s umělou inteligencí, jakmile bude někdy v letošním roce uvedena na trh přepracovaná Siri s podporou Gemini, která do hlasového asistenta přinese tolik odkládané akce v aplikacích, povědomí o osobním kontextu a povědomí o obsahu na obrazovce, a umožní tak provádět nejrůznější agenturní akce napříč aplikacemi na základě osobních údajů a obsahu na obrazovce.

Teoreticky by tak Apple mohl konečně proměnit svou výhodu v ekosystému v něco, co bude skutečně inteligentní. Siri, která by rozuměla tomu, co máte na obrazovce, co děláte a co jste dělali v minulosti, a pak by vaším jménem prováděla akce uvnitř aplikací, by byla mnohem užitečnější než další chatbot, který žije na kartě prohlížeče. Představte si, že byste Siri řekli: „Vezmi si poznámky z mé poslední schůzky, shrň je a pošli akční body týmu v aplikaci Mail,“ a že se to prostě stane, aniž byste se dotkli jediné ikony aplikace.

I zde však Mark Gurman z agentury Bloomberg nedávno upozornil, že plánované spuštění přepracované Siri společností Apple narazilo na překážky a cupertinský gigant nyní pracuje na postupném zavádění základních funkcí v průběhu probíhajícího roku, nikoliv najednou. Podle Gurmana se Apple snaží vyvážit tři protichůdné požadavky: zachovat co nejvíce zpracování přímo v zařízení, vyrovnat se hrubým schopnostem předních cloudových modelů a zajistit, aby celá věc nepůsobila při uvedení na trh polovičatě.

Toto postupné zavádění znamená, že se uživatelé pravděpodobně dočkají postupného zlepšování – tu o něco lepšího porozumění, tu nového typu akce v aplikaci – a ne jediného dramatického okamžiku „Siri 2.0“. A každý měsíc, který uplyne a Siri bude stále působit jako glorifikovaný hlasový ovladač, je dalším měsícem, kdy Google, OpenAI a další mohou upevnit pozici svých asistentů jako výchozího způsobu interakce lidí s umělou inteligencí.

Výhled na iOS 27 a speciálního chatbota Siri

Podstatné zlepšení se však nyní očekává až se systémem iOS 27, kdy by společnost Apple uvedla na trh specializovaného chatbota Siri, který by běžel na vlastních TPU a cloudové infrastruktuře společnosti Google, případně pronajaté společností Apple.

Chatbot Siri by údajně využíval mnohem pokročilejší verzi modelu Gemini společnosti Google, interně známou jako Apple Foundation Models verze 11. Očekává se, že tento model bude konkurenceschopný s modelem Gemini 3 a výrazně výkonnější než ten, který pohání modernizovanou Siri.

Pokud se tento plán potvrdí, znamenalo by to tichý, ale hluboký posun ve strategii společnosti Apple v oblasti umělé inteligence. Společnost Apple po léta trvala na tom, aby co nejvíce věcí vytvářela a provozovala na vlastním křemíku a infrastruktuře. Přenechání nejtěžších úkolů v oblasti umělé inteligence procesorům TPU společnosti Google by znamenalo přiznání, že přinejmenším prozatím se Apple nemůže sám vyrovnat rozsahu a tempu předních laboratoří umělé inteligence. Zároveň by to smazalo hranice mezi oběma společnostmi způsobem, který by byl před deseti lety, kdy spolu vedly urputnou válku o smartphony a mapy, nemyslitelný.

Z pohledu uživatele však může mít značka větší význam než instalatérské práce. Pokud se Applu podaří zabalit výkonný model třídy Gemini do prostředí Siri, které bude hluboce integrované s iOS – bude znát vaše fotografie, zprávy, kalendář a aplikace, ale přitom bude respektovat soukromí -, nemusí záležet na tom, že hrubé výpočty probíhají na hardwaru Googlu. Většina lidí prostě uvidí „Siri konečně funguje“.

Riziko pro Apple spočívá v tom, že než se tento chatbot Siri objeví v systému iOS 27, zbytek odvětví se může posunout zase dál. Google s Gemini a Lyrií nebude stát na místě. OpenAI, Meta, Anthropic a další budou dál posouvat hranice. A uživatelé, kteří si již vybudovali návyky na jiné asistenty a nástroje umělé inteligence, možná nebudou chtít přejít, bez ohledu na to, jak vybroušený je pozdní vstup společnosti Apple.

Prozatím jsou tedy playlisty Apple Music s umělou inteligencí elegantní, ale skromnou funkcí, která slouží hlavně k tomu, aby zdůraznila, jak konzervativní je strategie společnosti Apple v oblasti umělé inteligence. Zatímco Google nechává uživatele vykouzlit celé skladby ze vzduchu pomocí Lyria 3, Apple po vás stále chce, abyste byli ohromeni tím, že dokáže vybrat několik skladeb pro váš další běh. Pokud slíbená Siri s podporou Gemini a její budoucí inkarnace chatbota nepřinesou něco skutečně transformujícího, bude tato propast ještě zřetelnější.

Zdroje článku

blog.google, bloomberg.com
#