Gemini Live: Když váš mobil ví, co chcete, dřív než to řeknete

Google testuje čtyři pokročilé funkce pro Gemini Live, včetně režimu hlubokého myšlení a agenta schopného ovládat telefon bez dotyku. Funkce zatím nejsou veřejně dostupné, ale jejich potenciál proměnit interakci s Androidem je obrovský – i znepokojivý.

Google testuje čtyři experimentální funkce pro Gemini Live v systému Android, včetně režimu pozastaveného myšlení, multimodální paměti a agenta schopného ovládat váš telefon, aniž byste se dotkli obrazovky. Zprávy nám přináší server 9to5Google, který dekompilací získal beta verzi 17.2 aplikace Google nahranou do Obchodu Play. Interní kód varuje, že se tyto schopnosti možná nikdy nedostanou na veřejnost.

Média našla odkazy na režim živého přemýšlení, živé experimentální funkce, ovládání uživatelského rozhraní a hluboký výzkum, což jsou čtyři funkce typu laboratoře bez oficiálního oznámení nebo plánu nasazení. Při této příležitosti bychom rádi připomněli, že přečtení kódu aplikace neznamená, že jde o oficiální informaci, proto je vhodné brát tyto zprávy s jistou dávkou skepse.

Od sprintu k maratonu

První věc, která vyčnívá, je, že režim Live Thinking Mode slibuje „čas na přemýšlení„, což znamená, že Gemini Live opustí Gemini 2.5 Flash a přijme Gemini 3. Asistent obětuje rychlost odpovědi výměnou za komplexnější uvažování, podobně jako to již dělá DeepThink v desktopovém chatu. Vyplatí se čekat o tři sekundy déle na lepší odpověď? Bude záležet na typu dotazu.

Živé experimentální funkce zahrnují multimodální paměť, pokročilé potlačení okolního hluku, odpovědi při detekci vizuálních podnětů a personalizované výsledky na základě aplikací Google. Tyto schopnosti již existují v Gemini 3 Flash a Pro pro chatovací režim, ale aplikované na Gemini Live znamenají skok od rychlého asistenta k asistentovi, který si pamatuje a rozumí tomu, co vidí.

Ovládání uživatelského rozhraní má doslovný popis Agent ovládá telefon za účelem dokončení úkolů, což znamená, že by Gemini mohl provádět akce přímo v operačním systému: otevírání aplikací, procházení nabídek, vyplňování formulářů. Média to spojují s očekávaným příchodem agenta Gemini do systému Android v rámci funkce Computer Use, která umožňuje umělé inteligenci komunikovat s grafickými rozhraními stejně jako člověk.

Deep Research je popsán pouze jako „delegování složitých výzkumných úkolů„, ale ani z kódu, ani z článku není jasné, jak se bude lišit od režimu, který již existuje v chatu. Funkce se objevuje bez jakéhokoli technického kontextu kromě této obecné fráze.

Tyto funkce se řídí logikou Labs, kterou Google představil v listopadu u Gemini 3 Pro. Lokalizované textové řetězce odkazují na „špičkové funkce“ a „osobní inteligenci„, což je terminologie, která přinejmenším v tuto chvíli neupřesňuje, jak budou tyto funkce fungovat a jaký výkon budou poskytovat. Interně

Neexistují žádná data zavedení, žádné potvrzení trhů ani žádné podrobnosti o tom, zda budou vyžadovat předplatné Gemini Advanced. Není také jasné, zda bude přechod na Gemini 3 automatický pro všechny uživatele Gemini Live, nebo zda bude omezen na ty, kteří si experimentální funkce aktivují ručně. Kód existuje, ale vše, co s ním souvisí, je ve hvězdách.

Potenciální dopad Gemini na interakci s mobilními zařízeními

Implementace těchto experimentálních funkcí by mohla způsobit revoluci ve způsobu interakce s mobilními zařízeními. Schopnost agenta umělé inteligence ovládat telefon by mohla usnadnit každodenní úkoly a umožnit uživatelům soustředit se na důležitější činnosti. Například lidé s tělesným postižením by mohli mít velký prospěch ze systému, který by automatizoval úkoly, které by jinak bylo obtížné provádět.

Režim pozastaveného myšlení by navíc mohl zlepšit kvalitu odpovědí umělé inteligence a umožnit hlubší a podrobnější analýzu dotazů uživatelů. To by mohlo být obzvláště užitečné v kontextech, kde jsou přesnost a hloubka informací klíčové, například ve vzdělávacím nebo profesním prostředí.

Announcing the Gemini Live API is now generally available! Try it on @GoogleCloud and @GoogleAIStudio. Here's my JARVIS demo: pic.twitter.com/fDS528dgQ6

— Addy Osmani (@addyosmani) December 13, 2025

Tyto inovace však také vyvolávají obavy o soukromí a bezpečnost. Schopnost umělé inteligence ovládat zařízení vyvolává otázky ohledně toho, jaké údaje jsou shromažďovány a jak jsou využívány. Google bude muset tyto obavy řešit, aby si získal důvěru uživatelů a zajistil, že tyto technologie budou implementovány etickým a bezpečným způsobem.

Ačkoli jsou tyto experimentální funkce Gemini Live stále ve vývoji a nemusí se dostat k veřejnosti, jejich potenciál změnit interakci s mobilními zařízeními je významný. S rozvojem technologie bude zajímavé sledovat, jak se Google a další společnosti vypořádají s výzvami a příležitostmi, které umělá inteligence v této oblasti představuje.

Gemini Live: Když váš mobil ví, co chcete, dřív než to řeknete

Od sprintu k maratonu

Potenciální dopad Gemini na interakci s mobilními zařízeními

Zdroje článku

300 neznámých světů v jednom kořeni. Objev v Chile mění pohled n...

Vizuální šifra na křídlech F-16: Červený kroužek na bombách může značit zbraně určené k vypalování bunkrů

Nadzvuková odveta proti Íránu: Legendární bombardér B-1 Lancer vede údery na raketovou infrastrukturu

Revoluce v léčbě rakoviny: Nanočástice přeprogramují imunitu přímo v těle pacienta bez odběru buněk

Když se žák stává učitelem: Ukrajina se z prosby o pomoc proti íránským dronům stala nepostradatelným partnerem USA

Dokumenty

Gemini Live: Když váš mobil ví, co chcete, dřív než to řeknete

Od sprintu k maratonu

Související článek

Sbohem raketovým štítům. Nová zbraň od Hyundai zasáhne cíl v řádu minut a díky manévrům nejdou sestřelit

Potenciální dopad Gemini na interakci s mobilními zařízeními

Zdroje článku

Dokumenty