search
Cloud blog Google Cloud – Pohled pod kapotu Gemini Spark: Neustále aktivní agent od Googlu
Google Cloud

Pohled pod kapotu Gemini Spark: Neustále aktivní agent od Googlu

Na konferenci Google I/O ’26 překročila umělá inteligence dosavadní hranice. Otázka už nezní „Dokáže AI odpovědět na můj dotaz?“, ale „Může to AI rovnou vyřídit?“.

Díky Gemini Spark zní odpověď ano. Je to váš osobní agent, který funguje 24/7. Převezme od vás složité úkoly o několika krocích, vyřeší je na pozadí a ozve se vám, až když je potřeba udělat finální rozhodnutí.

Přesně v tom spočívá rozdíl mezi asistentem, který čeká na pokyny, a parťákem, který prostě dotahuje věci do konce.

Jako globální Google Cloud Partner úrovně Premier tento segment neustále sledujeme — stejně jako Spark dnem i nocí plní své úkoly. A tento nástroj nás opravdu zaujal. Tady je důvod, proč by měl zajímat i vás.

Technologie v pozadí

Všichni tradiční AI asistenti mají stejné omezení — zkrátka u toho musíte být. Mít otevřenou kartu, zůstat v aplikaci a čekat na odpověď. Spark je ale postavený úplně jinak.

Běží na vyhrazených virtuálních počítačích kompletně v prostředí Google Cloud. To znamená, že můžete Sparku zadat komplexní proces, zavřít notebook a jít od toho. Agent se nezastaví, jeho relace nevyprší a nepotřebuje váš dohled. V podstatě jde o osobní verzi toho, co firemním zákazníkům nabízí Gemini Enterprise Agent Platform.

Infrastrukturou, která to celé umožňuje, je Antigravity Harness. Původně vznikla pro autonomní vývoj softwaru, ale Google ji upravil tak, aby zvládala dlouhotrvající úlohy na pozadí pro běžné uživatele. Gemini Spark navíc pohání nejnovější rodina modelů Gemini 3.5.

Google I/O ‘26 ukázal, že Gemini 3.5 Flash zpracovává tokeny čtyřikrát rychleji než srovnatelné špičkové modely konkurenčních laboratoří. To je naprosto klíčové, když musíte analyzovat vágní instrukce v přirozeném jazyce, rozdělit je do logických kroků a ty pak postupně realizovat. Právě tato syrová rychlost a hloubka logického uvažování umožňují Sparku skutečně splnit to, co po něm chcete.

Rozhraní Gemini Spark

Agent běžící na pozadí je užitečný jen tehdy, když víte, co vlastně dělá. Google proto celou aplikaci Gemini přerodil kolem řešení tohoto problému. Když nové rozhraní otevřete, přistanete přímo na hlavním panelu (dashboardu) — centrálním velínu, který v reálném čase ukazuje vše, na čem agent zrovna pracuje.

Každý dlouhodobý úkol se zobrazuje jako samostatné vlákno, takže můžete kontrolovat postup, aniž byste práci přerušovali. Gemini Spark má navíc do celého procesu pevně zabudované kontrolní body pro schválení. Bez vašeho souhlasu neodešle e-mail ani nesmaže událost v kalendáři.

Všechno navrhne, zorganizuje, připraví a pak počká na vaši revizi, než akci finálně spustí. Agent sice pracuje s velkou mírou autonomie, ale poslední slovo máte vždy vy.

Pokročilá syntéza informací a komunikační procesy

Hned po spuštění se Spark propojí s Google Workspace a dokáže posbírat informace z celé vaší digitální stopy. To od základu mění způsob, jakým píšete běžné aktualizační e-maily.

V ukázce během prezentace na Google I/O zadal uživatel text: „Napiš shrnutí pro tým, které pokryje vše o našich nedávných launchích Gemini Live a úspěších za poslední týden.“ Spark prohledal uživatelovy Dokumenty Google, schránku Gmail i historii chatů z daného období a vybral ty nejrelevantnější informace ještě předtím, než napsal jediné slovo.

Aby výsledek zněl autenticky, uživatel využil personalizovanou dovednost s příkazem /ghost writer. Ten instruuje Gemini Spark, aby napodobil tón hlasu, slovní zásobu a styl psaní daného člověka. Uživatelé mohou nahrávat své vlastní dovednosti nebo je stahovat online, takže agenta lze vyladit přesně podle toho, jak reálně pracujete, a ne jak si to Google představoval.

Komplexní plánování událostí v několika krocích

Skutečnou zkouškou pro každého agenta je úkol, který by člověku běžně zabral hodiny administrativy a neustálého vyjasňování. Skvělým příkladem byla ukázka plánování sousedské slavnosti.

Uživatel zadal jediný, komplexní pokyn: „Projdi všechna potvrzení účasti, zkontroluj, co kdo přinese, a urguj ty, co ještě neodpověděli.“ Spark si to rozkouskoval do koordinované série kroků:

  1. Nejprve vytvořil živý přehled hostů přímo v Tabulkách Google. Protože je Spark propojený s Gmailem, tabulka se automaticky aktualizovala s každým novým potvrzením v doručené poště, bez jakéhokoli ručního přepisování.
  2. Zároveň Gemini Spark identifikoval sousedy, kteří dosud neodpověděli, a připravil koncepty upomínkových e-mailů, které uživateli předložil ke schválení.
  3. K tomu navíc sestavil vizuální prezentaci v Prezentacích Google s obrázky, které měly na akci nalákat.
  4. Pak přišel detail, který celou ukázku posunul na jinou úroveň. Spark proskenoval uživatelův Disk Google, našel stanovy místního sousedského sdružení a vytáhl z nich specifické pravidlo, že přípravy nesmí začít před pátečním odpolednem 5. června.
  5. Spark toto pravidlo sám od sebe zvýraznil jako pevné omezení, aniž by ho kdokoli žádal o prohledávání dokumentů.

Přesně v tom tkví rozdíl mezi pouhým plněním úkolů a skutečným chápáním kontextu.

Rychlé hlasové poznámky z mobilu

Dobré nápady a urgentní úkoly nečekají, až sednete k počítači. Gemini Spark běží na Androidu i iOS a úkoly se od samého začátku synchronizují napříč všemi vašimi zařízeními. Mobilní prostředí je navrženo speciálně pro situace, kdy potřebujete bleskově dostat myšlenky z hlavy k agentovi.

Díky živému přepisu zvuku a pokročilému zpracování hlasu můžete vychrlit rychlý, nestrukturovaný proud požadavků a Spark je zachytí a roztřídí. V hlavní ukázce uživatel namluvil jedinou hlasovou zprávu, která obsahovala tři naprosto nesouvisející úkoly:

  1. Najít všechny nadcházející schůzky s konkrétním manažerem a v kalendáři je označit sytě růžovou barvou.
  2. Připravit pozvánku pro nového souseda na chystanou slavnost.
  3. Sestavit pro děti přehled úkolů do konce školního roku seřazený podle termínů.

Spark celou nahrávku analyzoval, rozdělil ji na tři samostatné požadavky a pro každý z nich spustil vlastní paralelní proces. Uživatel mohl odložit telefon a jít se věnovat svému dni.

A o to přesně jde.

Síla protokolu MCP

Aktuálně je Gemini Spark skvělý v plnění toho, o co si řeknete. Dalším krokem je ale schopnost jednat ještě předtím, než vůbec otevřete pusu.

Přesně to přináší integrace Model Context Protocol (MCP). V nadcházejících týdnech se Spark přes MCP propojí s nástroji a aplikacemi třetích stran a začne pro vás předvídat situace.

Pokud v kalendáři uvidí, že máte na páteční schůzce na starosti občerstvení, dokáže se spojit s MCP nástrojem Instacart, vybrat vhodné občerstvení a sám připravit objednávku k doručení. Navíc si pamatuje detaily, na kterých záleží — pokud má někdo v týmu alergii na ořechy, stoprocentně to zohlední.

Posun od reaktivního k proaktivnímu přístupu je obrovským skokem. Je to rozdíl mezi agentem, který pomáhá, a agentem, který předvídá.

Zabezpečené autonomní nakupování: AP2, UCP a univerzální nákupní košík

Jakmile za vás agent může nakupovat, musí být kybernetická bezpečnost v jeho pozadí naprosto neprůstřelná. Google proto zavádí dva základní protokoly, které to řeší.

Prvním je Agent Payments Protocol (AP2). Uživatelé si předem nastaví pevné mantinely — například preferované značky, schválené produkty a finanční limity — a Spark může provádět pouze transakce, které do nich zapadají. Každý nákup navíc generuje ověřitelný digitální záznam odolný proti manipulaci, který bezpečně propojuje uživatele, obchodníka i poskytovatele plateb. Pokud potřebujete reklamovat platbu nebo vrátit zboží, všechny strany vidí tentýž kryptografický záznam. Protokol AP2 navíc po celou dobu chrání vaše skutečné platební údaje. Ostrý start v Gemini Spark proběhne v nejbližších měsících.

Druhým pilířem je Universal Commerce Protocol (UCP). Nejlépe se dá popsat jako otevřený standardizovaný jazyk pro e-commerce na celém webu — podobně jako HTTP sjednocuje načítání stránek. S partnery u zrodu, jako jsou Amazon, Meta, Microsoft, Salesforce a Stripe, zajišťuje UCP konzistentní vyhledávání produktů, placení i sledování zásilek bez ohledu na to, kde nákup začnete.

Tyto dva protokoly pohánějí Universal Cart (Univerzální košík). Funguje napříč různými e-shopy a službami, přičemž položky do něj můžete přidávat z Vyhledávání, Gemini, YouTube nebo Gmailu. Jakmile zboží v košíku přistane, modely Gemini na pozadí začnou vyhledávat slevy, sledovat historii cen a hlídat naskladnění.

Košík vás navíc upozorní na problémy s kompatibilitou. Pokud si skládáte pracovní PC a přidáte do košíku procesor a základní desku s nekompatibilními paticemi, okamžitě chybu nahlásí a navrhne nápravu. Propojuje se také s Google Wallet, takže automaticky vytáhne nejvýhodnější benefity z vašich platebních karet nebo věrnostní nabídky prodejců.

Universal Cart startuje v USA ve Vyhledávání a v aplikaci Gemini už letos v létě.

Budoucí ekosystém: Chrome, Android Halo a macOS

Expanze běží na plné obrátky. Později v létě bude tento nový asistent fungovat přímo v Google Chrome jako autonomní prohlížeč, který dokáže pod vaším vedením procházet veřejný web a provádět akce. Pro mobily Google oznámil „Android Halo“ — dedikované prostředí pro agenty integrované přímo do operačního systému Android, které dorazí koncem roku.

Hlasové funkce, které pohánějí mobilní poznámky, se dostanou i na stolní počítače. Nová aplikace Gemini pro macOS — kterou malý tým postavil na platformě Antigravity od nuly za necelých 100 dní — dostane hlasovou integraci během léta. Uživatelé Maců budou moci označit soubory ve Finderu, nadiktovat pokyny přes klávesovou zkratku a Spark rovnou napíše odpověď, která bude obsah těchto souborů zohledňovat.

V prezentaci bylo vidět, jak uživatel vybral pár PDF faktur a fotek, namluvil krátkou poznámku a sledoval, jak Spark sestavil kompletní e-mail pro psí hotel. Netřeba dodávat, že si z těch souborů sám vytáhl všechny záznamy o očkování i detaly o alergiích.

Hlasový model navíc filtruje projev v reálném čase, takže odmaže parazitní slova a přeřeknutí. Výsledkem je čisté zadání, i když váš původní monolog byl jen chaotický proud myšlenek.

Ranní přehled na míru

Se Sparkem a jeho prací na pozadí úzce spolupracuje nová integrovaná funkce Daily Brief (Denní přehled). Má sloužit jako vaše první ranní zastávka — personalizovaný souhrn, který dává dohromady nejdůležitější informace z vašeho digitálního života.

Místo toho, aby na vás vyvalil strohý seznam e-mailů a schůzek, Daily Brief vše uspořádá podle témat, nejurgentnější věci posune nahoru a rovnou do textu vloží konkrétní návrhy dalších kroků.

Může vás upozornit na blížící se deadline nebo připomenout, že musíte vrátit zboží z e-shopu, než vyprší lhůta. Je navržený tak, abyste ho prolétli očima, za dvě minuty věděli o všech povinnostech, jedním klepnutím spustili proces ve Sparku a mohli jít v klidu dál.

Dostupnost, ceny a výhled do budoucna

Google nasazuje Spark po etapách. Spustit autonomní agenty v režimu 24/7 vyžaduje masivní infrastrukturu a laťka pro bezpečnost je nastavena výše než kdykoli předtím. Jako první získají přístup vybraní testeři, následovat bude beta verze pro předplatitele Google AI Ultra v USA.

Aby Google pokryl výpočetní nároky těchto autonomních procesů, představil nové předplatné Google AI Ultra za 100 USD měsíčně. Zároveň na základě zpětné vazby uživatelů a optimalizace infrastruktury zlevnil nejvyšší plán Ultra s maximálními limity z 250 USD na 200 USD měsíčně.

Kromě jednotlivců míří Gemini Spark také do firem. Google potvrdil, že specializované verze dorazí do Workspace i Gemini Enterprise, takže organizace budou moci nasadit nepřetržitou podporu agentů napříč svými týmy a firemními operacemi.

Éra autonomních agentů se neblíží, přátelé. Už je tady.

Spark pokračuje v práci, i když spíte — Gemini pomáhá, když pracujete Zatímco Spark běží nepřetržitě na pozadí, vaši lidé tráví celé dny v Gmailu, Dokumentech, Tabulkách či Meetu. V Cloudfresh vám ukážeme, kde přesně má AI od Googlu největší přínos, zaškolíme váš tým a postaráme se o to, aby bylo celé nastavení od prvního dne čisté a bezpečné. Získat konzultaci a školení pro Gemini →
CTA Image