Cloud Blog – Google Cloud – Poznaj Gemini Spark: Stale aktywnego agenta od Google

Witamy w specjalnym cyklu artykułów poświęconym Google I/O ’26

Google Antigravity 2.0: Projektowanie oprogramowania z systemami wieloagentowymi 01

Poznaj Gemini Spark: Stale aktywnego agenta od Google 02

Gemini Omni: Nadchodzi model świata 03

Google Cloud 12.06.2026

Poznaj Gemini Spark: Stale aktywnego agenta od Google

Technologia, która za tym stoi
Interfejs Gemini Spark
Zaawansowana synteza i procesy komunikacyjne
Kompleksowe i wieloetapowe planowanie wydarzeń
Mobilny „brain-dump” i polecenia głosowe
Potęga protokołu MCP
Bezpieczny handel autonomiczny: AP2, UCP i Uniwersalny Koszyk
Przyszłość ekosystemu: Chrome, Android Halo i macOS
Spersonalizowany poranny przegląd
Dostępność, ceny i dalsze plany

Podczas konferencji Google I/O ’26 sztuczna inteligencja przekroczyła kolejną granicę. Przestaliśmy pytać: „Czy AI odpowie na moje pytanie?”, a zaczęliśmy: „Czy AI może po prostu się tym zająć?”.

Dzięki Gemini Spark odpowiedź brzmi: tak. To Twój osobisty, całodobowy agent, odciążający Cię ze złożonych, wieloetapowych zadań. Działa w tle i wraca do Ciebie tylko wtedy, gdy wymagana jest decyzja.

To zasadnicza różnica między asystentem, który czeka na instrukcje, a takim, który po prostu działa.

Jako globalny partner Google Cloud o statusie Premier trzymamy rękę na pulsie technologii przez całą dobę — dokładnie tak, jak Spark realizuje swoje zadania. To rozwiązanie naprawdę przykuło naszą uwagę. Zobacz, dlaczego powinno zainteresować również Ciebie.

Technologia, która za tym stoi

Wszyscy tradycyjni asystenci AI mają to samo ograniczenie — musisz przy nich być. Musisz mieć otwartą kartę, pozostać w aplikacji i czekać na odpowiedź. Spark powstał na zupełnie innych fundamentach.

Działa na dedykowanych maszynach wirtualnych w całości hostowanych w Google Cloud. Oznacza to, że możesz zlecić mu złożone, wieloetapowe zadanie i po prostu zamknąć laptopa. Agent nie przerwie pracy, nie rozłączy się ani nie potrzebuje Twojego nadzoru. W pewnym sensie to spersonalizowana wersja możliwości, jakie oferuje Gemini Enterprise Agent Platform.

Infrastrukturą umożliwiającą to wszystko jest Antigravity Harness. Rozwiązanie to stworzono pierwotnie z myślą o autonomicznym rozwoju oprogramowania, a teraz przystosowano je do obsługi długotrwałych zadań w tle dla użytkowników końcowych. Co więcej, Gemini Spark bazuje na najnowszej rodzinie modeli Gemini 3.5.

Google I/O ‘26 pokazało, że Gemini 3.5 Flash przetwarza tokeny cztery razy szybciej niż porównywalne, czołowe modele na rynku. Ma to ogromne znaczenie, gdy AI musi przeanalizować nieprecyzyjne instrukcje w języku naturalnym, podzielić je na logiczne kroki i realizować jeden po drugim. Ta czysta szybkość i głębia wnioskowania sprawiają, że Spark realnie dowozi to, o co go poprosisz.

Interfejs Gemini Spark

Agent działający w tle jest przydatny tylko wtedy, gdy wiesz, co robi. Google zaprojektowało aplikację Gemini na nowo, odpowiadając właśnie na to wyzwanie. Otwierając nowe narzędzie, trafiasz na pulpit nawigacyjny — centralny panel sterowania, który w czasie rzeczywistym pokazuje aktualne działania agenta.

Każde długoterminowe zadanie pojawia się jako osobny wątek, dzięki czemu możesz sprawdzać postępy bez przerywania pracy. Gemini Spark wyposażono w wyraźne punkty kontrolne wymagające akceptacji. Nie wyśle on wiadomości e-mail ani nie usunie wydarzenia z kalendarza bez Twojej zgody.

Tworzy wersje robocze, porządkuje, przygotowuje, a następnie czeka na Twój przegląd przed ostatecznym działaniem. Agent cieszy się dużą autonomią, ale ostatnie słowo zawsze należy do Ciebie.

Zaawansowana synteza i procesy komunikacyjne

Spark od razu łączy się z Google Workspace i potrafi agregować informacje z całego Twojego cyfrowego środowiska. To całkowicie zmienia podejście do pisania rutynowych wiadomości statusowych.

Podczas prezentacji na Google I/O użytkownik poprosił o przygotowanie podsumowania dla zespołu, obejmującego „wszystko na temat naszych ostatnich wdrożeń Gemini na żywo i sukcesów z minionego tygodnia”. Zanim Spark napisał choćby jedno słowo, przeszukał Dokumenty Google, skrzynkę Gmail oraz historię czatów z tego konkretnego okresu, wyciągając najważniejsze dane.

Aby tekst brzmiał naturalnie, użytkownik użył niestandardowej funkcji poleceniem /ghost writer. Nakazuje ono Gemini Spark odzwierciedlić ton, słownictwo i styl pisania autora. Możesz przesyłać własne próbki stylu lub pobierać je z sieci, co oznacza, że dopasujesz agenta do swojego rzeczywistego sposobu pracy, a nie do ogólnych założeń Google.

Kompleksowe i wieloetapowe planowanie wydarzeń

Prawdziwym sprawdzianem dla każdego agenta są zadania, które normalnie wymagają godzin żmudnej administracji. Świetnym przykładem była prezentacja planowania sąsiedzkiego pikniku.

Użytkownik wydał jedno złożone polecenie: zbierz wszystkie potwierdzenia obecności, sprawdź, co przyniosą goście, i przypomnij się tym, którzy jeszcze nie odpowiedzieli. Spark rozpisał to na sekwencję zorganizowanych kroków:

Najpierw stworzył automatyczny arkusz do śledzenia obecności bezpośrednio w Arkuszach Google. Ponieważ Spark łączy się z Gmailem, arkusz aktualizował się sam, gdy do skrzynki wpadały nowe odpowiedzi — bez ręcznego przepisywania danych.
W tym samym czasie Gemini Spark zidentyfikował sąsiadów, którzy jeszcze nie odpowiedzieli, i przygotował dla użytkownika projekty maili z przypomnieniem do wglądu.
Przygotował również wizualną prezentację w Prezentacjach Google ze zdjęciami budującymi zaangażowanie wokół wydarzenia.
Następnie zobaczyliśmy szczegół, który wyróżnił tę prezentację. Spark przeszukał Dysk Google użytkownika, znalazł regulamin wspólnoty mieszkaniowej i wyciągnął z niego konkretny zapis mówiący o tym, że rozstawianie sprzętu nie może rozpocząć się przed piątkowym popołudniem 5 czerwca.
Spark samoczynnie wskazał to jako ograniczenie, choć nikt nie prosił go o szukanie przepisów.

Oto różnica między zwykłym wykonywaniem zadań a realnym rozumieniem kontekstu.

Mobilny „brain-dump” i polecenia głosowe

Dobre pomysły i pilne sprawy do załatwienia nie czekają, aż usiądziesz przy biurku. Gemini Spark działa zarówno na systemie Android, jak i iOS, a zadania od razu synchronizują się na wszystkich Twoich urządzeniach. Mobilna wersja powstała specjalnie z myślą o tak zwanym „brain-dumpie” — czyli szybkim zrzuceniu myśli z głowy bezpośrednio w ręce agenta.

Dzięki transkrypcji audio na żywo i zaawansowanemu przetwarzaniu głosu, możesz nagrać szybki, niesformatowany strumień myśli, a Spark wychwyci i uporządkuje zadania. W pokazie głównym użytkownik nagrał jedną wiadomość głosową zawierającą trzy zupełnie różne tematy:

Pierwszym było znalezienie wszystkich nadchodzących spotkań z konkretnym dyrektorem i oznaczenie ich w kalendarzu wyrazistym różowym kolorem.
Drugim — przygotowanie projektu zaproszenia na piknik dla nowego sąsiada.
Trzecim — stworzenie listy zadań na koniec roku szkolnego dla dzieci użytkownika, posortowanej według terminów.

Spark przeanalizował całe nagranie, odseparował trzy prośby i uruchomił dla każdej osobny, równoległy proces. Użytkownik odłożył telefon i zajął się swoimi sprawami.

I o to dokładnie chodzi.

Potęga protokołu MCP

Obecnie Gemini Spark świetnie realizuje Twoje polecenia. Kolejnym krokiem jest umiejętność działania, zanim w ogóle o coś zapytasz.

Właśnie to umożliwia integration z protokołem Model Context Protocol (MCP). W nadchodzących tygodniach Spark połączy się za pośrednictwem MCP z zewnętrznymi narzędziami i aplikacjami, zaczynając przewidywać Twoje potrzeby.

If zauważy w Twoim kalendarzu hasło „odpowiedzialny za przekąski” przy piątkowym spotkaniu, połączy się z narzędziem Instacart przez MCP, dobierze odpowiednie produkty i sam skonfiguruje zamówienie dostawy. Co więcej, zapamięta kluczowe szczegóły — jeśli ktoś w zespole ma alergię na orzechy, na pewno uwzględni to przy zakupach.

Przejście od reaktywności do proaktywności to kamień milowy. To różnica między agentem, który pomaga, a takim, który Cię uprzedza.

Bezpieczny handel autonomiczny: AP2, UCP i Uniwersalny Koszyk

Kiedy agent zyskuje możliwość robienia zakupów w Twoim imieniu, architektura cyberbezpieczeństwa musi być całkowicie szczelna. Google wprowadza do dwa fundamentalne protokoły, aby to zapewnić.

Pierwszym z nich jest Agent Payments Protocol (AP2). Użytkownicy z góry określają sztywne ramy, takie jak preferowane marki, zatwierdzone produkty czy limity wydatków — a Spark może realizować transakcje wyłącznie w ich granicach. Każda płatność opiera się na weryfikowalnym, odpornym na manipulacje cyfrowym zapisie łączącym użytkownika, sprzedawcę i operatora płatności. W razie sporu czy zwrotu każda ze stron widzi ten sam kryptograficzny rekord. Dodatkowo AP2 przez cały czas chroni Twoje rzeczywiste dane płatnicze. Wdrożenie w Gemini Spark rozpocznie się w najbliższych miesiącach.

Drugim elementem układanki jest Universal Commerce Protocol (UCP). Najlepiej opisać go jako wspólny, otwarty standard dla całego e-commerce w sieci — analogicznie do sposobu, w jak HTTP standaryzuje ładowanie stron internetowych. Dzięki partnerom założycielskim, wśród których są Amazon, Meta, Microsoft, Salesforce i Stripe, UCP ujednolica wyszukiwanie produktów, finalizację zakupu i śledzenie przesyłek na każdym etapie, niezależnie od tego, gdzie zaczynasz zakupy.

Te dwa protokoły napędzają Uniwersalny Koszyk. Działa on u różnych sprzedawców i w wielu usługach, a produkty dodasz do niego z poziomu wyszukiwarki, Gemini, YouTube czy Gmaila. Gdy produkt trafi do koszyka, modele Gemini pracują w tle: szukają okazji, analizują historię cen i wysyłają powiadomienia o ponownej dostępności.

Koszyk wyłapuje również problemy z kompatybilnością. Jeśli podczas składania komputera do pracy dodasz procesor i płytę główną z gniazdami, które do siebie nie pasują, system oznacza błąd i zaproponuje rozwiązanie. Łączy się także z Portfelem Google, automatycznie podpowiadając dostępne korzyści z kart kredytowych czy oferty lojalnościowe sprzedawców.

Uniwersalny Koszyk zadebiutuje tego lata w USA w wyszukiwarce oraz aplikacji Gemini.

Przyszłość ekosystemu: Chrome, Android Halo i macOS

Ekosystem rozwija się błyskawicznie. Pod koniec lata nowy asystent zacznie działać bezpośrednio w Google Chrome jako autonomiczna przeglądarka, zdolna do poruszania się po publicznej sieci i podejmowania działań w Twoim imieniu pod Twoim kierunkiem. Na urządzeniach mobilnych Google zapowiedziało „Android Halo” — wbudowane w system operacyjny centrum dowodzenia dla agentów, które pojawi się jeszcze w tym roku.

Funkcje głosowe znane z mobilnego „brain-dumpu” trafią też na komputery stacjonarne. Nowa aplikacja Gemini dla systemu macOS — stworzona od zera przez niewielki zespół na platformie Antigravity w niecałe 100 dni — otrzyma integrację głosową w okresie letnim. Użytkownicy komputerów Mac będą mogli zaznaczyć pliki w Finderze, użyć skrótu klawiszowego, by podyktować instrukcje, a Spark od razu przygotuje odpowiedź uwzględniającą zawartość tych dokumentów.

Podczas prezentacji pokazano, jak użytkownik wybrał kilka faktur PDF oraz zdjęć, wypowiedział krótką notatkę i patrzył, jak Spark tworzy kompletny e-mail do schroniska dla psów. Naturalnie, wszystkie informacje o szczepieniach i alergiach zostały pobrane bezpośrednio ze wskazanych plików.

Model głosowy filtruje wypowiedź w czasie rzeczywistym, usuwając z niej pauzy, powtórzenia i przejęzyczenia. Dzięki temu powstaje czyste polecenie, nawet jeśli na wejściu był to chaotyczny strumień myśli.

Spersonalizowany poranny przegląd

Idealnym dopełnieniem procesów wykonywanych przez Gemini Spark w tle jest nowa, gotowa do użycia funkcja o nazwie Daily Brief. Zaprojektowano ją jako Twój pierwszy punkt orientacyjny o poranku — to spersonalizowany przegląd, który agreguje najważniejsze informacje z Twojego cyfrowego życia.

Zamiast zasypywać Cię surową listą maili i spotkań, Daily Brief porządkuje wszystko tematycznie, umieszcza najpilniejsze sprawy na samej górze i bezpośrednio w tekście sugeruje konkretne dalsze kroki.

Może zasygnalizować zbliżający się termin ważnego zadania lub przypomnieć o konieczności zwrotu zakupów przed zamknięciem okna zwrotu. Całość stworzono z myślą o szybkim skanowaniu wzrokiem — zapoznanie się z obowiązkami zajmuje dwie minuty, po czym jednym kliknięciem uruchamiasz proces Sparka i spokojnie zaczynasz dzień.

Dostępność, ceny i dalsze plany

Google wdraża Sparka etapami. Utrzymanie autonomicznych agentów działających przez całą dobę wymaga potężnej infrastruktury, a poprzeczka bezpieczeństwa została zawieszona najwyżej w historii. W pierwszej kolejności dostęp zyskają zaufani testerzy, a następnie subskrybenci planu Google AI Ultra w Stanach Zjednoczonych w wersji beta.

Aby sprostać wymaganiom obliczeniowym procesów agentowych, Google wprowadziło nowy plan Google AI Ultra w cenie 100 USD miesięcznie. Jednocześnie, reagując na opinie użytkowników i optymalizację infrastruktury, obniżono cenę najwyższego planu Ultra z dotychczasowych 250 USD do 200 USD miesięcznie.

Oprócz użytkowników indywidualnych Gemini Spark trafia także do środowisk biznesowych. Google potwierdziło, że specjalne wersje pojawią się zarówno w Workspace, jak i w Gemini Enterprise. Pozwoli to organizacjom wdrożyć całodobowe wsparcie agentów w swoich zespołach i operacjach biznesowych.

Era autonomicznych agentów nie nadchodzi — ona już tu jest.

Spark działa dalej, gdy Ty śpisz. Gemini wspiera Cię, gdy Ty pracujesz. Spark realizuje zadania bez przerwy, ale Twoje zespoły spędzają cały dzień w Gmailu, Dokumentach, Arkuszach, Meet i pozostałych aplikacjach Workspace. Cloudfresh precyzyjnie wskaże miejsca, w których sztuczna inteligencja od Google przynosi realną wartość, przeszkoli Twoich pracowników z jej obsługi oraz zadba o czystą i bezpieczną konfigurację środowiska od pierwszego dnia. Skorzystaj z doradztwa i szkoleń Gemini →