search
Cloud Блог Google Cloud – Усередині Gemini Spark: Безперервний ШІ-агент від Google
Google Cloud

Усередині Gemini Spark: Безперервний ШІ-агент від Google

На Google I/O ’26 ШІ подолав межу, якої раніше не перетинав. Питання більше не звучить як «Чи може ШІ відповісти?». Тепер ми запитуємо: «Чи може ШІ просто це зробити?».

Із появою Gemini Spark відповідь — так. Це персональний агент, який працює 24/7 і забирає на себе складні, багатоетапні завдання. Він виконує їх у фоновому режимі й повертається до вас лише тоді, коли потрібно ухвалювати рішення.

Це та сама різниця між асистентом, який чекає на вказівки, і тим, хто бере й робить.

Як глобальний партнер Google Cloud рівня Premier, мы моніторимо цей простір цілодобово — так само як Spark виконує свої агентні завдання. І цей реліз справді привернув нашу увагу. Ось чому він має зацікавити й вас.

Базові технології

Кожен традиційний ШІ-асистент має одне й те саме обмеження: ви повинні бути поруч. Тримати вкладку відкритою, залишатися в застосунку, чекати на відповідь. Але Spark побудований інакше.

Він працює на виділених віртуальних машинах, повністю розміщених у Google Cloud. Це означає, що ви можете передати Spark складне багатоетапне завдання і просто закрити ноутбук. Агент не ставить роботу на паузу, не вилітає за тайм-аутом і не потребує вашого нагляду. Певною мірою це персональна версія того, що ви можете робити з Gemini Enterprise Agent Platform.

Інфраструктура, яка робить усе це можливим, — Antigravity Harness. Спочатку її розробили для агентної розробки ПЗ, а тепер адаптували для довготривалих фонових завдань користувачів. До того ж Gemini Spark працює на новій родині моделей Gemini 3.5.

Google I/O ’26 продемонстрував, що Gemini 3.5 Flash обробляє токени вчетверо швидше, ніж аналогічні передові моделі. Це має критичне значення, коли ви аналізуєте нечіткі інструкції природною мовою, розбиваєте їх на логічні кроки та виконуєте один за одним. Саме чиста швидкість і глибина мислення дозволяють Spark реально виконувати те, що ви просите.

Інтерфейс Gemini Spark

Фоновий агент корисний лише тоді, коли ви знаєте, що він робить. Google переробив застосунок Gemini саме з огляду на цю проблему. Відкривши новий інтерфейс, ви потрапляєте на дашборд — центральну панель керування, яка в реальному часі показує все, над чим зараз працює агент.

Кожне довготривале завдання відображається як окремий тред, тож ви можете перевіряти прогрес, не перериваючи роботу. А Gemini Spark побудовано з чіткими контрольними точками для погодження. Він не надішле листа чи не видалить подію з календаря без вашого схвалення.

Він створює чернетки, структурує дані, все готує, а потім зупиняється й чекає на ваше рев’ю, перш ніж виконати дію. Агент має високий рівень автономності, але фінальне рішення залишається за вами.

Просунутий синтез та комунікаційні воркфлоу

Із коробки Spark підключається до Google Workspace і може збирати інформацію з усього вашого цифрового життя. Це повністю змінює уявлення про написання рутинних email-апдейтів.

У демо на Google I/O користувач попросив підготувати апдейт для команди, що охоплює «все про наші нещодавні запуски Gemini та перемоги за минулий тиждень». Перш ніж написати бодай слово, Spark проаналізував Google Документи, поштову скриньку Gmail та історію чатів за вказаний період і витягнув найрелевантнішу інформацію.

Аби результат дійсно звучав від імені користувача, він застосував кастомну персональну навичку за допомогою команди /ghost writer. Це вказує Gemini Spark скопіювати тон, словниковий запас і стиль письма автора. Користувачі може завантажувати власні навички або підтягувати їх із мережі. Це означає, що агента можна налаштувати під ваші реальні робочі процеси, а не под те, як їх уявляє Google.

Складне багатоетапне планування

Справжнім випробуванням для будь-якого агента є завдання, що зазвичай вимагає годин рутинної адмін-роботи. Демо з плануванням сусідської вечірки від Spark стало чудовим прикладом.

Користувач ввів один комплексний промпт: зібрати всі RSVP, відстежити, хто що приносить, і зв’язатися з тими, хто не відповів. Spark розбив це на скоординовану серію кроків.

  1. По-перше, він створив живий трекер RSVP безпосередньо в Google Таблицях. Оскільки Spark підключений до Gmail, таблиця оновлювалася в реальному часі в міру надходження нових відповідей — жодного ручного введення.
  2. Водночас Gemini Spark визначив сусідів, які ще не відповіли, та підготував чернетки email-нагадувань для перевірки користувачем.
  3. Він також зібрав візуальну презентацію в Google Презентаціях із зображеннями для підігріву інтересу до події.
  4. Потім відбулося те, що зробило демо справді особливим. Spark просканував Google Диск користувача, знайшов правила місцевого ОСББ і витягнув конкретний пункт, який забороняв починати підготовку раніше п’ятниці, 5 червня.
  5. Після цього Spark вивів це як обмеження, хоча його ніхто не просив шукати цю інформацію.

Саме в цьому полягає різниця між простим виконанням завдань і справжнім розумінням контексту.

Мобільний «brain-dumping» та голосові команди

Хороші ідеї та термінові завдання не чекають, поки ви опинитеся за робочим столом. Gemini Spark працює на Android та iOS, а завдання відразу синхронізуються між усіма вашими девайсами. Мобільний інтерфейс побудований навколо концепції, яку Google називає «brain-dumping» — тобто можливості швидко вивантажити все з голови та передати в руки агента.

Завдяки живій транскрипції аудіо та просунутій обробці голосу ви можете надиктувати швидкий, неструктурований потік запитів, а Spark спіймає їх і відсортує. У демо з презентації користувач записав одне голосове повідомлення, що містило три абсолютно різні завдання.

  1. Перше — знайти всі майбутні зустрічі з конкретним керівником і виділити їх у календарі яскраво-рожевим кольором.
  2. Друге — підготувати запрошення для нового сусіда на вечірку.
  3. Третє — скласть відсортований за дедлайнами чеклист завдань до кінця навчального року для дітей користувача.

Spark проаналізував усе повідомлення, розділив його на три запити та запустив паралельні треди для кожного з них. Користувач просто поклав телефон і повернувся до своїх справ.

І в цьому вся суть.

Потужність MCP

Зараз Gemini Spark чудово виконує ваші запити. Але наступний крок — здатність діяти ще до того, як ви про щось попросите.

Саме це відкриває інтеграція Model Context Protocol (MCP). Найближчими тижнями Spark почне підключатися до сторонніх інструментів і застосунків через MCP та діяти на випередження від вашого імені.

Якщо він помітить у календарі «відповідальність за снеки» на п’ятничну зустріч, то зможе підключитися до MCP-інструмента Instacart, обрати відповідні закуски та самостійно оформити доставку. До того ж він пам’ятає важливі деталі. Якщо в команді є хтось із алергією на горіхи, це обов’язково буде враховано.

Перехід від реактивного до проактивного підходу — це величезний крок. Це та сама різниця між агентом, який допомагає, і агентом, який передбачає.

Безпечна агентна комерція: AP2, UCP та Universal Cart

Коли агент отримує можливість робити покупки від вашого імені, його база з кібербезпеки має бути абсолютно надійною. Google розгортає два фундаментальні протоколи саме для цього.

Перший — Agent Payments Protocol (AP2). Користувачі заздалегідь встановлюють жорсткі параметри, як-от улюблені бренди, дозволені продукти та ліміти витрат — і Spark може здійснювати лише ті транзакції, що вписуються в ці межі. Кожна операція підкріплена цифровим записом із захистом від підробки, який пов’язує користувача, продавця та платіжну систему. Якщо потрібно оскаржити платіж чи оформити повернення, усі сторони працюють із єдиним криптографічним записом. AP2 постійно приховує ваші реальні платіжні реквізити. Розгортання почнеться разом із Gemini Spark у найближчі місяці.

Другий — Universal Commerce Protocol (UCP). Найкраще його можна описати як спільну open-source-мову для всієї e-commerce-індустрії в інтернеті. Це схоже на те, як HTTP стандартизує завантаження вебсторінок. Разом із партнерами-засновниками, включно з Amazon, Meta, Microsoft, Salesforce і Stripe, UCP робить пошук товарів, оформлення замовлення та відстеження доставки універсальними, незалежно від того, де ви почали шопінг.

Ці два протоколи є основою Universal Cart. Кошик працює з різними продавцями та сервісами, і ви можете додавати до нього товари безпосередньо з Пошуку, Gemini, YouTube або Gmail. Щойно товар опиняється в кошику, моделі Gemini починають працювати у фоновому режимі: шукають знижки, відстежують історію цін і надсилають сповіщення, коли товар знову з’являється в наявності.

До того ж кошик виявляє проблеми із сумісністю. Якщо під час збирання робочого ПК ви додасте процесор і материнську плату з різними сокетами, система вкаже на проблему й запропонує рішення. Вона також підключається до Google Wallet, щоб автоматично застосовувати бонуси вашої кредитної картки та пропозиції від ритейлерів.

Universal Cart з’явиться в США в Пошуку та застосунку Gemini вже цього літа.

Екосистема майбутнього: Chrome, Android Halo та macOS

Екосистема стрімко розширюється. Пізніше цього літа новий асистент працюватиме безпосередньо в Google Chrome як агентний браузер, здатний здійснювати навігацію відкритою мережею та виконувати дії від вашого імені й за вашими вказівками. Для мобільних пристроїв Google анонсував «Android Halo» — спеціальну домашню базу для агентів, вбудовану в Android OS, яка з’явиться пізніше цього року.

Голосові функції, що забезпечують мобільний «brain-dumping», з’являться і на десктопі. Новий застосунок Gemini для macOS — створений з нуля невеликою командою на базі платформи Antigravity менш ніж за 100 днів — отримає голосові інтеграції вже влітку. Користувачі Mac зможуть виділяти файли у Finder, диктувати інструкції за допомогою комбінацій клавіш і отримувати від Spark готову чернетку, що базується на вмісті цих файлів.

Під час презентації нам показали демо: користувач обрав кілька PDF-рахунків і фотографій, надиктував коротке повідомлення — і Spark миттєво підготував повноцінний лист до готелю для собак. Звісно ж, він самостійно витягнув із файлів усі записи про вакцинацію та інформацію щодо алергій.

Голосова модель також фільтрує аудіо в реальному часі, видаляючи слова-паразити й запинки. Тому на виході ви отримуєте чистий промпт, навіть якщо вхідний запит був просто набором думок.

Персоналізований ранковий дайджест

У тандемі з фоновою роботою Gemini Spark працює нова out-of-the-box-функція Daily Brief. Це ваша перша зупинка зранку — персоналізований дайджест, який збирає найважливішу інформацію з усього вашого цифрового життя.

Замість того, щоб видавати сирий список листів і подій з календаря, Daily Brief сортує все за темами, розміщує найтерміновіші завдання зверху й відразу пропонує конкретні наступні кроки.

Він може підсвітити дедлайн, що наближається, або нагадати про необхідність повернути покупку до закриття вікна повернення. Дайджест створений для швидкого перегляду — ви можете за дві хвилини розібратися зі справами, запустити воркфлоу Spark одним тапом і спокійно розпочати день.

Доступність, ціни та плани на майбутнє

Google розгортає Spark поетапно. Для цілодобової роботи автономних агентів потрібна серйозна інфраструктура, а планка безпеки зараз висока як ніколи. Спочатку доступ отримають довірені тестувальники, а згодом розпочнеться бета-тест для підписників Google AI Ultra у США.

Аби забезпечити обчислювальні потреби агентних воркфлоу, Google представив новий тарифний план Google AI Ultra за $100 на місяць. Водночас завдяки відгукам користувачів і вдосконаленню інфраструктури вартість максимального тарифу Ultra знизилася з $250 до $200 на місяць.

Крім рішень для індивідуальних користувачів, Gemini Spark адаптують і для професійного середовища. Google підтвердив, що спеціалізовані версії з’являться як у Workspace, так і в Gemini Enterprise. Це дозволить компаніям розгортати цілодобову агентну підтримку для своїх команд і бізнес-операцій.

Ера агентів не наближається. Вона вже тут.

Spark працює, поки ви спите. Gemini працює, коли працюєте ви. Spark працює цілодобово, але ваші команди проводять свій робочий день у Gmail, Google Docs, Sheets, Meet та інших сервісах Workspace. Cloudfresh показують, де саме ШІ від Google приносить найбільше користі, навчають ваших фахівців працювати з ним і роблять налаштування зрозумілими й безпечними з першого ж дня. Отримати консультацію та навчання з Gemini →
CTA Image