search
Cloud Блог Google Cloud – Внутри Gemini Spark: Всегда активный агент Google
Google Cloud

Внутри Gemini Spark: Всегда активный агент Google

На Google I/O ’26 ИИ перешел черту, которую раньше не пересекал. Вопрос больше не в том, «Может ли ИИ ответить на мой вопрос?», а в том, «Может ли ИИ просто сделать это?».

Благодаря Gemini Spark ответ — да. Это ваш личный ИИ-агент, работающий 24/7, который забирает на себя сложные многоэтапные задачи, выполняет их на фоне и возвращается к вам только тогда, когда нужно принять решение.

В этом и заключается разница между ассистентом, который ждет команды, и тем, кто реально делает работу.

Как глобальный партнер Google Cloud Premier-уровня, мы следим за этой сферой круглосуточно — так же, как Spark выполняет свою агентную работу. И этот инструмент по-настоящему привлек наше внимание. Вот почему он должен заинтересовать и вас.

Технологическая база

У любого традиционного ИИ-ассистента есть одно ограничение: ваше постоянное присутствие. Вам нужно держать вкладку открытой, оставаться в приложении и ждать ответа. Но Spark устроен иначе.

Он работает на выделенных виртуальных машинах, полностью развернутых в Google Cloud. Это значит, что вы можете поручить Spark сложную многоэтапную задачу и просто закрыть ноутбук. Агент не ставит работу на паузу, не прерывается по тайм-ауту и не требует вашего контроля. В каком-то смысле это персональная версия того, что можно делать с Gemini Enterprise Agent Platform.

Инфраструктура, которая делает все это возможным, — Antigravity Harness. Изначально созданная для разработки агентного ПО, теперь она адаптирована для длительных фоновых задач обычных пользователей. Более того, Gemini Spark работает на базе новейшего семейства ИИ-моделей Gemini 3.5.

Google I/O ’26 показал, что Gemini 3.5 Flash обрабатывает токены в четыре раза быстрее аналогичных передовых моделей. Это имеет огромное значение, когда нужно разобрать размытые инструкции на естественном языке, разбить их на логические шаги и последовательно выполнить. Именно чистая скорость и глубина рассуждений позволяют Spark давать реальный результат.

Интерфейс Gemini Spark

Фоновый ИИ-агент полезен только тогда, когда вы понимаете, что он делает. Google переработал приложение Gemini именно с учетом этой задачи. Открыв новый интерфейс, вы попадаете на дашборд — центральную панель управления, где в реальном времени отображается все, над чем сейчас работает агент.

Каждая длительная задача выделяется в отдельный тред, поэтому вы можете проверять прогресс, не прерывая работу. При этом в Gemini Spark встроены четкие контрольные точки для согласования. Он не отправит письмо и не удалит встречу из календаря без вашего подтверждения.

Он составляет черновики, организует, готовит данные, а затем останавливается и ждет вашего ревью перед финальным действием. Агент обладает высокой автономностью, но последнее слово всегда остается за вами.

Продвинутый синтез и коммуникационные процессы

Сразу «из коробки» Spark подключается к Google Workspace и собирает информацию со всей вашей цифровой жизни. Это полностью меняет подход к написанию рутинных писем со статусом проектов.

На демо во время кейноута Google I/O пользователь попросил составить апдейт для команды, охватывающий «все о наших недавних запусках Gemini и победах за прошедшую неделю». Spark проанализировал Google Docs, почту Gmail и историю чатов за этот период и извлек самую релевантную информацию еще до того, как написал хотя бы одно слово.

Чтобы результат звучал живо и естественно, пользователь применил кастомный навык с помощью команды /ghost writer. Это дает команду Gemini Spark скопировать тон, словарный запас и стиль письма пользователя. Вы можете загружать собственные навыки или скачивать их из сети — это значит, что ИИ-агента можно настроить именно под ваш стиль работы, а не под то, как это представил Google.

Многоэтапное планирование мероприятий

Настоящая проверка для любого агента — это задача, которая обычно отнимает часы рутинной административной работы. Демонстрация планирования соседской вечеринки от Spark стала отличным тому примером.

Пользователь задал один многоуровневый промпт: собрать все ответы на приглашения, отследить, кто что приносит, и написать тем, кто еще не ответил. Spark разбил эту задачу на скоординированную серию шагов.

  1. Сначала он создал живой трекер ответов прямо в Google Sheets. Поскольку Spark подключен к Gmail, таблица оновлялась в реальном времени при поступлении новых писем на почту — никакого ручного ввода.
  2. Одновременно с этим Gemini Spark выявил соседей, которые не ответили, и подготовил черновики писем с напоминаниями для проверки пользователем.
  3. Он также собрал визуальную презентацию в Google Slides с изображениями, чтобы подогреть интерес к мероприятию.
  4. А затем произошло то, что сделало это демо действительно выдающимся. Spark просканировал Google Drive пользователя, нашел правила местного ТСЖ и извлек конкретный пункт, согласно которому подготовку нельзя начинать раньше вечера пятницы 5 июня.
  5. Затем Spark выдал это как ограничение, хотя его даже не просили искать эту информацию.

В этом и кроется разница между простым выполнением задачи и реальным пониманием контекста.

Мобильная «выгрузка мыслей» и голосовые команды

Хорошие идеи и срочные задачи не ждут, пока вы окажетесь за рабочим столом. Gemini Spark работает как на Android, так и на iOS, а задачи синхронизируются между всеми вашими устройствами с самого начала. Мобильный интерфейс специально выстроен вокруг концепции «выгрузки мыслей» (brain-dumping) — возможности быстро перепоручить все дела агенту.

Используя транскрибацию аудио в реальном времени и продвинутую обработку голоса, вы можете надиктовать пул задач — быстрый, неструктурированный поток запросов, а Spark поймает их и отсортирует. На демо во время кейноута пользователь записал одно голосовое сообщение, содержащее три абсолютно разные задачи.

  1. Первой было найти все предстоящие встречи с конкретным руководителем и выделить их ярко-розовым цветом в календаре.
  2. Второй — подготовить черновик приглашения для нового соседа на вечеринку.
  3. Третьей — составить отсортированный по срокам чек-лист дел для детей пользователя на конец учебного года.

Spark проанализировал все сообщение, разделил его на три запроса и запустил параллельные треды для каждого из них. Пользователь просто отложил телефон и продолжил заниматься своими делами.

Именно в этом и есть весь смысл.

Мощь протокола MCP

Прямо сейчас Gemini Spark отлично справляется с выполнением ваших поручений. Следующий шаг — это способность действовать до того, как вы вообще о чем-то попросите.

Именно это открывает интеграция с Model Context Protocol (MCP). В ближайшие недели Spark подключится к сторонним инструментам и приложениям через MCP и начнет работать на опережение от вашего имени.

Если он заметить в вашем календаре «ответственность за снеки» на пятничную встречу, он сможет подключиться к инструменту Instacart через MCP, выбрать подходящие закуски и самостоятельно оформить доставку. Более того, он помнит важные детали. Если в команде есть аллергия на орехи, это обязательно будет учтено.

Переход от реактивного подхода к проактивному — это огромный шаг. Это разница между агентом, который просто помогает, и агентом, который предугадывает ваши потребности.

Безопасная агентная коммерция: AP2, UCP и Universal Cart

Как только агент получает возможность совершать покупки от вашего лица, лежащая в основе кибербезопасность должна быть безупречной. Google внедряет два базовых протокола, чтобы справиться именно с этой задачей.

Первый — это Agent Payments Protocol (AP2). Пользователи заранее задают строгие параметры: предпочтительные бренды, одобренные товары и лимиты расходов, а Spark может совершать только те транзакции, которые подпадают под эти критерии. Каждая транзакция подтверждается проверяемой, защищенной от подделки цифровой записью, связывающей пользователя, продавца и платежную систему. Если вам нужно оспорить списание или оформить возврат, все стороны будут опираться на одну и ту же криптографическую запись. При этом AP2 постоянно защищает ваши основные платежные реквизиты. Развертывание протокола начнется с Gemini Spark в ближайшие месяцы.

Второй — это Universal Commerce Protocol (UCP). Лучше всего описать его как общий язык с открытым исходным кодом для всей электронной коммерции в сети — так же, как HTTP стандартизирует загрузку веб-страниц. При поддержке таких партнеров-основателей, как Amazon, Meta, Microsoft, Salesforce и Stripe, UCP делает поиск товаров, оформление заказа и отслеживание доставки единообразными на протяжении всего пути покупок, независимо от того, где вы его начали.

Эти два протокола лежат в основе Universal Cart. Она работает с разными продавцами и сервисами, позволяя добавлять товары прямо из Поиска, Gemini, YouTube или Gmail. Как только товар оказывается в корзине, ИИ-модели Gemini начинают работу в фоновом режиме: ищут скидки, отслеживают историю цен и отправляют уведомления о поступлении товара в продажу.

Корзина также отслеживает проблемы совместимости. Если при сборке рабочего ПК вы добавите процессор и материнскую плату с несовместимыми сокетами, система укажет на ошибку и предложит замену. Кроме того, она подключается к Google Wallet для автоматического применения бонусов по кредитным картам и предложений от ритейлеров.

Универсальная корзина появится в США в Поиске и приложении Gemini уже этим летом.

Экосистема будущего: Chrome, Android Halo и macOS

Масштабирование происходит быстро. Ближе к концу лета новый асистент начнет работать прямо внутри Google Chrome, превратив его в агентный браузер, способный перемещаться по открытому интернету и выполнять действия от вашего имени и по вашему указанию. Для мобильных устройств Google анонсировал «Android Halo» — выделенную домашнюю базу для агентов, встроенную в ОС Android, которая появится позже в этом году.

Голосовые функции, обеспечивающие мобильный brain-dumping, также появятся на десктопе. Новое приложение Gemini для macOS — созданное с нуля небольшой командой на платформе Antigravity менее чем за 100 дней — получит голосовые интеграции в течение лета. Пользователи Mac смогут выделять файлы в Finder, использовать горячие клавиши для диктовки инструкций и поручать Spark составить ответ с прямым использованием содержимого этих файлов.

На кейноуте демо показало, как пользователь выбрал несколько PDF-счетов и изображений, надиктовал короткую заметку и наблюдал, как Spark составляет готовое письмо для отеля для собак. Излишне говорить, что он извлек все данные о прививках и аллергиях прямо из этих файлов.

Голосовая модель также фильтрует речь в реальном времени, удаляя слова-паразиты и запинки, поэтому на выходе получается чистый промпт, даже если на входе был лишь набор мыслей.

Персонализированный утренний дайджест

В тандеме с фоновым выполнением задач Gemini Spark работает новая встроенная функция — Daily Brief. Она задумана как ваша первая остановка с утра: персонализированный дайджест, собирающий самую важную информацию из всей вашей цифровой жизни.

Вместо того чтобы выдавать сырой список писем и событий из календаря, Daily Brief организует все по темам, выводит самые срочные дела наверх и предлагает конкретные следующие шаги прямо в тексте.

Он может подсветить приближающийся дедлайн или напомнить о необходимости вернуть покупку до истечения срока. Дайджест создан для быстрого чтения, чтобы вы могли разобраться с текущими задачами за пару минут, запустить нужный воркфлоу в Spark одним касанием и продолжить свой день.

Доступность, стоимость и дальнейшие планы

Google разворачивает Spark поэтапно. Для круглосуточной работы автономных агентов требуется серьезная IT-инфраструктура, а планка безопасности высока как никогда. Доступ первыми получат доверенные тестировщики, за которыми последует бета-версия для подписчиков Google AI Ultra в США.

Чтобы поддержать вычислительные потребности агентных воркфлоу, Google представил новый тарифный план Google AI Ultra за $100 в месяц. В то же время, благодаря отзывам пользователей и улучшениям инфраструктуры, цена на максимальный тариф Ultra снизилась с $250 до $200 в месяц.

Помимо индивидуальных пользователей, Gemini Spark также адаптируется для профессиональной среды. Google подтвердил, что специализированные версии появятся как в Workspace, так и в Gemini Enterprise, что позволит компаниям внедрить круглосуточную агентную поддержку для своих команд и бизнес-операций.

Агентная эра не просто приближается. Она уже наступила.

Spark продолжает работать, когда вы спите. Gemini работает, когда работаете вы. Spark работает круглосуточно, но ваши команды проводят весь день в Gmail, Docs, Sheets, Meet и других приложениях Workspace. Cloudfresh показывают, где именно ИИ Google приносит максимальную пользу, обучает ваших сотрудников и делает настройки простыми и безопасными с первого дня. Получить консультацию и обучение по Gemini →
CTA Image