search
Cloud Blog Google Cloud – Au cœur de Gemini Spark : l’agent permanent de Google
Google Cloud

Au cœur de Gemini Spark : l’agent permanent de Google

Lors de Google I/O ’26, l’IA a franchi une nouvelle étape. La question n’est plus : « L’IA peut-elle répondre à une question ? », mais plutôt : « Peut-elle simplement s’en charger à notre place ? »

Avec Gemini Spark, la réponse est oui. Il s’agit d’un agent personnel disponible 24 h/24 et 7 j/7, capable de prendre en charge des tâches complexes à plusieurs étapes, de les exécuter en arrière-plan et de revenir vers vous uniquement lorsqu’une décision doit être prise.

C’est toute la différence entre un assistant qui attend qu’on lui demande quelque chose et un assistant qui fait avancer les choses de lui-même.

En tant que partenaire Google Cloud Premier à l’échelle mondiale, nous suivons cet univers de très près — presque aussi attentivement que Spark accomplit ses missions. Et cette annonce a immédiatement retenu notre attention. Voici pourquoi elle devrait retenir la vôtre.

La technologie qui le rend possible

Tous les assistants IA traditionnels partagent la même limite : vous devez être présent. Il faut laisser l’onglet ouvert, rester dans l’application et attendre une réponse.

Spark a été conçu différemment.

Il fonctionne sur des machines virtuelles dédiées hébergées entièrement sur Google Cloud. Vous pouvez donc lui confier une tâche complexe, fermer votre ordinateur portable et passer à autre chose. L’agent ne se met pas en pause, n’expire pas et n’a pas besoin que vous le surveilliez. D’une certaine manière, il s’agit d’une version personnelle de ce qu’il est déjà possible de faire avec Gemini Enterprise Agent Platform.

L’infrastructure qui rend tout cela possible s’appelle Antigravity Harness. Initialement développée pour le développement logiciel piloté par des agents, elle a été adaptée afin d’alimenter des tâches de longue durée destinées au grand public.

Gemini Spark s’appuie également sur la nouvelle famille de modèles Gemini 3.5.

Lors de Google I/O ’26, Google a indiqué que Gemini 3.5 Flash traite les tokens jusqu’à quatre fois plus vite que les modèles concurrents de même catégorie. Cette rapidité est essentielle lorsqu’il faut interpréter des instructions formulées en langage naturel, parfois imprécises, les transformer en étapes logiques, puis les exécuter les unes après les autres. C’est cette combinaison entre vitesse d’exécution et profondeur de raisonnement qui permet à Spark de réellement accomplir ce que vous lui demandez.

L’interface Gemini Spark

Un agent d’arrière-plan n’a de valeur que si vous savez ce qu’il est en train de faire.

Google a donc repensé l’application Gemini autour de cette problématique. Lorsque vous ouvrez la nouvelle expérience, vous arrivez directement sur un tableau de bord central qui affiche en temps réel tout ce sur quoi l’agent travaille.

Chaque tâche de longue durée dispose de son propre fil de suivi. Vous pouvez ainsi consulter sa progression sans interrompre son exécution. Gemini Spark intègre également des points de validation explicites tout au long du processus. Il n’enverra pas un e-mail et ne supprimera pas un événement de votre agenda sans votre approbation.

Il rédige, organise, prépare et exécute les étapes préalables, puis s’arrête pour attendre votre validation avant de passer à l’action. L’agent dispose d’une grande autonomie, mais la décision finale vous appartient toujours.

Synthèse avancée et automatisation des communications

Dès sa mise en service, Spark se connecte à Google Workspace et peut rassembler des informations provenant de l’ensemble de votre environnement numérique. Cela transforme profondément la manière de rédiger un simple e-mail de mise à jour.

Lors d’une démonstration présentée pendant Google I/O, un utilisateur a demandé à l’agent de rédiger un compte rendu destiné à son équipe couvrant « tout ce qui concerne nos récents lancements Gemini Live ainsi que les succès obtenus au cours de la semaine écoulée ». Avant d’écrire la moindre ligne, Spark a exploré les Google Docs de l’utilisateur, sa boîte Gmail ainsi que son historique de conversations afin d’identifier les informations les plus pertinentes sur la période concernée.

Pour que le résultat reflète réellement le style de la personne qui écrit, l’utilisateur a ensuite appliqué une compétence personnalisée via la commande /ghost writer.

Cette commande permet à Gemini Spark de reproduire le ton, le vocabulaire et le style rédactionnel de l’utilisateur. Les utilisateurs peuvent créer leurs propres compétences ou en importer depuis des bibliothèques en ligne. L’agent peut ainsi être adapté à votre manière réelle de travailler, et non à une approche standardisée définie par Google.

Planification d’événements complexes

Le véritable test pour un agent réside dans sa capacité à prendre en charge des tâches qui nécessiteraient normalement des heures de coordination et d’administration. La démonstration consacrée à l’organisation d’une fête de quartier l’a parfaitement illustré.

L’utilisateur a formulé une seule demande, mais comportant plusieurs objectifs : récupérer toutes les confirmations de présence, suivre ce que chacun prévoit d’apporter et relancer les personnes n’ayant pas encore répondu. Spark a décomposé cette demande en une série d’actions coordonnées.

  1. Tout d’abord, il a créé un tableau de suivi des confirmations de présence (RSVP) directement dans Google Sheets. Grâce à sa connexion avec Gmail, le document se mettait automatiquement à jour à mesure que de nouvelles réponses arrivaient dans la boîte de réception, sans aucune saisie manuelle.
  2. En parallèle, Gemini Spark a identifié les voisins n’ayant pas encore répondu et a préparé des e-mails de relance que l’utilisateur pouvait vérifier avant envoi.
  3. Il a également créé un diaporama promotionnel dans Google Slides, illustré par des images destinées à susciter l’enthousiasme autour de l’événement.
  4. Puis est venue la partie la plus impressionnante de la démonstration. Spark a analysé le Google Drive de l’utilisateur, retrouvé le règlement de l’association de quartier (HOA) et extrait automatiquement la règle précisant que les préparatifs ne pouvaient pas commencer avant le vendredi 5 juin dans l’après-midi.
  5. Enfin, Spark a signalé cette contrainte de lui-même, sans qu’on lui ait demandé de la rechercher.

C’est précisément ce qui distingue l’exécution d’une tâche d’une véritable compréhension du contexte.

Capture d’idées à la volée et commandes vocales sur mobile

Les bonnes idées et les tâches urgentes n’attendent pas que vous soyez assis devant un ordinateur. Gemini Spark est disponible sur Android et iOS, et les tâches se synchronisent automatiquement entre tous vos appareils. L’expérience mobile a été conçue autour de ce que Google appelle le « brain-dumping » : la possibilité de transférer rapidement toutes les idées qui vous passent par la tête vers votre agent.

Grâce à la transcription audio en temps réel et à des capacités avancées de traitement vocal, vous pouvez dicter une série rapide d’instructions, même désorganisées, et laisser Spark les structurer pour vous. Lors de la démonstration présentée pendant la keynote, un utilisateur a enregistré un unique message vocal contenant trois demandes totalement différentes.

  1. La première consistait à identifier toutes les réunions à venir avec un dirigeant précis et à les afficher en rose vif dans son agenda.
  2. La deuxième demandait la rédaction d’une invitation destinée à un nouveau voisin pour la fête de quartier.
  3. La troisième visait à créer une liste des tâches de fin d’année scolaire de ses enfants, classées par échéance.

Spark a analysé l’ensemble du message, séparé les trois demandes et lancé un fil de travail distinct pour chacune d’elles. L’utilisateur a simplement reposé son téléphone et poursuivi sa journée.

C’est précisément l’objectif de cette approche.

La puissance du MCP

Aujourd’hui, Gemini Spark excelle dans l’exécution de ce que vous lui demandez. La prochaine étape consiste à lui permettre d’agir avant même que vous ne formuliez la demande.

C’est précisément ce que rend possible l’intégration du Model Context Protocol (MCP).

Dans les semaines à venir, Spark pourra se connecter à des applications et services tiers via MCP afin de comprendre le contexte qui vous entoure et d’anticiper certaines actions.

Par exemple, s’il repère dans votre agenda une mention indiquant que vous êtes chargé des collations pour une réunion prévue le vendredi, il pourra se connecter à l’outil MCP d’Instacart, sélectionner des produits adaptés et préparer la commande de livraison de manière autonome. Et surtout, il se souviendra des informations importantes. Si un membre de l’équipe souffre d’une allergie aux arachides, cette contrainte sera automatiquement prise en compte.

Le passage d’un agent réactif à un agent proactif constitue une évolution majeure. C’est la différence entre un agent qui aide et un agent qui anticipe.

Commerce agentique sécurisé : AP2, UCP et le panier universel

Lorsqu’un agent est capable d’effectuer des achats pour votre compte, l’infrastructure de sécurité qui l’entoure doit être irréprochable. Google déploie pour cela deux protocoles fondamentaux.

Le premier est l’Agent Payments Protocol (AP2). Les utilisateurs définissent à l’avance des paramètres précis : marques préférées, produits approuvés ou encore plafonds de dépenses. Spark ne peut alors exécuter que les transactions respectant ces règles. Chaque opération est associée à un enregistrement numérique vérifiable et infalsifiable reliant l’utilisateur, le commerçant et le prestataire de paiement. En cas de litige ou de retour produit, toutes les parties s’appuient sur la même preuve cryptographique. Par ailleurs, AP2 protège les informations de paiement sous-jacentes tout au long du processus. Le déploiement de cette technologie commencera dans les prochains mois au sein de Gemini Spark.

Le second est l’Universal Commerce Protocol (UCP). La meilleure façon de le décrire consiste à le comparer à un langage commun open source pour l’ensemble du commerce en ligne, de la même manière que HTTP standardise le chargement des pages web. Avec des partenaires fondateurs tels qu’Amazon, Meta, Microsoft, Salesforce et Stripe, UCP uniformise la recherche de produits, le passage en caisse et le suivi des expéditions, quel que soit le point de départ du parcours d’achat.

Ces deux protocoles alimentent le panier universel. Celui-ci fonctionne à travers différents marchands et services, et permet d’ajouter des produits depuis Search, Gemini, YouTube ou Gmail. Une fois un produit ajouté, les modèles Gemini travaillent en arrière-plan pour rechercher des promotions, analyser l’historique des prix et signaler les retours en stock.

Le panier universel détecte également les problèmes de compatibilité. Si vous ajoutez un processeur et une carte mère utilisant des sockets incompatibles dans le cadre de la configuration d’un poste de travail, le système signalera le problème et proposera une alternative adaptée. Il se connecte également à Google Wallet afin d’identifier automatiquement les avantages liés à vos cartes de paiement ainsi que les offres promotionnelles applicables.

Le panier universel sera déployé aux États-Unis cet été dans Google Search et dans l’application Gemini.

L’écosystème de demain : Chrome, Android Halo et macOS

Les évolutions s’accélèrent. Dès cet été, le nouvel assistant sera capable d’opérer directement dans Google Chrome sous la forme d’un navigateur agentique, capable de parcourir le web public et d’effectuer des actions en votre nom, sous votre supervision.

Sur mobile, Google a également annoncé « Android Halo », un espace dédié aux agents intégré directement au système d’exploitation Android, dont le lancement est prévu plus tard dans l’année.

Les fonctionnalités vocales qui alimentent aujourd’hui la capture d’idées sur mobile arriveront également sur ordinateur. La nouvelle application Gemini pour macOS — développée entièrement à partir de zéro par une petite équipe utilisant la plateforme Antigravity en moins de 100 jours — bénéficiera d’intégrations vocales au cours de l’été. Les utilisateurs Mac pourront sélectionner des fichiers dans Finder, utiliser un raccourci clavier pour dicter des instructions, puis laisser Spark rédiger une réponse intégrant directement le contenu de ces fichiers.

Lors de la keynote, une démonstration a montré un utilisateur sélectionnant plusieurs factures PDF ainsi que quelques photos, puis dictant une courte consigne. Spark a alors rédigé un e-mail complet destiné à une pension canine. L’agent a automatiquement extrait depuis les documents les informations pertinentes, notamment les certificats de vaccination et les détails relatifs aux allergies.

Le modèle vocal filtre également les hésitations, répétitions et mots de remplissage en temps réel afin de produire une instruction claire, même lorsque la pensée initiale est encore incomplètement formulée.

Un résumé matinal personnalisé

En complément de l’exécution des tâches en arrière-plan par Gemini Spark, Google introduit une nouvelle fonctionnalité native baptisée Daily Brief. Conçu pour devenir votre premier rendez-vous de la journée, ce résumé personnalisé rassemble les informations les plus importantes de votre environnement numérique.

Plutôt que d’afficher une simple liste d’e-mails ou d’événements de calendrier, Daily Brief organise les informations par thématique, met en avant les éléments les plus urgents et suggère directement les prochaines actions à entreprendre.

Il peut, par exemple, signaler une échéance qui approche ou rappeler qu’un retour produit doit être effectué avant la fin de la période autorisée. Le tout est conçu pour être parcouru rapidement. En quelques minutes seulement, vous pouvez prendre connaissance de vos priorités, lancer un workflow Spark en un clic et commencer votre journée avec une vision claire de ce qui vous attend.

Disponibilité, tarifs et perspectives

Google déploie Spark progressivement. Faire fonctionner des agents autonomes en continu nécessite une infrastructure considérable, et les exigences de sécurité n’ont jamais été aussi élevées. Les premiers accès seront réservés à un groupe restreint de testeurs sélectionnés, avant l’ouverture d’une phase bêta destinée aux abonnés Google AI Ultra aux États-Unis.

Afin de répondre aux besoins de calcul liés aux workflows agentiques, Google a annoncé une nouvelle formule Google AI Ultra à 100 dollars par mois. Parallèlement, grâce aux améliorations apportées à l’infrastructure et aux retours des utilisateurs, le prix de l’offre Ultra haut de gamme à capacité maximale a été réduit, passant de 250 à 200 dollars par mois.

Au-delà des utilisateurs individuels, Gemini Spark est également en cours d’adaptation pour les environnements professionnels. Google a confirmé que des versions spécialisées seront proposées dans Workspace ainsi que dans Gemini Enterprise, permettant aux organisations de déployer une assistance agentique disponible 24 h/24 et 7 j/7 au sein de leurs équipes et de leurs opérations.

L’era des agents autonomes n’est plus une perspective lointaine. Elle est déjà là.

Spark continue de travailler pendant votre sommeil. Gemini vous accompagne tout au long de votre journée de travail. Spark fonctionne en continu, mais vos équipes utilisent Gmail, Docs, Sheets, Meet et l’ensemble de l’écosystème Workspace tout au long de la journée. Cloudfresh vous aide à identifier précisément où l’IA de Google crée de la valeur, forme vos collaborateurs à son utilisation et garantit un déploiement propre, sécurisé et efficace dès le premier jour. Bénéficier d’un accompagnement et d’une formation Gemini →
CTA Image