Le 19 mai 2026, lors du deuxième jour de Google I/O, Sundar Pichai et les équipes Google ont aligné une série d'annonces qui marquent une bascule nette : Google ne veut plus seulement vendre un assistant conversationnel, il veut installer un agent personnel toujours actif dans la vie numérique de ses utilisateurs. Au menu : Gemini 3.5 Flash, Gemini Spark, Gemini Omni, et un changement complet du modèle de tarification grand public vers le "compute-used".

Gemini 3.5 Flash : "frontier capabilities" à 1/3 du prix des concurrents
Le nouveau modèle phare est immédiatement disponible en GA. Pichai l'a positionné comme le modèle agentique et coding le plus puissant de Google à ce jour, avec :
- Contexte de 1 million de tokens en entrée et 65 000 tokens en sortie
- 4 niveaux de "thinking" ajustables : minimal, low, medium, high
- Conservation de la pensée entre les tours de conversation (utile pour les workflows agentiques multi-étapes)
- Performances supérieures à Gemini 3.1 Pro sur les benchmarks coding et multimodal
Côté pricing API : 1,50 $ par million de tokens d'entrée et 9 $ par million en sortie. C'est environ 3 fois plus cher que Gemini 3 Flash (0,50 $ / 3 $), mais Pichai a précisé que la comparaison qui compte est avec les frontiers concurrents : sur ce terrain, Google revendique "moins de la moitié du prix, et parfois un tiers" des modèles équivalents (GPT-5.5, Claude Opus 4.7).

Gemini Spark : l'agent personnel 24/7 qui vit dans Gmail, Docs et Workspace
C'est l'annonce la plus structurante. Gemini Spark est présenté comme un agent IA qui travaille en arrière-plan en permanence, connecté à l'ensemble des produits Google et capable d'automatiser des tâches récurrentes sans intervention manuelle à chaque fois.
Concrètement, Spark peut par exemple :
- Trier et résumer les e-mails dans Gmail dès leur arrivée
- Pré-rédiger des réponses aux messages routiniers
- Reformater automatiquement les Docs en suivant les conventions de l'utilisateur
- Synchroniser plusieurs services Workspace pour exécuter des workflows multi-étapes
Le point critique pour les développeurs : Spark ouvrira son écosystème via MCP (Model Context Protocol) cet été, ce qui permettra de le connecter à des outils tiers (CRM, plateformes métier, n8n, etc.). Google rejoint donc explicitement l'écosystème MCP poussé par Anthropic, validant ce protocole comme standard de facto pour l'interopérabilité des agents IA.

Disponibilité : trusted testers cette semaine, puis bêta pour les abonnés Google AI Ultra US la semaine prochaine. Le déploiement international suivra sans calendrier précis annoncé.
Gemini Omni : entrée et sortie unifiées sur 4 modalités
Gemini Omni est une nouvelle famille de modèles qui unifie le raisonnement Gemini avec la génération média. Le premier modèle de la famille, Omni Flash, accepte en entrée :
- Texte
- Image
- Audio
- Vidéo
Et produit en sortie : du texte, des images, mais aussi de la vidéo générée et éditée (à la manière de Veo, mais intégrée nativement au raisonnement Gemini).
Concrètement, ça veut dire qu'on peut désormais soumettre une vidéo et un brief texte à un seul appel API, et obtenir directement une vidéo modifiée selon les instructions. Pas besoin d'enchaîner plusieurs modèles séparés (raisonnement + génération média).

L'accès à Omni est réservé au tier Google AI Ultra à 200 $/mois (réduit de 250 $).
Le pricing "compute-used" : fin des limites journalières
C'est le changement le plus structurant côté grand public. Google abandonne les limites journalières de prompts dans l'app Gemini, au profit d'un modèle dit "compute-used" qui mesure :
- La complexité du prompt (niveau de thinking choisi)
- Les fonctionnalités utilisées (génération vidéo, recherche, exécution de code)
- La longueur de la conversation (contexte accumulé)
Les limites se rafraîchissent toutes les 5 heures et plafonnent au niveau hebdomadaire. Si vous dépassez, vous pouvez acheter des crédits supplémentaires à l'unité.
Les nouveaux tiers Google AI
| Tier | Prix | Usage Gemini app | Antigravity | Modèles |
|---|---|---|---|---|
| Pro | (inchangé) | Standard | Limité | 3.5 Flash |
| Ultra 100 $ | 100 $/mois | 5× Pro | Priorité | 3.5 Flash + 20 To stockage + YouTube Premium |
| Ultra 200 $ | 200 $/mois | 20× Pro | Priorité max | + Gemini Omni + Project Genie |
Cette migration vers un modèle "compute-used" rapproche le pricing grand public du pricing API : on paie ce qu'on consomme réellement, pas un forfait arbitraire.
Notre avis chez RedArrow
L'annonce qui change vraiment la donne pour nos clients PME et ETI françaises, ce n'est pas Omni (trop cher, trop niche). Ce n'est même pas vraiment 3.5 Flash (l'API est intéressante mais Anthropic et OpenAI restent compétitifs sur les use-cases qu'on déploie le plus). C'est Gemini Spark + MCP.
Pourquoi ? Parce qu'on est nombreux à avoir des clients qui utilisent déjà Google Workspace au quotidien. Avec Spark, un agent IA propriétaire Google va opérer en continu dans leurs e-mails, leurs Docs, leurs Sheets, sans qu'on ait besoin de déployer quoi que ce soit côté infrastructure. Pour le client, c'est une augmentation de productivité incluse dans son abonnement Workspace, sans projet IT à monter.
Et avec l'ouverture MCP de cet été, on pourra brancher nos agents métier custom (analyse de devis, qualification de leads, suivi commercial, génération de propositions) directement dans le contexte Spark. Le client garde sa stack Google et bénéficie en plus des intégrations spécifiques qu'on lui aura développées. C'est exactement le scénario que beaucoup de PME nous demandent depuis 2 ans : "comment l'IA peut m'aider sans changer mes outils ?". Spark apporte une partie de la réponse.
Le bémol : la disponibilité initiale est US-only pour les abonnés AI Ultra. Pour la France, il faudra patienter quelques mois. Mais c'est le moment, pour les entreprises qui veulent prendre une longueur d'avance, de commencer à cartographier les workflows internes qui bénéficieraient d'un agent Spark + connecteurs MCP custom. Si vous voulez en discuter, parlons de votre projet d'agent IA.
Questions fréquentes
Quelle différence entre Gemini Spark et Gemini Live ou les Gems ? Spark est conçu pour fonctionner 24/7 en arrière-plan sans avoir besoin d'être invoqué activement par l'utilisateur. Là où Live ou les Gems répondent à une demande explicite, Spark observe l'activité dans Gmail/Docs/Workspace et déclenche des actions automatiquement selon des règles ou des patterns appris. C'est la première vraie tentative grand public d'un "agent persistent".
Quand Gemini Spark sera disponible en France ? Google n'a pas communiqué de date précise. Le déploiement initial est limité aux abonnés Google AI Ultra US (bêta dès la semaine du 26 mai 2026). L'international suivra, mais probablement en plusieurs vagues, avec des contraintes RGPD à valider pour l'Europe. Compter quelques mois minimum.
Le pricing compute-used va-t-il rendre Gemini plus cher ou moins cher pour un utilisateur classique ? Pour un usage modéré (moins de 50 prompts simples par jour), le nouveau modèle est neutre ou légèrement avantageux car les limites se rafraîchissent toutes les 5 heures. Pour un usage intensif avec génération vidéo, thinking high et longs contextes, le compute-used peut faire grimper rapidement la facture. Google parie clairement sur monétiser l'usage agentique qui consomme beaucoup plus de compute qu'un prompt classique.
Sources :