Gemini Omni fuite dans l'application Gemini avant Google I/O 2026
Des clips générés par un modèle baptisé Omni apparaissent dans l'onglet vidéo de l'application Gemini le 11 mai 2026, neuf jours après la première fuite d'une chaîne UI repérée le 2 mai par un utilisateur de X : « Start with an idea or try a template. Powered by Omni. » Les exemples qui circulent montrent un saut visible sur la cohérence de scène, les transitions de caméra et surtout la fidélité aux prompts fins — l'une des démos fait écrire à l'image une démonstration mathématique lisible, ce qu'aucun modèle vidéo grand public n'avait encore tenu sur la durée. La grande inconnue reste la position d'Omni par rapport à Veo 3.1 et Lyria 3 Pro, étendus la semaine dernière à Vertex et Google Vids : remplacement pur, surcouche unifiée image-vidéo-audio dans un omni-modèle, ou nouveau pipeline coexistant avec Veo, les trois hypothèses circulent sans confirmation officielle. Plusieurs reprises insistent sur une caractéristique technique alléchante : l'audio spatial synchronisé ne serait plus une post-couche mais un produit natif du même modèle — un plan d'orage générerait directement tonnerre, pluie, et leur placement stéréo cohérent. Google a programmé son keynote I/O 2026 pour le 19 mai, et tout indique que la fuite a été soit toléreé soit utilisée comme allumeur narratif avant l'annonce formelle.
La fuite mérite un regard plus structurel qu'une simple anecdote produit. Si Omni est bien un omni-modèle qui fond image, vidéo et son dans le même pas d'inférence, c'est l'unification verticale que les concurrents tentent depuis dix-huit mois en empilant des pipelines séparés — Runway, Pika, Higgsfield génèrent l'image et la vidéo côté visuel, puis ajoutent l'audio en post via Suno, Udio ou ElevenLabs. Une seule passe contre trois empile en théorie moins de glitches d'alignement, à condition que le modèle scale.
Le timing par rapport à Lyria 3 Pro et Veo 3.1 est aussi intéressant que la news elle-même. Google ne cannibalise pas ses produits pour rien : Omni laisse penser que la maison considère que la séparation des modalités est un bricolage transitoire, et qu'à l'horizon I/O, l'argument commercial bascule du modèle dédié au modèle unifié. Pour un studio qui produit des visuels de pochettes ou des clips, ce changement déplace le brief : on n'écrit plus une commande visuelle plus une commande sonore, on écrit une intention audiovisuelle, et le modèle arbitre la cohérence.