Google bascule Nano Banana 2 et Nano Banana Pro en disponibilité générale, image stack à deux niveaux conçue pour séparer la production de masse de la finition pro
Google a basculé le 28 mai 2026 en disponibilité générale, via la Gemini Enterprise Agent Platform, ses deux modèles d'image génératifs : Nano Banana 2 — nom commercial de Gemini 3.1 Flash Image — et Nano Banana Pro, qui correspond à Gemini 3 Pro Image. La logique annoncée est explicite : Nano Banana 2 tient la production de masse à coût bas — assets quotidiens, miniatures, visuels produits, premiers jets — pendant que Nano Banana Pro reprend la main sur la finition, le rendu typographique long, les compositions multi-personnages et les usages où la fidélité prime sur le débit. Les deux modèles partagent un socle de capacités notables : maintien de cinq personnages cohérents sur une même séquence de génération, fidélité revendiquée sur jusqu'à quatorze objets en une seule prompt, génération de texte lisible et localisable dans l'image, et — nouveauté importante — entrée vidéo qui permet au modèle d'analyser le contexte visuel d'un clip pour produire une image cohérente avec sa scène. La déclinaison s'étend en parallèle dans Gemini, Google Search, Google Ads et la suite Workspace, où elle remplace progressivement la génération image antérieure. Pour un studio qui pratique la finition graphique de pochettes, la lecture intéressante n'est pas le saut technique : c'est la matrice de prix que cette segmentation installe.
La structure fast + pro publiée le même jour est, en soi, l'annonce produit. Google ne cherche plus à vendre un modèle, il propose une chaîne : un modèle rapide pour itérer, un modèle pro pour finir, et la même interface pour passer de l'un à l'autre. Cette logique a déjà mis quinze ans à s'installer dans la photographie (raw + JPEG, prosumer + pro) ; ici elle s'installe en six mois, ce qui change la nature de la concurrence pour Midjourney, FLUX, Krea et tous les acteurs qui ne publient qu'un modèle.
Ce qui mérite attention, dans une perspective de studio, c'est la fidélité d'objets et la persistance de personnage. Quand un modèle tient quatorze objets sur une même image et cinq personnages sur une série, il devient possible de produire une direction artistique à plusieurs plans sans intervention manuelle d'assemblage. Ce n'est pas la fin du compositing — c'est le déplacement de la valeur, du geste vers la spécification. Le travail consiste de moins en moins à faire, de plus en plus à écrire ce qu'on veut avec une précision que la plupart des briefs ne supportent pas encore.