IA Bulletin — 30 avril 2026

NVIDIA Nemotron 3 Nano Omni en open multimodal /
Templates partageables sur Grok Imagine /
AIMPRO premier PRO pour la musique générée par IA

NVIDIA Nemotron 3 Nano Omni, l’open multimodal qui voit, écoute et lit dans 25 Go de RAM

NVIDIA a publié le 29 avril 2026 sur Hugging Face, OpenRouter, build.nvidia.com et plus de vingt-cinq plateformes partenaires son nouveau modèle ouvert Nemotron 3 Nano Omni, un omni de 30 milliards de paramètres en mixture-of-experts qui n’active que 3 milliards de poids par token et tient en 25 Go de RAM. Le modèle traite vision, audio, image et texte dans un seul espace de représentation, avec un contexte partagé de 256 000 tokens qui maintient l’état multimodal d’un tour d’agent à l’autre, sans recharger les caches. Sur les charges vidéo et documentaires, NVIDIA annonce un débit jusqu’à neuf fois supérieur aux omni open concurrents, et un score en tête de six leaderboards de compréhension document, vidéo et audio. Le modèle est livré sous licence ouverte avec recettes ComfyUI, kit de fine-tuning NeMo et conteneurs NVIDIA AI Enterprise pour l’exécution sur RTX 6000, GH200 et grappes Blackwell, et plusieurs studios créatifs — Aible, ASI, Foxconn, H Company, Palantir, Pyler — sont déjà cités comme intégrateurs. La trajectoire poursuit celle des Nemotron 2 publiés au premier trimestre, mais aligne désormais l’omni open avec les capacités auparavant réservées aux modèles fermés de Google et OpenAI.

Note éditoriale

L’intérêt pratique d’un omni qui tient dans 25 Go de RAM n’est pas dans le benchmark : c’est dans la possibilité de faire tourner un agent qui voit et écoute en local, sur une station de travail créative, sans payer un appel API par image regardée ou par seconde de vidéo écoutée. Ce franchissement de seuil arrive plus vite que prévu, alors qu’il y a six mois encore les omni open exigeaient des serveurs H100 et des intégrations spécifiques.

Pour les praticiens des arts génératifs, la conséquence est concrète : la couche de raisonnement multimodal devient un composant patrimonial, qu’on peut empiler dans une chaîne ComfyUI, dans un atelier vidéo, ou dans un dispositif d’installation, sans dépendance permanente à un fournisseur cloud. Le verrou ne sera plus la disponibilité du modèle, mais la qualité du prompt et du dataset d’ancrage.

Sources : NVIDIA Blog — Nemotron 3 Nano Omni Unifying Vision, Audio and LanguageNVIDIA Technical Blog — Multimodal Agent Reasoning in a Single Efficient Open ModelDataconomy — NVIDIA Launches Nemotron 3 Nano Omni Multimodal AI ModelAIwire — NVIDIA Launches Nemotron 3 Nano Omni Model

Templates partageables sur Grok Imagine, Photo vers Vidéo et chaînage à plusieurs références

xAI déploie sur la version web de Grok Imagine, dans la dernière semaine d’avril, des templates personnalisés et partageables qui industrialisent les flux Photo vers Vidéo, Photo vers Style Edit et Photo vers Edit vers Vidéo. Chaque créateur configure les prompts sous-jacents, nomme le template, ajoute une description et obtient un lien partageable que ses collaborateurs ou son public peuvent appliquer à n’importe quelle image source, sans réécrire la consigne. Le mode chaîné expose deux champs distincts, un pour la passe d’édition image et un pour la génération vidéo, et chaque template apparaît dans un onglet dédié de l’application web. Une quatrième catégorie nommée Image Reference Edit est en préparation : elle introduit une syntaxe @mention pour piocher dans plusieurs uploads simultanément, par exemple « habille la personne de @photo avec la tenue de @reference », ce qui ouvre la voie aux scénographies multi-source pilotables au prompt. Sur le plan créatif, ces templates rejoignent une logique connue chez Midjourney avec ses srefs et chez Adobe avec ses Creative Skills, mais la shareabilité native d’un préréglage Grok Imagine est inédite dans cette catégorie d’outils.

Note éditoriale

Le geste est subtil mais lourd : transformer un prompt en objet partagé et adressable par lien rapproche Grok Imagine d’une plateforme sociale plutôt que d’un générateur isolé. Un template circulant entre comptes devient un signal de style, presque un meme — et sa diffusion fait du préréglage un actif quantifiable, à la manière d’un sample vendu sur Splice.

Pour les directions artistiques qui travaillent en commande, la nouveauté ouvre une question pratique : vendre un template pré-réglé devient potentiellement une livrable au même titre que des LUTs ou des chartes typographiques. Le glissement n’est plus seulement entre l’outil et le créatif — il est entre le créatif et le client, à qui un préréglage personnalisé peut désormais être transmis comme un asset autonome.

Sources : TestingCatalog — xAI rolling out custom, shareable Imagine templates for GrokPiunikaWeb — New Grok update adds custom templates to ImaginexAI News — Grok Imagine API

AIMPRO se déclare premier organisme de gestion collective dédié aux créateurs de musique IA

Le média spécialisé Music Ally a consacré le 29 avril 2026 un dossier à AIMPRO, structure lancée le 10 avril qui se présente comme le premier organisme de gestion collective conçu de A à Z pour les créateurs de musique générée par IA. Là où ASCAP, BMI, Sacem ou PRS hésitent à enregistrer des œuvres dont la part humaine est ténue ou contestée, AIMPRO propose une affiliation gratuite à tout créateur, prélève 15 pour cent sur les revenus collectés et offre un palier Pro à 9,99 dollars par mois pour accéder à la place de marché de licences. La structure couvre les flux de revenus classiques — streaming, sync télé et publicité, performance publique, licences commerciales — et empile par-dessus une couche de métadonnées spécifiques aux générations IA (modèle, prompt, ancrage, statut copyright). Le contexte est massif : selon les chiffres déclarés par les plateformes, près de 70 000 morceaux IA paraissent chaque jour, et 44 pour cent des nouveaux dépôts Deezer, plus du tiers chez Apple Music, sont aujourd’hui entièrement générés par IA — un volume que les sociétés de gestion historiques traitent encore au cas par cas. AIMPRO est porté par Steve Stewart (ex-management Stone Temple Pilots) et Joe Berman, vétéran de l’édition et du sync, et la conception graphique d’un album reste, dans ce dispositif, l’un des rares signaux humains que la chaîne d’ayants droit peut documenter sans ambiguïté.

Note éditoriale

L’émergence d’un PRO dédié à l’IA musicale acte une bascule discrète : les sociétés historiques ne peuvent plus dire « on regardera plus tard » tout en encaissant les royalties qui passent par leurs tuyaux. Si AIMPRO trouve un public, il créera de la pression mécanique sur Sacem et consorts pour clarifier leur position, ce qu’ils repoussaient depuis trois ans en arguant de la jurisprudence en mouvement.

Pour les producteurs qui sortent réellement leurs disques, le glissement éclaire un autre chantier : à mesure que les plateformes croulent sous des morceaux sans ayants droit identifiables, la déclarativité humaine devient un actif de tri — pochette créditée, fiche artiste solidement renseignée, signature graphique cohérente. Ce que la collecte ne peut pas saisir dans le morceau, elle pourra le saisir dans l’identité de l’artiste qui le signe.

Sources : Music Ally — There’s now a collecting society just for AI-generated musicAIMPRO — AI Music PROCalifornia Environmental News — AIMPRO Launches as World’s First PRO for Generative AI MusicJack Righteous — AIMPRO Explained: Licensing, Royalties, What It Means
Tait Maquilla — Studio Takuya
Tait Maquilla — Studio Takuya