SongGeneration 2 : Tencent publie en open source un modèle qui dépasse Suno sur la précision des paroles
Tencent AI Lab a mis à disposition en open source SongGeneration 2 (également désigné LeVo 2), un modèle de génération musicale de 4 milliards de paramètres capable de produire des morceaux complets jusqu'à 4 minutes 30 secondes, incluant voix et accompagnement séparés ou mixés, téléchargeable librement sur GitHub et Hugging Face. L'architecture hybride LLM-Diffusion supporte la génération multilingue — chinois, anglais, espagnol, japonais — et atteint un taux d'erreur phonétique (PER) de 8,55 %, surpassant directement Suno v5 (12,4 %) et Mureka v8 (9,96 %) sur la précision des paroles chantées selon une évaluation menée par 20 professionnels de l'industrie musicale. Une version accélérée, SongGeneration-v2-Fast, permet de générer un morceau complet en moins d'une minute depuis un espace Hugging Face, rendant le modèle accessible sans infrastructure locale. Le modèle peut produire des vocaux avec accompagnement, des instrumentaux purs, de l'a cappella ou des sorties dual-track séparées, couvrant ainsi l'ensemble des formats utiles dans un contexte de production professionnelle ou de composition assistée. Cette publication marque une étape structurante dans la démocratisation de la génération musicale : pour la première fois, un modèle open source rivalise directement avec les plateformes commerciales fermées en termes de qualité de rendu et de précision des paroles.
Que le meilleur modèle de génération musicale disponible gratuitement et exécutable localement soit désormais signé Tencent plutôt qu'une startup californienne — c'est un signal géopolitique autant que technique. SongGeneration 2 ne se contente pas d'approcher la qualité commerciale : il dépasse Suno sur la précision des paroles, historiquement le point le plus fragile de la génération audio. Ce qui change concrètement : un compositeur ou un sound designer peut partir d'un modèle de 4B paramètres, le fine-tuner sur son propre catalogue, et obtenir une base de travail sans passer par aucune plateforme propriétaire. La dépendance aux API fermées n'est plus une fatalité dans la chaîne musicale IA.