Source |
Korben |
Identifiant |
8629047 |
Date de publication |
2024-12-23 10:20:00 (vue: 2024-12-23 10:08:04) |
Titre |
MMAudio - Un outil pour synchroniser l\'audio et la vidéo |
Texte |
Des chercheurs de l\'Université de l\'Illinois à Urbana-Champaign et de Sony AI viennent de dévoiler une prouesse technique particulièrement impressionnante dans le domaine de l\'IA générative. En effet, leur nouveau projet baptisé MMAudio permet de générer automatiquement des bandes sonores parfaitement synchronisées avec n\'importe quelle vidéo.
Contrairement à la plupart des solutions existantes, qui se contentent souvent de superposer maladroitement des effets sonores sur les vidéos, MMAudio innove en adoptant une approche multimodale combinant texte et vidéo. Le système analyse en parallèle le contenu visuel et les descriptions textuelles pour comprendre précisément ce qui se passe à l\'écran et générer des sons réalistes et cohérents.
Des chercheurs de l\'Université de l\'Illinois à Urbana-Champaign et de Sony AI viennent de dévoiler une prouesse technique particulièrement impressionnante dans le domaine de l\'IA générative. En effet, leur nouveau projet baptisé MMAudio permet de générer automatiquement des bandes sonores parfaitement synchronisées avec n\'importe quelle vidéo.
Contrairement à la plupart des solutions existantes, qui se contentent souvent de superposer maladroitement des effets sonores sur les vidéos, MMAudio innove en adoptant une approche multimodale combinant texte et vidéo. Le système analyse en parallèle le contenu visuel et les descriptions textuelles pour comprendre précisément ce qui se passe à l\'écran et générer des sons réalistes et cohérents. |
Notes |
★★★
|
Envoyé |
Oui |
Condensat |
adoptant analyse approche audio automatiquement avec bandes baptisé champaign chercheurs cohérents combinant comprendre contentent contenu contrairement dans des descriptions domaine dévoiler effet effets existantes générative générer illinois importe impressionnante innove les leur maladroitement mmaudio multimodale nouveau outil parallèle parfaitement particulièrement passe permet plupart pour projet prouesse précisément quelle qui réalistes solutions sonores sons sony souvent superposer sur synchroniser synchronisées système technique texte textuelles une université urbana vidéo vidéos viennent visuel écran |
Tags |
|
Stories |
|
Move |
|