Open AI dévoile « Voice Engine », son nouvel outil pour cloner des voix
Après le texte, les images et la vidéo, place désormais à la voix et c’est le nouveau challenge d’Open Ai. L’entreprise californienne vient de révéler son tout nouvel outil baptisé « Voice Engine » qui se charge de cloner n’importe quelle voix en un temps record.
En effet, après Sora, l’IA qui génère des vidéos à partir d’un simple Prompt, le créateur de ChatGPT a dévoilé un son nouveau joyau « Voice Engine ». Dans un communiqué, diffusé sur son site internet, Open Ai annonce :
Aujourd'hui, nous partageons les informations et les résultats préliminaires d'un aperçu à petite échelle d'un modèle appelé Voice Engine, qui utilise la saisie de texte et un seul échantillon audio de 15 secondes pour générer une parole naturelle qui ressemble beaucoup à l'orateur d'origine.
Dans ce sens, l’entreprise révèle :
Nous avons développé Voice Engine pour la première fois fin 2022 et l'avons utilisé pour alimenter les voix prédéfinies disponibles dans l' API de synthèse vocale ainsi que ChatGPT Voice et Read Aloud.
Toutefois, Open Ai affirme s'engager à développer une IA sûre et largement bénéfique, c’est pourquoi elle souligne :
Dans le même temps, nous adoptons une approche prudente et éclairée quant à une diffusion plus large en raison du potentiel d’utilisation abusive de la voix synthétique. Nous espérons entamer un dialogue sur le déploiement responsable des voix synthétiques et sur la manière dont la société peut s'adapter à ces nouvelles capacités. Sur la base de ces conversations et des résultats de ces tests à petite échelle, nous prendrons une décision plus éclairée quant à l’opportunité et à la manière de déployer cette technologie à grande échelle.
Pour quelle utilisation ?
Concernant l’utilisation, Open Ai précise que cet outil est destiné à :
-
Fournir une aide à la lecture aux non-lecteurs et aux enfants grâce à des voix naturelles et émotionnelles représentant un plus large éventail de locuteurs que ce qui est possible avec des voix prédéfinies.
-
Traduire du contenu, comme des vidéos et des podcasts, afin que les créateurs et les entreprises puissent toucher davantage de personnes dans le monde, de manière fluide et avec leur propre voix.
-
Atteindre les communautés mondiales en améliorant la prestation de services essentiels dans les zones reculées.
-
Soutenir les personnes non verbales, comme des applications thérapeutiques pour les personnes souffrant de maladies affectant la parole et des améliorations pédagogiques pour celles ayant des besoins d'apprentissage.
-
Aider les patients à retrouver leur voix, pour ceux qui souffrent de troubles de la parole soudains ou dégénératifs.