Devenir polyglotte est un rêve partagé par bon nombre d’entre nous. Le devenir sans faire le moindre effort est encore plus remarquable. C’est dans cette optique que Google vient de créer 'Translatotron', un outil de traduction en direct de voix à voix. Contrairement aux traducteurs précédents, 'Translatotron' ne passe pas par le texte, ce qui accélère la traduction, et est capable d’imiter le phrasé et le ton de la voix traduite. Explications avec Gilles Quoistiaux.
Google AI (Intelligence artificielle) vient de dévoiler un nouveau logiciel de traduction instantanée extrêmement prometteur. Ce logiciel s’appelle le Translatotron. Ce qui est révolutionnaire, c’est que le Translatotron traduit directement une voix en une autre voix.
Le principe de la cascade
Jusqu’à présent, tous les outils de traduction instantanée fonctionnaient sur le modèle de la cascade, via trois logiciels successifs :
- Premier logiciel : la reconnaissance vocale qui traduit la voix en français écrit. C’est ce genre de logiciel qui est utilisé pour sous-titrer rapidement une vidéo sur Youtube par exemple.
- Deuxième étape : ce texte en français est traduit en mandarin. C’est le logiciel Google Translate, tout simplement.
- Enfin, troisième étape, troisième logiciel, la synthèse vocale. Le texte en mandarin est recomposé vocalement avec une voix synthétique, une voix de robot chinois.
Un processus simplifié
Fini le modèle de la cascade. Avec le Translatotron, on passe de trois étapes à une seule étape. La voix française est directement traduite en voix chinoise.
En fait, l’intelligence artificielle analyse votre spectrogramme. Quand vous parlez, vous émettez des ondes sonores. Et ces ondes sonores, on peut les traduire en dessin, des courbes ou des lignes qui se croisent. C’est un peu l’écran qui symbolise la voix de Kit dans K2000. Le Translatotron va donc traduire instantanément ce spectrogramme en français vers un spectrogramme en chinois. Et le tour est joué.
Un logiciel prometteur
Pour l'instant, il s'agit d'un projet expérimental. Google a dévoilé sur son site Internet quelques exemples de traduction de l’espagnol vers l’anglais.
Clairement, on voit que ce n’est pas encore totalement au point, les traductions sont loin d’être parfaites. Google reconnaît d’ailleurs que pour l’instant, le Translatotron n’est pas au niveau des outils actuels, qui utilisent la méthode de la cascade. Mais les avancées seraient très prometteuses.
D’après Google, cette nouvelle méthode a plusieurs avantages :
- Elle évite d’accumuler les erreurs aux différentes étapes de la traduction
- Elle permet de traduire plus vite
- Elle gère apparemment mieux les mots qui ne doivent pas être traduits, comme les noms propres
- Elle permet de mieux conserver les caractéristiques de la voix de la personne traduite
Un logiciel capable d’imiter la voix
Comme le logiciel reproduit le spectrogramme, il peut imiter l’intonation de notre voix, mais aussi la cadence à laquelle on parle. Il insiste aussi sur certains mots sur lesquels on veut parfois attirer l’attention. Il peut même imiter notre accent.
Le Translatotron est ainsi capable de proposer une traduction beaucoup plus naturelle, avec une voix moins robotique que les voix synthétiques habituelles.
Vers la disparition de la barrière des langues
On se rapproche du fameux Babel Fish, le traducteur instantané universel du film de science-fiction 'Le Guide du voyageur galactique'. Il pourrait bientôt intégrer nos smartphones, comme une extension de Google Translate ou d’autres outils de traduction qui existent déjà.
Plusieurs sociétés, dont Google, commercialisent déjà des oreillettes qui utilisent la traduction instantanée. Ce genre d’oreillettes rend déjà quelques services dans des situations simples, comme la commande d’un repas, mais elles ne permettent pas encore d’avoir une conversation fluide avec un Estonien ou un Portugais.
Mais avec les progrès de ces technologies, dans quelques années, nous pourrons peut-être avoir des discussions poussées avec des Russes ou des Japonais, même si on ne parle un mot de russe ou de japonais. On n’est peut-être pas si loin de faire tomber la barrière des langues, observe Gilles Quoistiaux.
Suivez ici sa chronique 'Nouvelles Technologies' dans Les Décodeurs