Google Duo a réussi à mieux masquer les problèmes audio lors des appels grâce à une nouvelle technologie d’intelligence artificielle. La solution, appelée WaveNetEQ, a été conçue par l’une des équipes DeepMind de l’entreprise.

Les propriétaires de Pixel 4 qui utilisent Google Duo testent inconsciemment WaveNetEQ depuis décembre. Lundi, la fonctionnalité d’IA a également commencé à être déployée sur plusieurs autres appareils. Malheureusement, Google n’a pas encore fourni une liste de ceux-ci. Quoi fait livrer cette semaine est une explication approfondie de la façon dont cette technologie résout les problèmes audio de Google Duo.

Les problèmes audio de Google Duo proviennent le plus souvent de paquets de données manquants et mal ordonnés.

Les problèmes audio résultant de la perte de paquets de données affectent 99% des appels de Google Duo, selon la filiale d’Alphabet. Bien que ce chiffre puisse sembler scandaleusement élevé, c’est tout sauf cela. C’est simplement un reflet de l’imperfection de la technologie vocale basée sur Internet. DeepMind a développé WaveNetEQ en réponse et affirme que la solution offre une atténuation des pertes de paquets sans précédent.

Résoudre les problèmes audio de Google Duo en prédisant l’avenir

En termes simples, le service analyse les données d’appel et les complète avec un son prédictif si nécessaire. Les informations audio créées par l’IA remplacent non seulement les paquets perdus, mais également ceux qui sont mal commandés. La plateforme de DeepMind découle de WaveRNN, une solution efficace de synthèse audio neuronale conçue pour la première fois dans un article scientifique il y a deux ans. WaveRNN lui-même a été précédé par WaveNet, un réseau de neurones profond présenté comme une percée majeure dans le traitement audio infusé par l’IA en 2017.

L’IA ultra-complexe n’est pas le seul moyen de lutter contre les problèmes audio lors des appels Internet. Cependant, DeepMind affirme qu’il fournit des résultats inégalés avec des écarts supérieurs à 60 millisecondes. Encouragé par les premiers résultats, la société est convaincue de continuer à poursuivre cette technique de dissimulation de la perte de paquets à l’avenir.

On ne sait pas quand WaveNetEQ pourrait devenir plus largement disponible. Le backend de la fonctionnalité ne fonctionne pas entièrement dans le cloud, ce qui exclut les appareils Android d’entrée de gamme. Au lieu de cela, il nécessite des hôtes avec des processeurs quelque peu capables optimisés pour l’apprentissage automatique. Ce serait les chipsets phares et milieu de gamme les plus modernes.

Le plus grand obstacle au déploiement plus large de WaveNetEQ est peut-être la dépendance de la solution vis-à-vis de vastes volumes de données. Comme toute autre technologie d’apprentissage automatique, le service de DeepMind nécessite des tonnes d’informations à apprendre avant de devenir utile à distance dans une langue particulière. En d’autres termes, il est implicite que seuls les propriétaires anglophones de Pixel 4 utilisaient sans le savoir la version améliorée de Google Duo depuis le début de l’année.

Quoi qu’il en soit, DeepMind n’a pas ignoré d’autres langues depuis ses jours WaveNet. Cela ne devrait donc être qu’une question de temps avant que WaveNetEQ ne soit déployé sur plus de territoires.

Laisser un commentaire