Un synthétiseur capable de reconstituer la parole en temps réel
Des chercheurs ont mis au point un synthétiseur vocal capable de reconstituer la parole en temps réel grâce aux mouvements de la bouche et ce sans utiliser la voix. Une technologie qui pourrait aider les muets.
Des chercheurs français ont conçu une avancée médicale et technologique qui pourrait bien aider les personnes muettes ou souffrant de pathologie du larynx. Les scientifiques du Centre national de la recherche scientifique (CNRS) et de l’Institut national de la santé et de la recherche médicale (INSERM) ont mis au point un synthétiseur vocal capable de reproduire la parole en temps réel, à l’aide des mouvements de la bouche mais sans besoin d’utiliser la voix.
Détection des mouvements de la mâchoire et de la bouche
Les chercheurs détaillent leur projet et ses résultats dans la revue scientifique PLOS Computational Biology. Les équipes du GIPSA-lab (Grenoble Images Parole Signal Automatique) et du BrainTech Laboratory ont travaillé plusieurs années durant à concevoir un système capable de lire les signaux physiques d’une personne articulant silencieusement et de reproduire sa parole synthétiquement.
Dans le communiqué, les auteurs expliquent le procédé : “Un algorithme d’apprentissage automatique est utilisé pour décoder ces mouvements articulatoires à l’aide de capteurs posés sur la langue, les lèvres et la mâchoire, et les convertir en temps-réel en une parole de synthèse”. Ils notent également plusieurs publications préalables à ce sujet : “La conversion d’une articulation silencieuse en un signal de parole intelligible a déjà fait l’objet de plusieurs travaux”.
Une synthèse vocale travaillée
Les scientifiques ont poussé la recherche pour améliorer encore plus le dispositif et offrir un “synthétiseur pilotable a priori par n’importe quel locuteur (après une courte période de calibration du système)”. Qui plus est ce projet vise également à s’affranchir des limitations habituelles en matière de système similaires grâce à “l’absence de restriction sur le vocabulaire, ce qui est classiquement le cas dans les systèmes de lecture labiale automatique (lip reading)”.
Mais les chercheurs comptent aller encore plus loin alors qu’ils travaillent actuellement sur des objectifs encore plus ambitieux. Ils planchent sur une interface cerveau-machine pour “reconstruire la parole en temps réel, mais cette fois-ci à partir de l’activité cérébrale”.