Cet été Dominique Desaunay revient sur les nouvelles technologies qui ont marqué le début de l’année 2021. Au menu cette semaine, l’association « Le Voice Lab », qui invite les internautes francophones à faire don de leurs données vocales afin de coconstruire de nouvelles technologies de communications par la voix, un secteur actuellement dominé par les géants de la Tech américaine.

Rediffusion du 21 férvier 2021.

Le Voice Lab est une association rassemblant les principaux acteurs français, institutionnels, universitaires, laboratoires de recherche et entreprises privées qui ont le projet de concevoir des modèles de reconnaissance vocale dans la langue de Molière.

L’objectif est de développer différents services de transcription automatique de la parole offrant ainsi une alternative aux Siri, Alexa, Google Home, qui comme bien d’autres bijoux high-tech conversationnels, sont gérés exclusivement par de grandes firmes américaines.
L’internaute va pouvoir participer à nos recherches en se connectant à des services en ligne qu’il utilise déjà, en passant, par exemple, par son assistant vocal.
 

– Karel Bourgois, président du Voice Lab 

Mais pour jeter les bases d’une souveraineté numérique française et européenne dans le domaine des technologies vocales plus respectueuses de nos données, l’association a besoin de notre participation en ligne, nous précise Karel Bourgois, président du Voice Lab.

« Nous avons commencé à travailler entre jeunes pousses et laboratoires de recherche pour essayer de créer un écosystème francophone de la donnée vocale et on espère que ce projet deviendra européen pour répondre aux enjeux stratégiques des grands groupes, mais aussi des services publics dans ce domaine. L’idée de cette collecte est que l’internaute va pouvoir participer à nos recherches en se connectant à des services en ligne qu’il utilise déjà, en passant, par exemple, par son assistant vocal », explique Karel Bourgois.

Puis il détaille ce dont Voice Lab a besoin : « Nous avons besoin des données de voix de femmes, d’hommes, d’enfants, de personnes âgées, de recueillir toute la diversité et la richesse de la langue française. Mais aussi toute la diversité de son vocabulaire, qu’il soit professionnel, littéraire, technique ou des extraits de la vie quotidienne avec des gens qui parlent entre eux. L’objectif est de comprendre la langue française dans sa généralité pour ensuite avoir suffisamment de données spécialisées afin de répondre aux besoins de nouveaux services en ligne que l’on pourrait développer pour tous les usages. »
Une nouvelle communication électronique est en train de naître
Et en cette période de pandémie de Covid-19, la voix semble prendre aujourd’hui sa revanche sur les usages du numérique qui favorisaient jusqu’à présent l’expression écrite. Podcasts, vocalisation des messages instantanés, robots conversationnels et réseaux sociaux pour discuter à plusieurs nous ont permis de briser un peu de cet isolement que nous imposaient les confinements successifs. 

En définitive, une nouvelle communication électronique basée principalement sur l’audio est en train de naître. À la condition toutefois que les systèmes de reconnaissance vocale comprennent enfin les subtilités de notre langue maternelle.

Vous avez des questions ou des suggestions, vous pouvez nous écrire à nouvelles.technologies@rfi.fr