Depuis fin juin, Google propose une centaine de nouvelles langues sur son service de traduction, dont le breton et l'occitan. Cette mise à jour omet cependant l'alsacien, l'une des langues régionales les plus parlées en France. Le manque de données numérisées est notamment avancé.
Wolof, romani ou patois jamaïcain... Il vous est désormais possible d'utiliser 110 nouvelles langues sur Google traduction. Le géant américain a réalisé l'une de ses plus grosses mises à jour le 27 juin 2024, introduisant notamment le breton et l'occitan à son catalogue.
Ces langues régionales s'ajoutent au basque, corse ou encore catalan déjà présents. Mais quid de l'alsacien ? La langue parlée par plus de 500 000 personnes n'apparaît toujours pas dans l'offre de Google, au grand dam de ses locuteurs.
Contactée, l'entreprise avance trois critères de sélection : la demande des utilisateurs, le nombre de locuteurs et les données disponibles en ligne pour entrainer ses modèles. C'est principalement le dernier point qui empêche l'alsacien d'apparaître dans le service de traduction.
"Il n'y a pas d'alsacien standardisé"
L'absence de l'alsacien dans l'offre de Google traduction est loin de surprendre Pascale Erhart, directrice du département de dialectologie alsacienne de l'Université de Strasbourg. La spécialiste reconnaît un retard de la langue dans sa numérisation. "Il n'y a pas assez de données. La littérature alsacienne n'a que partiellement été mise en ligne."
Mais le souci majeur reste le manque d'uniformité de l'alsacien, qui freine sa compatibilité avec des logiciels de traduction. "Il n’y a pas d'alsacien standardisé, alors que le breton et le basque le sont davantage", explique-t-elle. "Il suffit de prendre l'exemple des brioches de Noël qui s'écrivent de trois manières différentes (mannele, männele, ou mannala, ndlr) pour voir que la langue n'est pas uniforme." L'office pour la langue et les cultures d'Alsace et de Moselle (OLCA) a réalisé une carte linguistique du territoire, consultable ici.
Des travaux sont actuellement menés à l'université de Strasbourg pour doter plusieurs langues régionales de ressources en ligne, dont l'alsacien. Cela permettra entre autres aux logiciels de traduction de mieux assimiler les variations de la langue pour les intégrer à leurs offres dans le futur. "En y intégrant l'alsacien, les gens retrouveraient confiance en cette langue et auraient plus envie de s'y mettre", estime Pascale Erhart.
Une fois ce travail réalisé, un consensus devra être trouvé pour proposer "une" version de l'alsacien. Là-encore, la tâche s'annonce délicate.