Prouesse!Traduire grâce à des similitudes mathématiques entre les langues?
AFP
10.10.2019 - 08:32
Traduire un texte dans une langue étrangère sans aucun dictionnaire, en s'appuyant sur des similitudes mathématiques entre les langues: à Paris, les chercheurs en intelligence artificielle de Facebook ont réussi une prouesse riche de promesses.
Disposer d'outils de traduction automatique performants constitue une priorité pour les grands opérateurs internet mondiaux, qui cherchent à pouvoir mettre en relation un maximum d'habitants de la planète et ainsi générer davantage d'activité économique autour de leur plate-forme.
Facebook, Google ou Microsoft, mais aussi le Russe Yandex, le chinois Baidu et d'autres cherchent sans cesse à améliorer la qualité de ces outils.
De «150 à 200 langues» sont aujourd'hui parlées sur Facebook, rappelle ainsi Antoine Bordes, le codirecteur de la recherche fondamentale en intelligence artificielle du réseau social en Europe.
Mais il n'existe pas forcément de dictionnaires, ou de pierre de Rosette (qui a permis de déchiffrer les hiéroglyphes égyptiens) pour chaque paire de langues, d'où l'intérêt de trouver un système qui permette à une machine de passer d'une langue à une autre sans ces passerelles fondamentales.
Le cœur du système développé par de jeunes chercheurs du laboratoire parisien de Facebook repose sur des représentations mathématiques des mots.
Dans chaque langue, les mots se retrouvent figurés sous la forme d'un vecteur, dans un espace de plusieurs centaines de dimensions.
Chaque vecteur est plus ou moins proche des autres mots, en fonction de ses associations avec eux dans la langue courante.
Du basque à une langue amazonienne?
Ainsi, dans toutes les langues, «le mot +chat+ et le mot +chien+ auront des vecteurs assez proches (...) Tous les vecteurs qui représentent les noms de pays – France, Etats-Unis ...- sont à peu près au même endroit», explique Guillaume Lample, un doctorant de l'université Pierre et Marie-Curie en résidence à Facebook, et l'un des pères du système.
Puisque les vecteurs-mots ont tendance à s'organiser de manière similaire dans chaque langue, il est dès lors possible de les associer d'une langue à l'autre, au début de façon assez grossière, puis de façon de plus en plus fine, jusqu'à parvenir à associer des phrases entières d'une langue à l'autre sans trop d'erreurs.
Pour l'instant, cette méthode de traduction est encore au stade du développement.
Mais les résultats sont prometteurs, explique Guillaume Lample.
Sur la paire anglais-roumain par exemple, les systèmes de traduction automatique actuellement utilisés par Facebook ont des performances «égales, voire un peu moins bonnes» que la nouvelle méthode développée par le laboratoire parisien.
Sur la paire anglais-ourdou, la méthode parisienne est meilleure que les systèmes traditionnels, parce que ceux-ci manquent de textes bilingues anglais-ourdou pour s'entraîner, affirme-t-il.
La méthode pourrait-elle permettre de traduire du basque à la langue d'une tribu amazonienne?
Traductions imparfaites
Sur le principe, oui, répond, Guillaume Lample. Sauf que pour fonctionner, pour décortiquer une langue en vecteurs, la machine a besoin de disposer d'un énorme corpus écrit... qui n'existe pas pour les langues amazoniennes.
«Si vous avez juste une dizaine de milliers de phrases, ça ne fonctionnera pas. Il en faudra quelques centaines de milliers», estime-t-il.
Interrogés par l'AFP, deux spécialistes du CNRS ont salué le travail de Guillaume Lample et de Facebook, même s'ils pensent que la méthode ne permettra sans doute pas de faire des traductions parfaites dans tous les cas.
«Traduire sans données parallèles», c'est à dire sans dictionnaires ou texte bilingue, «c'est un peu le Graal» de la traduction automatique, explique Thierry Poibeau, du laboratoire Lattice (ENS), qui salue «une révolution du point de vue conceptuel».
«Mais la question, c'est quel niveau de performance on peut en attendre», poursuit-il. La méthode «peut donner une idée du texte d'origine», mais la possibilité de donner «une bonne traduction» dans tous les cas reste encore à établir, explique-t-il.
«La mise en correspondance des langues est beaucoup plus difficile» quand elles sont très éloignées, renchérit François Yvon, du laboratoire Limsi (Orsay), qui a été chargé d'évaluer scientifiquement le travail de Guillaume Lample.
«La manière de dénoter des concepts en chinois n'a rien à voir avec le français», souligne-t-il.
Toutefois, des traductions même imparfaites pourraient être suffisantes pour traquer dans toutes les langues les contenus haineux, une grande priorité pour Facebook, explique-t-il.
Faites attention lorsque vous parlez de vous sur Facebook.
Photo: Getty
Recevoir des messages d’anniversaire met toujours du baume au cœur même lorsque ceux-ci sont écrits par des personnes qu’on a croisées il y a quatre ans dans un train. Mais en révélant votre date d’anniversaire publiquement, vous servez sur un plateau aux voleurs d’identité l’une des informations les plus importantes vous concernant.
Photo: Getty
C’est simple, toute information concernant votre vie privée ne doit pas figurer sur Facebook. Ainsi, il n’est pas nécessaire de divulguer votre statut conjugal par exemple. Surtout que, si votre statut se trouve être "célibataire", vous risquez de recevoir des messages romantiques de personnes qui vous énervaient déjà à l’école alors, à quoi bon?
Photo: Getty
Partager ses photos de famille, même si ce sont de bons moments, est plutôt déconseillé. Tout comme les photos au bord de la piscine, à première vue innocentes, qui peuvent ressurgir dans les recoins les plus sombres d’Internet. Au sujet de vos enfants, ils devraient décider par eux-mêmes dans quelle mesure ils tiennent à se mettre en scène sur les réseaux sociaux. Mais aussi longtemps qu’ils ne sont pas en âge de décider, postez aussi peu de photos d’eux que possible.
Photo: Getty
Vous avez passé une mauvaise journée au travail? Un conseil, gardez-le pour vous. On ne compte plus le nombre de personnes licenciées parce qu’elles avaient posté des messages à l’encontre de leur employeur sur Facebook.
Photo: Getty
Bien évidemment que vous pouvez être fier de votre jolie maison! Evitez seulement de mettre votre adresse sur Facebook. Surtout lorsque…
Photo: Getty
...vous dites que vous partez bientôt en vacances.
Photo: Getty
De même, évitez de donner la position exacte du lieu où vous vous trouvez actuellement. Les voleurs se feront un plaisir de sauter sur l’occasion et d’aller visiter votre domicile.
Photo: Getty
Alors, il est vrai que vous ne posteriez jamais votre mot de passe sur Facebook. Mais qu’en est-il des réponses aux questions "Quel est le nom de jeune fille de votre mère?" ou "Comment s’appelait votre premier professeur?". Votre mot de passe peut être retrouvé ainsi. Votre profil Facebook ne doit en aucun cas fournir un quelconque renseignement pour les réponses à ces questions.
Marc Atallah présente son «Digital Dreams Festival»
Le nouveau festival dédié à la créativité numérique «Digital Dreams Festival» a été présenté lundi par Marc Atallah et son équipe. Co-produit par l’Université de Lausanne (UNIL), l’événement se tiendra du 6 au 8 septembre sur le site de l’université, entre concerts, performances, ateliers ou encore videomapping monumental. «Ce qui fait la particularité de ce festival, c’est qu’il est bâti avec des acteurs complètement différents les uns des autres» a relevé Marc Atallah, directeur du festival. «On a à la fois une dimension artistique, musicale, de méditation, de débat citoyen ou encore d’expérience de réalité virtuelle.»
29.04.2024
Marc Atallah présente son «Digital Dreams Festival»