Antiquité

Restaurer des textes anciens par l'intelligence artificielle

ATS

10.3.2022 - 06:33

Ithaca pourra servir pour toutes les langues anciennes comme le latin, l'ancien maya ou l'écriture cunéiforme de Mésopotamie (archives).
ATS

L'intelligence artificielle pour prédire le passé: des textes grecs anciens du Ve siècle avant notre ère ont pu être restaurés, datés et localisés avec une précision inégalée avec l'aide d'une technique d'apprentissage profond. Elle est présentée mercredi dans Nature.

ATS

10.3.2022 - 06:33

Des dizaines de milliers d'inscriptions, gravées sur pierre, argile ou métal, permettent aux historiens spécialistes de l'épigraphie de retracer l'histoire des civilisations anciennes. Mais beaucoup se sont abîmées au fil du temps, au point de rendre certains textes illisibles tant il manque des pièces au puzzle.

Pour aider les épigraphistes à les déchiffrer, des chercheurs des universités de Venise, Oxford, Athènes et de la société DeepMind (Google) ont développé un outil d'apprentissage profond, l'une des techniques de l'intelligence artificielle utilisant un «réseau neuronal», qui imite la structure du cerveau humain.

Cet outil baptisé Ithaca, en référence à l'île d'Ulysse dans «L'Iliade et l'Odyssée», s'est entraîné sur près de 80'000 inscriptions référencées dans la base de données du Packard Humanities Institute, la plus grande collection numérique d'inscriptions en grec ancien.

Précision de 62%

Sa technique de traitement automatique du langage prend en compte l'ordre dans lequel les mots apparaissent dans les phrases et leurs relations, afin de mieux les contextualiser.

Au vu des multiples lacunes des textes, Ithaca a dû intégrer à la fois les mots et les caractères individuels, répartis de manière fragmentaire sur le support. Il s'est alors attelé à un corpus de décrets du Ve siècle avant notre ère, gravés sur des tablettes de pierre et retrouvés sur l'Acropole d'Athènes.

Il a émis des hypothèses de séquences de lettres pouvant combler les trous, en cohérence avec le contexte historique dont il s'est «imprégné» – par exemple le mot «alliance» est proposé pour six caractères manquants dans un serment d'allégeance d'une ville à Athènes.

Aux historiens de choisir ensuite la prédiction la plus crédible. Leur travail a été grandement facilité: l'outil Ithaca, présenté comme «accessible», atteint à lui seul une précision de 62%. Et lorsqu'il est utilisé par des historiens, ce taux de précision bondit de 25% à 72%, détaille l'étude de Nature, soulignant l'effet bénéfique de cette «synergie» homme-machine.

Ithaca suggère en outre de multiples localisations dans 84 régions, visualisées sur une carte faisant ressortir des connexions géographiques à travers le monde antique. Il propose enfin une date précise pour la rédaction des décrets: 421 avant notre ère, soit environ 30 ans plus tard que les dates approximatives proposées par les historiens.

ATS