
Une IA traduit "instantanément" des tablettes vieilles de 5000 ans
Parmi les centaines de milliers de tablettes dites cunéiformes, beaucoup n’ont pas été traduites par la poignée de chercheurs dans le monde, qualifiés pour un tel travail. La technologie permettra-t-elle de résoudre cette problématique : une récente étude évoque une nouvelle intelligence artificielle (IA) qui a produit des traductions de certains de ces textes millénaires. Et un constat, c’est de « haute qualité »...Le 18/07/2023 à 16:03 par Hocine Bouhadjera
Si les sources manquent parfois pour certaines langues, comme celle des Étrusques pas encore déchiffrée, l’ancien akkadien est l’une des mieux attestées du monde antique : entre des centaines de milliers et plus d’un million de textes de cette langue sémitique primitive nous sont parvenus, dont la plupart sont aujourd’hui conservés dans les musées et les universités du monde.
Difficile akkadien
Une richesse de documents pour appréhender la vie, la politique et les croyances de la Mésopotamie et ses empires de Sumer, d’Akkad, de Babylone et assyrien, mais une insuffisance de moyens humains pour tous les étudier.La traduction de l’akkadien est un processus en deux étapes. D’abord, il faut translittérer les signes cunéiformes, soit les réécrire en utilisant la phonétique à consonance similaire de la langue cible. Les chercheurs prennent ensuite leur translittération du texte et la traduisent dans une langue moderne.
En outre, l’akkadien est « polyvalent » : ses signes cunéiformes peuvent avoir plusieurs lectures différentes selon la façon dont chacun fonctionne dans une phrase...
Face à cette problématique, une équipe multidisciplinaire d’archéologues et d’informaticiens a développé une IA capable de traduire l’akkadien presque instantanément. Le modèle de traduction automatique pour le cunéiforme akkadien s’appuie sur la même technique que celle de Google Traduction, à base de réseau de neurones artificiels. Les résultats ont été publiés dans la revue scientifique, PNAS Nexus, et leurs recherches sur GitHub à Akkademia.
L’équipe de chercheurs a formé le modèle d’IA grâce à un corpus de textes cunéiformes déjà bien étudié et richement annoté. Tout d’abord, il a appris à traduire l’akkadien à partir des translittérations des textes originaux. Il a également appris à traduire directement les symboles cunéiformes. Plus justement, il a traduit les glyphes Unicode des textes qui ont été générés par un autre outil, qui produit automatiquement l’Unicode par l’entremise d’une image d’une tablette.

Le modèle d’IA a ensuite appris à déterminer comment identifier les nuances des différents genres de l’échantillon — par exemple entre les œuvres littéraires et les lettres administratives — ainsi que la façon de prendre en compte les évolutions dans l’écriture cunéiforme au cours des millénaires. Il a encore été testé à l’aide d’Understudy 4 (BLEU4), un algorithme utilisé pour évaluer un texte traduit automatiquement.
Dans son test de translittération en anglais, le modèle d’IA a obtenu 37,47. Dans son test cunéiforme-anglais, 36,52. Deux scores supérieurs dans la fourchette d’une traduction de « haute qualité ». Là où l’équipe de chercheurs a été surprise : le modèle a reproduit les nuances du genre de chaque phrase. Bien que ce ne soit pas l’un de leurs objectifs, ils notent dans l’étude que cela peut ouvrir des possibilités d’utilisations au-delà d’une simple traduction, nous apprend Big Think.

Une IA traduit "instantanément" des tablettes vieilles de 5000 ans
Parmi les centaines de milliers de tablettes dites cunéiformes, beaucoup n’ont pas été traduites par la poignée de chercheurs dans le monde, qualifiés pour un tel travail. La technologie permettra-t-elle de résoudre cette problématique : une récente étude évoque une nouvelle intelligence...

Suite...