Une IA traduit "instantanément" des tablettes vieilles de 5000 ans

David39

On est les enfants oublié de l'Histoire les amis!
VIB
Logo


ActuaLitté

Une IA traduit "instantanément" des tablettes vieilles de 5000 ans​

Parmi les centaines de milliers de tablettes dites cunéiformes, beaucoup n’ont pas été traduites par la poignée de chercheurs dans le monde, qualifiés pour un tel travail. La technologie permettra-t-elle de résoudre cette problématique : une récente étude évoque une nouvelle intelligence artificielle (IA) qui a produit des traductions de certains de ces textes millénaires. Et un constat, c’est de « haute qualité »...

Le 18/07/2023 à 16:03 par Hocine Bouhadjera


Si les sources manquent parfois pour certaines langues, comme celle des Étrusques pas encore déchiffrée, l’ancien akkadien est l’une des mieux attestées du monde antique : entre des centaines de milliers et plus d’un million de textes de cette langue sémitique primitive nous sont parvenus, dont la plupart sont aujourd’hui conservés dans les musées et les universités du monde.

Difficile akkadien​

Une richesse de documents pour appréhender la vie, la politique et les croyances de la Mésopotamie et ses empires de Sumer, d’Akkad, de Babylone et assyrien, mais une insuffisance de moyens humains pour tous les étudier.

La traduction de l’akkadien est un processus en deux étapes. D’abord, il faut translittérer les signes cunéiformes, soit les réécrire en utilisant la phonétique à consonance similaire de la langue cible. Les chercheurs prennent ensuite leur translittération du texte et la traduisent dans une langue moderne.

En outre, l’akkadien est « polyvalent » : ses signes cunéiformes peuvent avoir plusieurs lectures différentes selon la façon dont chacun fonctionne dans une phrase...

Face à cette problématique, une équipe multidisciplinaire d’archéologues et d’informaticiens a développé une IA capable de traduire l’akkadien presque instantanément. Le modèle de traduction automatique pour le cunéiforme akkadien s’appuie sur la même technique que celle de Google Traduction, à base de réseau de neurones artificiels. Les résultats ont été publiés dans la revue scientifique, PNAS Nexus, et leurs recherches sur GitHub à Akkademia.

L’équipe de chercheurs a formé le modèle d’IA grâce à un corpus de textes cunéiformes déjà bien étudié et richement annoté. Tout d’abord, il a appris à traduire l’akkadien à partir des translittérations des textes originaux. Il a également appris à traduire directement les symboles cunéiformes. Plus justement, il a traduit les glyphes Unicode des textes qui ont été générés par un autre outil, qui produit automatiquement l’Unicode par l’entremise d’une image d’une tablette.

Tablette en basalte rapportant la vente de champs, provenance inconnue, v. 2600-2500 av. J.-C. Oriental Institute de Chicago.
Tablette en basalte rapportant la vente de champs, provenance inconnue, v. 2600-2500 av. J.-C. Oriental Institute de Chicago. Daderot (CC0)


Le modèle d’IA a ensuite appris à déterminer comment identifier les nuances des différents genres de l’échantillon — par exemple entre les œuvres littéraires et les lettres administratives — ainsi que la façon de prendre en compte les évolutions dans l’écriture cunéiforme au cours des millénaires. Il a encore été testé à l’aide d’Understudy 4 (BLEU4), un algorithme utilisé pour évaluer un texte traduit automatiquement.

Dans son test de translittération en anglais, le modèle d’IA a obtenu 37,47. Dans son test cunéiforme-anglais, 36,52. Deux scores supérieurs dans la fourchette d’une traduction de « haute qualité ». Là où l’équipe de chercheurs a été surprise : le modèle a reproduit les nuances du genre de chaque phrase. Bien que ce ne soit pas l’un de leurs objectifs, ils notent dans l’étude que cela peut ouvrir des possibilités d’utilisations au-delà d’une simple traduction, nous apprend Big Think.


Suite...
 

David39

On est les enfants oublié de l'Histoire les amis!
VIB

Une langue morte, mais préservée​

La langue akkadienne était d’abord celle parlée dans l’Empire du même nom, fondée vers 2300 av. J.-C. grâce aux victoires de son instigateur, Sargon le Grand. Au fil du temps, l’akkadien s’est fractionné en dialectes assyriens et babyloniens, avant d’être totalement remplacé par l’araméen au début du premier millénaire avant notre ère. L’akkadien n’a laissé aucune langue vivante dont elle serait issue.

Dans sa forme écrite, l’akkadien s’est avéré plus durable : ce système utilisait un stylet en roseau pour imprimer des glyphes en forme de coin (cunéiforme signifie « en forme de coin » en latin) dans des tablettes d’argile humides, avant de les cuire. Après que l’araméen ait supplanté l’akkadien comme langue commune de la région, les érudits ont continué à se servir du cunéiforme akkadien jusqu’au premier siècle de notre ère.

À LIRE:Que nous racontent ces tablettes datées de 4000 ans ?

Cette pratique de graver sur de l’argile ou la pierre est la raison principale de la survie de ces centaines de milliers de sources, malgré les millénaires. Le linguiste Steven Roger Fischer, résume : « Ironiquement, des conflagrations destructrices ont préservé certaines des plus grandes bibliothèques de l’ancienne Mésopotamie — parce qu’elles étaient faites d’argile. En revanche, toutes les bibliothèques de papyrus de l’Égypte ancienne ont brûlé ou se sont effondrées, bien que de nombreux codex individuels subsistent. »

Tablettes d'argile de taille, format et mise en page variés, Ägyptisches Museu de Leipzig. Einsamer Schütze  (CC BY-SA 3.0)
Tablettes d'argile de taille, format et mise en page variés, Ägyptisches Museu de Leipzig. Einsamer Schütze (CC BY-SA 3.0)

Crédits photo : Inscription sur roche du roi perse achéménide Darius Ier (521-486 av. J.-C.) à Ganjnameh (Iran). (Simorg ; CC BY-SA 3.0)

 

David39

On est les enfants oublié de l'Histoire les amis!
VIB
Pour le coup ici les I.A. s'avèrent utile et performante dans le bon sens du terme même s'il faut à mon avis toujours bien vérifier la plausibilité des données et des faits de manière objective.
 
Dernière édition:

Bjorn

Мир без Путина، زندگی، آزادی Слава Україні
Bladinaute averti
Pour le coup ici les I.A. s'avèrent utile et performante dans le bon sens du terme même s'il faut à mon avis toujours bien vérifier la plausibilité des données et des faits de manière objective.
Qui peut bien vouloir contester les résultats ?
 

David39

On est les enfants oublié de l'Histoire les amis!
VIB
Qui peut bien vouloir contester les résultats ?

Qui a parlé de contestation? Absolument personne. J'ai juste dit qu'il ne fallait pas gober bêtement les résultats d'un programme informatique. Analyser les données et confirmer leurs plausibilité et leurs véracité fait partie des principes scientifiques.

A mon tour je pose une question: Qui pourrait bien vouloir être comme toi, c'est à dire à côté de la plaque de manière systémique en plus d'être désagréable, hautain et nauséabond?
 

Bjorn

Мир без Путина، زندگی، آزادی Слава Україні
Bladinaute averti
Ironiquement, des conflagrations destructrices ont préservé certaines des plus grandes bibliothèques de l’ancienne Mésopotamie — parce qu’elles étaient faites d’argile
Dessin de chapatte après la destruction du musée de Mossoul
1689861519626.png
 
Qui a parlé de contestation? Absolument personne. J'ai juste dit qu'il ne fallait pas gober bêtement les résultats d'un programme informatique. Analyser les données et confirmer leurs plausibilité et leurs véracité fait partie des principes scientifiques.

A mon tour je pose une question: Qui pourrait bien vouloir être comme toi, c'est à dire à côté de la plaque de manière systémique en plus d'être désagréable, hautain et nauséabond?
Je chope le sujet au vol et j'ai pensé la même chose quand je vois Chat GPT répondre parfois n'importe quoi...
 

David39

On est les enfants oublié de l'Histoire les amis!
VIB


A prendre au 4e degré bien sûr.
 

A prendre au 4e degré bien sûr.
Génial ! On va se débarrasser des mondialistes !
Ah mince ! On est dans le même bateau 🤔
 
Haut