Sujet :

minorités nationales

Xuan
   Posté le 22-01-2016 ŕ 13:47:39   

La Chine établit un corpus pour la langue mongole


2016-01-22 xinhua

Une base de données dédiée à la langue mongole contenant 80 millions de mots a été lancée, après dix ans de collecte et de recherche, a indiqué l'Académie des Sciences sociales de la Mongolie intérieure.
Le corpus mongol forme une partie du corpus de 200 millions de mots utilisés par les minorités ethniques dans le nord et le nord-est de la Chine, dont les langues Duar, Ewenk et Oroqen. Le projet est prévu pour être réalisé en 20 ans.

Les compilateurs ont identifié 97 localisations à travers huit régions provinciales de la Chine où habite une population mongole, ainsi que cinq provinces et villes en Mongolie, en République de Bouriatie et en République de Kalmoukie en Russie. Ils ont collecté 4.192 heures de données orales, à partir de 6.725 locuteurs mongols et 4.000 heures de données écrites.

Les projets de corpus visent à protéger les langues ethniques en voie de disparition, et formeront une ressource linguistique précieuse, selon l'académie.

Le projet consiste en deux étapes. La première étape, le corpus mongol, est achevée et la seconde, la base de données pour les trois autres langues, est en cours.