Buscar
Modélisation statistique de la langue arabe
Cód:
491_9786131597565
Ce manuscrit expose le travail de recherche effectué dans le cadre de ma thèse de doctorat et qui sintéresse au traitement automatique de la langue Arabe. Il décrit dabord loutil conçu pour la construction de corpus de lArabe; cet outil permet de recueillir automatiquement une liste de site, extrait leur contenu et le normalise. Le corpus ainsi constitué peut être utilisé dans diverses applications de TAL et plus particulièrement dans le calcul de modèles statistiques. Il présente ensuite les expérimentations menées en terme de modélisation statistique et qui ont pour objectif de trouver comment modéliser le mieux la langue Arabe . Le manque de données ma conduit à entreprendre dautres solutions sans pour cela augmenté la taille du corpus. Jai procédé à une segmentation des mots du corpus afin daugmenter sa viabilité statistique. une meilleure performance en terme de perplexité normalisée fut constatée. Finalement, ce livre expose les résultats dune étude comparative des modèles statistiques de lArabe et ceux dautres langues à savoir le Français, lAnglais, le Grec, le Portugais et le Finnois.
Veja mais