Résumé | Cet article présente une analyse en profondeur de l'intégration d'un système de translittération de l'arabe vers l'anglais dans un système d'usage général de traduction automatique statistique fondée sur les syntagmes. Dans cet article, nous étudions l'intégration de différents aspects et nous évaluons, au moyen de scores BLEU, dans quelle mesure l'amélioration peut être attribuée à l'intégration. Nos expériences indiquent qu'un module de translittération peut contribuer de façon importante dans les cas où les données de l'essai sont riches d'entités nommées non connues. Pour des mots source hors du vocabulaire (Out of Vocabulary Word - OOV)), c'est-à dire ne figurant pas dans la table des syntagmes, nous parvenons à réaliser 70 % et 53 % de l'amélioration maximale théorique que nous pouvions obtenir dans le cas d'ensembles de données de développement et d'essai respectivement, tel que mesuré par un système Oracle. |
---|