Résumé | Ce document présente un algorithme corrigeant les erreurs linguistiques représentatives des élèves en langues secondes. Nous nous concentrons sur les erreurs touchant les prépositions, très répandues chez les personnes qui apprennent une langue seconde, mais dont les correcteurs grammaticaux commerciaux et les aides à l'édition actuels ne tiennent pas bien compte. Cet algorithme utilise comme intrant une phrase contenant une erreur de préposition (et peut-être d'autres erreurs) et il produit la préposition appropriée pour le contexte de cette phrase en particulier. Nous appliquons une méthode hybride en deux phases fondée sur des règles et sur les statistiques. Au cours de la première phase, un traitement fondé sur des règles est utilisé afin de générer une courte expression qui saisit le contexte d'utilisation de la préposition dans la phrase de départ. Au cours de la deuxième phase, des recherches Web sont utlisées afin d'évaluer la fréquence de cette expression, lorsque d'autres prépositions sont utlisées au lieu de la préposition initiale. Nous avons testé cet algorithme sur un corpus de 133 phrases en français écrites par des personnes apprenant une seconde langue au niveau intermédiaire, et nous avons trouvé que ce processus peut résoudre 69,9 % de ces cas. Par comparaison, nous avons trouvé que le meilleur correcteur orthographique et grammatical sur le marché à l'heure actuelle, Antidote, ne résout que 3 % de ces cas. Nous avons aussi montré que le rendement se dégrade progressivement lorsqu'on traite un corpus de n-grammes fréquents afin d'évaluer les fréquences. |
---|