Résumé | Cet article étudie les applications de la catégorisation des textes dans le contexte du commerce électronique, avec un grand nombre de catégories cibles et un nombre relativement restreint de cas d'apprentissage, et une application à un système réel d'appel d'offres en ligne. Cet article présente les résultats des expériences que nous avons effectuées avec une application réelle, en utilisant les méthodes conventionnelles d'apprentissage machine de la catégorisation des textes, à savoir la méthode de Rocchio, la méthode TF-IDF (fréquence des termes - fréquence inverse des documents), la méthode WIDF (fréquence inverse pondérée des documents) et la méthode naïve de Bayes. Afin de rendre les résultats de la catégorisation acceptables en vue d'une utilisation industrielle, nous nous sommes servis de la structure hiérarchique des catégories cibles et nous avons examiné la catégorisation de classement semi automatisée. |
---|