Résumé | Cet article présente ICET, soit un nouvel algorithme de classification en fonction des coûts. ICET se sert d'un algorithme génétique pour produire une population de biais pour un algorithme d'induction d'arbre de décision. La fonction condition physique de l'algorithme génétique représente le coût moyen de classification lorsqu'on utilise l'arbre de décision, y compris les coûts des tests (caractéristiques, mesures) et les coûts des erreurs de classification. On compare ICET à trois autres algorithmes de classification en fonction des coûts, soit EG2, CS-ID3 et IDX; on le compare également à C4.5 qui classifie sans tenir compte des coûts. Les cinq algorithmes sont évalués de façon empirique dans cinq ensembles de données médicales réelles. On effectue trois séries d'expériences. Dans la première série, on examine la performance de base des cinq algorithmes dans les cinq ensembles de données et on établit que la performance de ICET est bien meilleure que celle de ses concurrents. Dans la deuxième série d'expériences, on teste la robustesse de ICET dans un certain nombre de conditions diverses et on voit que ICET maintient toujours son avance. La troisième série porte sur la recherche de ICET dans l'espace de biais et découvre un moyen d'améliorer cette recherche. |
---|