Résumé | Cet article aborde un problème important lié à l'utilisation de systèmes d'induction dans l'analyse des données du monde réel. Le problème est celui de la qualité et de la fiabilité des règles générées par les systèmes. Nous étudions l'importance d'avoir une mesure de la qualité des règles qui soit efficace et fiable. Une telle mesure peut être utile pour l'interprétation, le classement et l'application des règles générées par un système d'induction. Un certain nombre de mesures statistiques et de qualité des règles sont choisies dans la littérature spécialisée et leur performance est évaluée sur quatre ensembles de données de semi-conducteurs. Le premier but de l'essai et de l'évaluation consistait à étudier la performance de ces mesures de qualité d'après : (i) l'exactitude, (ii) la couverture, (iii) le ratio d'erreur positif et (iv) le ratio d'erreur négatif de la règle choisie par chaque mesure. En outre, nous examinons la sensibilité de ces mesures de qualité pour différentes distributions de données. En conclusion, nous recommandons la statistique de Cohen comme la meilleure mesure de qualité examinée dans ce domaine. Finalement, nous expliquons quelques travaux ultérieurs à effectuer dans ce secteur. |
---|