| Téléchargement | - Voir le manuscrit accepté : A probabilistic model for fast and confident categorisation of textual documents (PDF, 325 Kio)
|
|---|
| Auteur | Rechercher : Goutte, Cyril1 |
|---|
| Affiliation | - Conseil national de recherches Canada. Institut de technologie de l'information du CNRC
|
|---|
| Format | Texte, Chapitre de livre |
|---|
| Résumé | We describe the National Research Council's (NRC) entry in the Anomaly Detection/Text Mining competition organized at the Text Mining Workshop 2007. This entry relies on a straightforward implementation of a probabilistic categorizer described earlier [GGPC02]. This categorizer is adapted to handle multiple labeling and a piecewise-linear confidence estimation layer is added to provide an estimate of the labeling confidence. This technique achieves a score of 1.689 on the test data. This model has potentially useful features and extensions such as the use of a category-specific decision layer or the extraction of descriptive category keywords from the probabilistic profile. |
|---|
| Date de publication | 2008 |
|---|
| Maison d’édition | Springer |
|---|
| Emplacement | Oxford |
|---|
| Dans | |
|---|
| Langue | anglais |
|---|
| Numéro du CNRC | NRCC 49829 |
|---|
| Numéro NPARC | 5764844 |
|---|
| Exporter la notice | Exporter en format RIS |
|---|
| Signaler une correction | Signaler une correction (s'ouvre dans un nouvel onglet) |
|---|
| Identificateur de l’enregistrement | 05e3038a-f734-4b14-bcc4-d90f41df31e8 |
|---|
| Enregistrement créé | 2009-03-29 |
|---|
| Enregistrement modifié | 2024-02-05 |
|---|