Téléchargement | - Voir la version finale : Extraction of keyphrases from text: evaluation of four algorithms (PDF, 300 Kio)
|
---|
DOI | Trouver le DOI : https://doi.org/10.4224/5765105 |
---|
Auteur | Rechercher : Turney, Peter1 |
---|
Affiliation | - Conseil national de recherches du Canada. Institut de technologie de l'information du CNRC
|
---|
Format | Texte, Rapport technique |
---|
Description physique | 31 p. |
---|
Résumé | Ce rapport présente une évaluation empirique de quatre algorithmes d'extraction automatique de mots et d'expressions clés dans des documents. Ces quatre algorithmes sont comparés en utilisant cinq ensembles de documents différents. Pour chaque document, on établit un ensemble cible d'expressions clés, générées manuellement. Ces expressions clés ont été générées à l'intention de lecteurs humains; elles n'ont été conçues pour aucun des quatre algorithmes d'extraction. Les divers algorithmes ont été évalués en fonction du degré d'adéquation des expressions clés extraites et des expressions clés générées manuellement. Les quatre algorithmes sont les suivants : (1) la fonction AutoSummarize de Microsoft Word 97; (2) un algorithme basé sur le descripteur de nature grammaticale de Eric Brillis; (3) la fonction Summarize de Verityis Search 97; (4) l'algorithme Extractor du CNR. Pour les cinq ensembles de documents, c'est l'algorithme Extractor du CNRC qui a fourni la meilleure adéquation avec les expressions clés générées manuellement. |
---|
Date de publication | 1997-10-23 |
---|
Maison d’édition | National Research Council of Canada |
---|
Série | |
---|
Langue | anglais |
---|
Numéro du CNRC | NRCC 41550 |
---|
Numéro NPARC | 5765105 |
---|
Exporter la notice | Exporter en format RIS |
---|
Signaler une correction | Signaler une correction (s'ouvre dans un nouvel onglet) |
---|
Identificateur de l’enregistrement | ca2a6207-34c0-48d3-8493-4dc4ccedd3f3 |
---|
Enregistrement créé | 2009-03-29 |
---|
Enregistrement modifié | 2024-12-09 |
---|