Extraction of Keyphrases from Text: Evaluation of Four Algorithms

Par Conseil national de recherches du Canada

Téléchargement	Voir la version finale : Extraction of Keyphrases from Text: Evaluation of Four Algorithms (PDF, 598 Kio)
DOI	Trouver le DOI : https://doi.org/10.4224/5765105
Auteur	Rechercher : Turney, Peter¹
Affiliation	Conseil national de recherches du Canada. Institut de technologie de l'information du CNRC
Format	Texte, Rapport technique
Résumé	Ce rapport présente une évaluation empirique de quatre algorithmes d'extraction automatique de mots et d'expressions clés dans des documents. Ces quatre algorithmes sont comparés en utilisant cinq ensembles de documents différents. Pour chaque document, on établit un ensemble cible d'expressions clés, générées manuellement. Ces expressions clés ont été générées à l'intention de lecteurs humains; elles n'ont été conçues pour aucun des quatre algorithmes d'extraction. Les divers algorithmes ont été évalués en fonction du degré d'adéquation des expressions clés extraites et des expressions clés générées manuellement. Les quatre algorithmes sont les suivants : (1) la fonction AutoSummarize de Microsoft Word 97; (2) un algorithme basé sur le descripteur de nature grammaticale de Eric Brillis; (3) la fonction Summarize de Verityis Search 97; (4) l'algorithme Extractor du CNR. Pour les cinq ensembles de documents, c'est l'algorithme Extractor du CNRC qui a fourni la meilleure adéquation avec les expressions clés générées manuellement.
Date de publication	1997
Langue	anglais
Numéro du CNRC	NRCC 41550
Numéro NPARC	5765105
Exporter la notice	Exporter en format RIS
Signaler une correction	Signaler une correction (s'ouvre dans un nouvel onglet)
Identificateur de l’enregistrement	ca2a6207-34c0-48d3-8493-4dc4ccedd3f3
Enregistrement créé	2009-03-29
Enregistrement modifié	2020-05-27

Date de modification :: 2024-07-27