Résumé | Nous présentons un système d'extraction du Web sémantique, qui joute des fonctionnalités au navigateur et établit des correspondances entre des documents HTML et des tables et, si possible, des règles. Premièrement, l'extracteur des données de base ViPER distille une information semi-structurée et la réorganise en une structure tabulaire de données, que l'on peut également explorer et/ou soumettre à un traitement machine additionnel. Deuxièmement, pour illustrer ce traitement, l'extracteur étendu de connaissances Rex ViPER explore les tables obtenues pour y relever les propriétés structurelles et les dépendances fonctionnelles. Des règles sont générées pour produire une représentation plus compacte et gérable, et souvent enrichie, des connaissances. L'information entièrement structurée ainsi que les faits et les règles sérialisés par RuleML que l'on obtient peuvent être stockés avec les documents originaux, faire l'objet de requêtes émises par des moteurs de règles, tels que OO jDREW et FLORID et être échangés entre des services Web. Ainsi, Rex ViPER contribue à l'automatisation de la construction d'un Web sémantique exploitable par machine. |
---|