Téléchargement | - Voir le manuscrit accepté : A probabilistic model for data cube compression and query approximation (PDF, 349 Kio)
|
---|
Auteur | Rechercher : Missaoui, Rokia; Rechercher : Goutte, Cyril1; Rechercher : Choupo, Anicet Kouomou; Rechercher : Boujenoui, Ameur |
---|
Affiliation | - Conseil national de recherches du Canada. Institut de technologie de l'information du CNRC
|
---|
Format | Texte, Article |
---|
Conférence | The ACM Tenth International Workshop on Data Warehousing and OLAP, November 9, 2007, Lisbon, Portugal |
---|
Résumé | Les bases de données et entrepôts de données contiennent un volume d'information important dans lequel des utilisateurs doivent naviguer afin d'extraire l'information intéressante susceptible d'appuyer le processus de prise de décision. Cette contribution concerne le problème de l'analyse automatique de tableaux multidimensionnels de grande taille afin d'obtenir une représentation concise des données, d'identifier des associations et produire des réponses approximatives à des requêtes.Comme les cubes de données ne sont rien d'autre que des tableaux multidimensionnels, nous nous proposons d'analyser le potentiel d'une technique de modélisation probabiliste appelée la factorisation non-négative de tableaux multidimensionnels afin d'approximer les valeurs agrégées et multidimensionnelles. Grâce à cette technique, nous calculons l'ensemble des composantes (ou groupes) qui s'ajustent le mieux aux données initiales, et dont la superposition approxime le cube de données. Les composantes obtenues peuvent alors être exploitées afin de produire des réponses approchées aux requêtes OLAP telles que les "roll-up", "slice" et "dice". La technique de modélisation proposée sera alors comparée à la technique de modélisation log-linéaire, qui a déjà été utilisée dans la littérature aux fins de compression et détection des données aberrantes dans les cubes de données. Enfin, trois jeux de données sont utilisés pour illustrer et discuter les bénéfices potentiels de la factorisation non-négative de tableaux multidimensionnels. |
---|
Date de publication | 2007 |
---|
Dans | |
---|
Langue | anglais |
---|
Numéro du CNRC | NRCC 49870 |
---|
Numéro NPARC | 5763914 |
---|
Exporter la notice | Exporter en format RIS |
---|
Signaler une correction | Signaler une correction (s'ouvre dans un nouvel onglet) |
---|
Identificateur de l’enregistrement | aede0cb1-b744-4692-a39b-af0315612a67 |
---|
Enregistrement créé | 2009-03-29 |
---|
Enregistrement modifié | 2020-08-12 |
---|