| Projets |
269 Visiteurs 3168 Projets
|
|
 |
 |
 |
 |
|
|
| 2004 - Note de Synthèse Stage |
Création Cube OLAP avec Analysis Manager
[20 mn de lecture - paru le 10/6/2003 - Public : Débutant]
|
   
|
Auteur
2. Création base OLAP
Nous allons avoir ici une première approche des cubes et montrer comment en construire
un de manière simple avec Analysis Manager. L'installation d'Analysis Manager se
fait en même temps que celle de SQL Server, et ne demande aucune manipulations particulières.
Il faut avoir aussi à sa disposition une base relationnelle contenant les
informations que l'on souhaite intégrer au cube.

Analysis Manager, le gestionnaire OLAP de Microsoft
Il faut d'abord créer une nouvelle base de donnée multidimensionnelle avant de
pourvoir procéder à la réalisation d'un cube.
2.1. Sources de données
La plupart des bases de données OLAP sont utilisées comme des vues de données
relationnelles. Par conséquent, toute base de données OLAP créée dans
Analysis Manager doit disposer d'une source de données qui lui fournit les
information à charger dans les dimensions et les mesures du cube.
La source de données peut être n'importe quelle base de données relationnelle
capable de donner accès à ces données via un fournisseur OLE DB (modèle
objet universel d'accès aux données).
Il faut donc ajouter une nouvelle source de donner dans la base OLAP qui vient
d'être créer et la configurer en choisissant le provider ou fournisseur OLE DB
adéquat, en spécifiant le nom du serveur et le nom de la base de données
ainsi que login et mot de passe pour pouvoir se connecter.
2.2. Dimensions
Les dimensions partagées sont des dimensions disponibles pour l'ensemble des
cubes contenus dans la base OLAP. Pour créer une nouvelle dimension il suffit
d'effectuer un clique droit sur le dossier Dimensions partagées et de
sélectionner l'option Nouvelle dimension. Un assistant apparaît, il
permet de choisir la table contenant les données qui constitueront la
dimension.
Après
avoir sélectionné la table de dimension, il faut définir les niveaux de la
dimension. Toujours à l'aide de l'assistant choisissons les colonnes de la
table qui correspondent aux niveaux souhaités. Par exemple une table de
dimension client contient plusieurs niveaux d'informations (colonnes) sur le lieux de
résidence de chaque client : Pays, Région, Département, Ville. Chaque
élément d'information représente un niveau de la dimension.
Les niveaux doivent être organisés du plus général au plus fin.
2.3. Créer le cube
Le cube est le bloc constitutif de base d'un système d'information OLAP. Il
associe les dimensions à des données quantitatives à analyser, telles que des
montants de ventes par article et par lieu géographique. Pour créer un cube
faire un clique droit sur le dossier Cube et sélectionner l'option Éditeur
de cube.

La table de faits est la table dans la base relationnelle qui contient les données
que l'on souhaite analyser. Faire un clique droit au milieu de la fenêtre et
sélectionner Ajouter une table puis choisir la table.
2.4. Définir les mesures
Les mesures représentent les colonnes de la table de faits qui contiennent les
données numériques que l'on souhaite analyser. Pour cela il suffit de
sélectionner les mesures de la table de faits et de les glisser sur le dossier Mesures.

Une fois les mesures créées, l'onglet Propriétés permet de définir le type
de calcul effectué pour la mesure. Le plus souvent on utilise la somme, mais on
peut appliquer d'autre formule prédéfinie telle que la moyenne ou bien compter le nombre d'éléments.
2.5. Ajout des dimensions
Il faut maintenant ajouter dans le cube les dimensions que l'on souhaite
utiliser. Un clique droit sur le dossier Dimensions permet de
sélectionner l'option Ajout d'une dimension existante. Une boite de
dialogue contenant l'ensemble des dimensions partagées apparaît et il suffit
de sélectionner les dimensions qui doivent figurer dans le cube.

Si les dimensions ont été construite à partir de
tables différentes de la table fait, ces tables apparaissent dans l'éditeur.
Il faut créer les liaisons avec la table de faits pour que le cube puisse
associer les dimensions aux mesures. Par exemple la table de fait des ventes
contient un numéro de client pour chaque occurrence, la table de dimensions
client contient les information client. Il faudra lier les deux tables par le
numéro de client.
Une fois l'ensemble de ces étapes terminées, le cube est construit. Dans le
menu Outils un certain nombre de fonctions peuvent servir telle que la
validation de la structure du cube ou l'optimisation des dimensions. A partir de
maintenant il ne
reste plus qu'a configurer le stockage et la création des agrégats avant de
traiter le cube pour permettre au client de se connecter et d'exploiter la base
OLAP.
2.6. Création du stockage
Il existe trois mode de stockage des agrégations:
- ROLAP (Relational OLAP) : Conserve la table de
la donnée de base sur le serveur OLTP d'origine (ou dans un entrepôt de données)
mais utilise un jeu indépendant de tables relationnelles pour stocker les références dimensionnelles et les données agrégées.
- MOLAP (Multidimensional
OLAP) : Stocke les données basiques et leurs agrégations sur un serveur spécialisé
OLAP. Les langages de requêtes MOLAP sont optimisés pour les applications d'analyse et la meilleure performance en termes de temps de réponse
pour des requêtes complexes.
- HOLAP (Hybride OLAP) : Utilise les données de
base depuis sur le serveur OLTP d'origine mais stocke les agrégations dans un
format multidimensionnel sur un serveur spécialisé. La solution HOLAP combine donc les avantages des solutions MOLAP et ROLAP, mais
aucun standard sur ce principe n'a encore fait l'objet d'un consensus.
Dans le menu Outils de l'éditeur de cude sélectionner Création du
stockage. L'assistant d'Analysis Manager permet de créer les agrégation facilement.
Pour cela il
suffit de choisir le mode de stockage, puis soit de définir une taille ou un
pourcentage ou un arrêt manuel et de lancer le calcul des agrégats.

Un
petit graphique donne une estimation de la taille des agrégats et un
pourcentage de performance (ne pas se fier à la taille donner). Généralement
on ne dépasse pas 30% (sauf pour les cubes très petits) car la place utilisée
par les agrégats et le temps de calcul sont trop important par rapport au gain
de performance. Une fois cette tache effectuée il ne reste plus qu'a lancer le
traitement complet du cube. Ce dernier devra être effectuer à chaque fois que de
nouvelles données sont ajoutées à la base relationnelle et que l'on désire qu'elles apparaissent dans le cube. Nous verront plus loin comment automatiser
cette tâche.
|
|
|
 |
 |
 |
 |
| Articles de la même catégorie |
|
|
|
 |
 |
 |
 |
| SUPINFO Training Center peut vous proposer une formation ... |
|
|
|
 |
 |
 |
 |
|