Un data warehouse est une construction architecturale d’un système informatique qui offre aux utilisateurs des informations de support de décision actuelle et historique qui est difficile d’accès ou présents dans les systèmes traditionnels de l’exploitation.
Entreprises au cours des années sont sont réunis à très grands volumes de données. Entrepôt de données met ces données à utiliser, par l’analyse des tendances de ces données, qui peut être utilisé pour fournir un avantage concurrentiel.
Système ETL est le fondement de tout système de DW
Un système ETL extrait des données de systèmes source, assure la cohérence et la qualité des données, respecte les données afin que séparer source systèmes puissent être utilisés ensemble, envoie les données dans un format prêt de présentation qui peut être utilisé par les utilisateurs finaux
Il consomme près de 70-80 % des ressources nécessaires pour la mise en œuvre et maintenance d’un DW
Système de mission de l’ETL : obtenir des données sur les systèmes source et chargez-le dans le DW
Extrait : Extrait les données pertinentes
Transformation : Format de données de Transform à DW, clés de la construction, nettoyage des données
Charge : Charger des données dans DW, construire les agrégats, etc..
DESCRIPTION :
Une java a basé l’outil ETL pour l’extraction des données provenant de diverses sources (XML, feuilles de calcul, fichiers plats, SGBDR), appliquer plusieurs transformations (comme les valeurs manquantes déduplication, normalisation des dates, majuscules, minuscules) sur les données de la source et un chargement de données structurées dans le schéma en étoile est fait.
Exemple : pour un système d’inscription universitaire, le fichier source peut contenir des informations détaillées sur les étudiants, cours, professeurs, campus, année académique et semestre.