Étape 2: Transformer les données
a. données zone de transit – nous avons utilisé les tables relationnelles pour notre zone de transit. Les données extraites sont achetées dans les tables. Ici les diverses transformations sont appliquées sur les données.
b. fractionnement – champs comme le nom et l’adresse sont respectivement de combinaison de firstname, lastname et ville, État, code PIN. Nous effectuons le fractionnement de ces champs en créant plusieurs colonnes dans les tables relationnelles.
c. fusion – nous pouvons fusionner les informations détaillées comme id de cours, le nom du cours, description des cours de différents fichiers en une seule entité.
d. déduplication – nous pouvons appliquer cette transformation sur la colonne de nom comme nom de l’étudiant ou faculté. Par ex. résoudre tous les noms abrégés de noms complets et la suppression des copies multiples.
e. Conversion de date/heure – nous pouvons normaliser toutes les dates dans les données source au format « JJ/MM/YYYY ».