Hello,
pour ceux qui font de l’etl, du reporting ou de la “modélisation
dimensionnelle”, j’ai pushé sur github quelques outils dont je me sers
fréquemment:
http://github.com/thbar/etl-goodies/tree/master
Utile si vous travaillez avec activewarehouse-etl mais pas
exclusivement. Vous avez notamment:
- deux générateurs de table de dimensions riches heure et date (avec
des colonnes comme S1, Q3, lundi, “entre 8h30 et 9h00” etc), à
utiliser en jointure d’une table de fait - un générateur de fichier en format largeur fixe
- un outil pour extraire les noms de colonnes d’un fichier csv, ou
l’ensemble des valeurs d’une colonne
donnée- un helper de migration ActiveRecord pour créer des dimensions plus
facilement à partir d’un hash - un processeur AW-ETL pour vérifier la présence d’un ensemble de
champs dans une row - un processeur AW-ETL qui remplace les quotes CSV en " par “” (à
utiliser quand FasterCSV bloque sur un fichier) - une transformée de nettoyage (variante du décode d’AW-ETL)
Voilà, ça ne servira pas à tout le monde, mais je sais que ça servira
bien à ceux à qui ça servira
– Thibaut