[ANN] etl-goodies


#1

Hello,

pour ceux qui font de l’etl, du reporting ou de la “modélisation
dimensionnelle”, j’ai pushé sur github quelques outils dont je me sers
fréquemment:

http://github.com/thbar/etl-goodies/tree/master

Utile si vous travaillez avec activewarehouse-etl mais pas
exclusivement. Vous avez notamment:

  • deux générateurs de table de dimensions riches heure et date (avec
    des colonnes comme S1, Q3, lundi, “entre 8h30 et 9h00” etc), à
    utiliser en jointure d’une table de fait
  • un générateur de fichier en format largeur fixe
  • un outil pour extraire les noms de colonnes d’un fichier csv, ou
    l’ensemble des valeurs d’une colonne
    donnée- un helper de migration ActiveRecord pour créer des dimensions plus
    facilement à partir d’un hash
  • un processeur AW-ETL pour vérifier la présence d’un ensemble de
    champs dans une row
  • un processeur AW-ETL qui remplace les quotes CSV en " par “” (à
    utiliser quand FasterCSV bloque sur un fichier)
  • une transformée de nettoyage (variante du décode d’AW-ETL)

Voilà, ça ne servira pas à tout le monde, mais je sais que ça servira
bien à ceux à qui ça servira :slight_smile:

– Thibaut