Go to content

[DEVFEST Lille 2022] - Au secours ! Ma data est à la bourre !

Il était une fois, au pays de la data, une magnifique pipeline de données, si belle et si en retard, que bientôt tout le pays la renia. Toutes les histoires n’ont pas une belle fin, mais on peut encore arranger ça ! Cette jolie pipeline aurait eu une destinée bien plus joyeuse avec Airflow ! Airflow est un orchestrateur de pipeline essentiellement utilisé pour la data. Open source et disponible en version managé chez différents cloud providers, Airflow est utilisé en production aussi bien dans des PME que de grandes enseignes. Dans cette présentation, je présenterai Airflow, qu’est-il ? Que nous cache t-il ? Anatomie de l’orchestrateur de données 2.0 Airflow s’intègre parfaitement à l’environnement data, nous verrons également comment il peut s’articuler grâce aux opérateurs mutli-cloud. Enfin, mon retour d’expérience sur l’outil et les bonnes pratiques à mettre en place.

June 10, 2022