Apache Zeppelin, un notebook d'avenir pour l'éco-système Big Data (DuyHai DOAN)
Spark et Cassandra sont des projets très populaires, mais avez vous entendu parler d'Apache Zeppelin ? Zeppelin propose un système de notebook pour pouvoir manipuler les données de manière interactive. Zeppelin repose sur un système de plugins qui permet de traiter des tâches Spark, des requêtes Spark SQL mais aussi des requêtes CQL de Cassandra. Je montrerai comment construire un pipeline de transformation BigData en mélangeant du Spark, du Cassandra, du Shell, du Markdown, du ce-que-vous-voulez etc. Votre framework préféré n'a pas encore de plugin pour Zeppelin ? Ecrivez-en un et partager le avec la communauté!
April 20, 2016