ScalaIO - Ludwine Probst - Machine Learning à la vitesse de la lumière avec Spark
Dans l’écosystème Big Data, Hadoop et MapReduce sont largement utilisés pour gérer le traitement des données à grande échelle. Cependant le modèle MapReduce montre des limites pour certains traitements, notamment des algorithmes itératifs utilisés en Machine Learning. Spark est un outil de traitement de données en mémoire offrant plus de flexibilité de programmation et de meilleures performances qu’Hadoop. Ce talk a pour but d’introduire Spark via un exemple de Machine Learning et de montrer en quoi il se différencie d’Hadoop. Nous terminerons par un tour d’horizon de l’écosystème de Spark.
October 23, 2014