Gérer des alertes @OVH-Scale avec Apache Flink (Pierre Zemb)
OVH s'appuie largement sur des métriques pour surveiller efficacement l'ensemble de son infrastructure. Offrant une vision à la fois low-level et business, celles-ci permettent aux équipes de mieux opérer le fonctionnement quotidien de nos services. Après avoir réussi à gérer plus de 300 To de télémétrie, nous avons commencé à travailler sur une solution d'alerting au-dessus de cet immense datalake. Pour cela, nous avons décidé d'utiliser Apache Flink pour gérer toutes ces alertes à grande échelle. Aujourd'hui, ce projet gère notamment l'alerting de produits OVH phares comme Public Cloud Instances ou encore Kubernetes. Cette conférence est un retour d'expérience qui présentera: Qu'est-ce que Apache Flink? Comment développer un job Flink en partant de 0 Déploiement et exploitation d'un cluster Flink