Quand les choses tournent mal - Benoît Lafontaine
La première mission de l'équipe technique Doctolib est de maintenir son service (une seule application Rails) opérationnel afin servir des millions de patients et plus de 100 000 praticiens. Au fil des ans, les incidents Doctolib ont vu grandir leur impact utilisateur: Au début, ils n'étaient qu'un inconvénient pour les praticiens incapables d'accéder à leur calendrier. Avec l'arrivée des hôpitaux, ces incidents peuvent avoir un impact sur tout un service hospitalier. Aujourd'hui, avec la télé-consultation, le service de santé lui-même ne peut pas être fourni. La gestion des incidents de production est donc essentielle. Illustré par plusieurs véritables problèmes de production, nous verrons: Que se passe-t-il lors d'une crise? (indice, les développeurs sont de la partie) Que se passe-t-il après la crise avec notre processus post-mortem afin d'éviter de reproduire le même problème? L'automatisation des actions via une application dédiée afin d'être efficaces pour trouver, atténuer et résoudre les problèmes. Comment embarquer de nouveaux membres dans ce processus, dès les entretiens de recrutement et par des simulations en production. Présentation par Benoît Lafontaine