Nicolas et Maxime de Critéo partagent avec Emmanuel leur expérience de mise en place d’une organisation SRE (Site Reliability Engineering).
Enregistré le 12 novembre 2020
Téléchargement de l’épisode LesCastCodeurs-Episode–243.mp3
Interview Ta vie, ton oeuvreTwotter Nicolas Twitter Maxime Criteo Labs
SRE en 2 phrasesSite Reliability Engineering C’est une façon de monter un salaire de sysadmin ?
PourquoiOps et dev, pourquoi “merger” ? DevOps avec un sysadmin dans l’équipe vs SRE Cela a du sens de le faire sur un “petit projet” ou uniquement si on gère 300k machines ?
SRE au quotidienJournée type
Dashboard
On code en quoi?
Pager (pendant les horaires travails vs dehors) Les weekends
Taille SRE pour pour du 24/7
Combien de fois est-on appelé par nuit ? Prod fallback
Le development
Concepts intéressants50% eng
SLO SLI SLA La difficulté de la valeur initiale Perf passées vs calcul théorique
Error budget Blast radius Burn rate
Pré conclusionC’est la fin de la partie 1 de cette interview
Nous contacterFaire un crowdcast ou une crowdquestion Contactez-nous via twitter https://twitter.com/lescastcodeurs sur le groupe Google https://groups.google.com/group/lescastcodeurs ou sur le site web https://lescastcodeurs.com/ Flattr-ez nous (dons) sur https://lescastcodeurs.com/ En savoir plus sur le sponsoring? sponsors@lescastcodeurs.com