BlaBlaCar : Adopter une approche "Staff" dans la Data
#103 - Le zoom, le podcast avec Thomas, sa ressource préférée et l'épisode sur le passage vers l’Analytics Engineering de Lara
Hello,
Bienvenue dans l'édition #103 de la newsletter DataGen ! 👋
L'agenda de la semaine
🔍 Zoom sur le rôle de Staff dans la Data chez BlaBlaCar
🎙 Le podcast avec Thomas, Staff ML Engineer chez BlaBlaCar
📚 La ressource recommandée par Thomas
🎙 L’épisode Analytics Engineering avec Lara
C’est parti !
📢 Vous connaissez dbt ?
Probablement si vous écoutez le podcast, c’est l’outil qui a été le plus cité.
On en a parlé avec BlaBlaCar, Doctolib mais aussi des plus grosses boîtes comme Decathlon.
dbt accélère les initiatives data en permettant aux profils data de créer et partager facilement toutes les données de l’entreprise.
J’ai reçu sur le podcast Jeremy qui est Principal Product Manager chez eux.
On a parlé de la genèse de dbt, de ce qui fait son succès et des tendances clé du marché.
C’est l’épisode 179. Je vous le recommande si vous souhaitez mieux comprendre dbt.
Un immense merci à dbt Labs de sponsoriser DataGen. ❤️
🔍 Zoom sur le rôle de Staff Machine Learning Engineer chez BlaBlaCar - 3 min
Ce zoom est tiré de mon échange avec Thomas, Staff Machine Learning Engineer chez Blablacar, la licorne française de covoiturage qui permet à des millions de personnes de voyager ensemble à travers l'Europe.
Le rôle d'un Staff chez BlaBlaCar
Le rôle de Staff existait déjà dans les équipes Engineering mais pas encore dans l'équipe Data. Face à l'hétérogénéité des profils (Data Analysts, Data Scientists, Data Engineers) et la complexité de coordonner les roadmaps des squads, BlaBlaCar a identifié le besoin de créer un rôle de Staff pour porter une vision technique transverse.
"Le Staff a 2 rôles : un tourné vers l'intérieur de l'équipe Data et un vers l'extérieur. À l'intérieur, il aligne les squads et les différents profils (Data Analysts, Data Scientists, Data Engineers). À l'extérieur, il sert d'interface avec les autres VPs et grandes équipes d'ingénierie."
Où il se positionne dans l’organigramme
Le Staff peut être rattaché hiérarchiquement à l’Engineering Manager d’une squad ou directement au VP Data. Chez BlaBlaCar, ils ont fait le choix de rattacher le Staff à une squad car il reste contributeur individuel au sein de cette squad en parallèle de ses responsabilités de Staff.
“Je fais à la fois partie d'une équipe qui livre de la valeur et en même temps j’ai des entretiens hebdomadaires avec le VP et je participe à la définition de la vision avec lui."
La différence avec un profil data Senior
Contrairement à un Senior qui fait partie d’une squad et qui optimise pour le delivery de son équipe, le Staff porte la voix de toute l’équipe Data.
Par exemple, dans les réunions où des décisions sont prises, le Staff porte la voix des personnes absentes.
"Dans une réunion où il y a un Software Engineer et un Data Scientist, je vais représenter le Chapter Data Analyst."
Le challenge de la sur-sollicitation
La position de Staff implique une forte visibilité qui génère beaucoup de sollicitations. La clé est d'identifier rapidement les projets à fort impact et ceux qui peuvent se passer sans intervention du Staff.
C’est d’autant plus compliqué lorsque le Staff, comme Thomas, est également contributeur individuel au sein d’une squad.
“Je vais avoir à la fois des discussions très haut niveau, comme par exemple le choix du Cloud Provider pour les cinq prochaines années. Et en même temps, je vais gérer la mise à jour d'une faille de sécurité sur une application Java. C'est le grand écart !"
🎙 Le podcast avec Thomas, Staff Machine Learning Engineer chez Blablacar
On aborde :
Son parcours jusqu'au rôle de Staff chez BlaBlaCar
La mise en place du rôle de Staff dans l'équipe Data (cf. zoom)
Où il se positionne dans l’organigramme (cf. zoom)
La différence avec un profil data Senior (cf. zoom)
L'approche Log & Learn pour le ML en production
Un projet sur lequel Thomas a travaillé : MLOps sur la fraude
Un 2nd projet sur lequel il a travaillé : les Soft. Eng. récupèrent un périmètre Data Analyse
Le challenge de la sur-sollicitation (cf. zoom)
Le challenge pour BlaBlaCar : bien expliquer le rôle de Staff
Les prochaines étapes pour l'approche Staff chez BlaBlaCar
“Le premier projet sur lequel j’ai travaillé était un projet MLOps sur la fraude. Historiquement, les Data Scientists devaient créer leur pipeline pour créer les datasets, on est passé à un système beaucoup plus GitHub avec une CI/CD."
Liens vers l’épisode : Apple Podcasts | YouTube | Spotify | Deezer
📚 Les ressources recommandées par Thomas
Le livre "Staff Engineering Path" de Tanya Reilly
"C'est un très bon résumé d'entretiens avec des Staff Engineers, principalement aux États-Unis. C’est un livre qui donne aussi énormément de ressources et de blogs, ça permet de se faire un catalogue de veille et de comprendre exactement les attentes qu'on peut avoir pour ce rôle."
Le Machine Learning Rules Book de Google
“Le log and learn, c'est quelque chose qui vient de chez Google à l'origine. Je vous conseille le Machine Learning Rule Book de chez Google qui est vraiment excellent ! Une des première règles, c’est : mettre en production une règle basique, s'assurer qu'on sait la monitorer. Et ensuite on fait des incréments vers un modèle plus complexe.”
🎙 Ex-Data Analyst, elle est devenue Analytics Engineer
Lara Guiral est Analytics Engineer. Dans cet épisode dédié à l’Analytics Engineering, elle nous parle de sa transition de Data Analyst à Analytics Engineer et des avantages que ses nouvelles compétences lui apportent.
On aborde :
Son parcours : de Data Analyst à Analytics Engineer
Pourquoi et comment elle s’est formée à l’Analytics Engineering ?
Son retour d’expérience sur le bootcamp DataBird
Les ressources et conseils qui l’ont le plus aidée
“C’était l’opportunité de me spécialiser et de me démarquer sur le marché. Le contenu de la formation était complet : de la maîtrise du SQL avancé jusqu'à la modélisation avec dbt. Elle a clairement donné un coup de boost à ma carrière.”
Liens vers l’épisode : Apple Podcasts | YouTube | Spotify | Deezer