Leboncoin : 8 initiatives pour passer d'une équipe Data Science à ML Engineering
#95 - Le zoom, le podcast avec Elisa et sa ressource préférée
Hello,
Bienvenue dans l’édition #95 de la newsletter DataGen ! 👋
L'agenda de la semaine :
🔍 Zoom sur 8 initiatives pour passer d’une équipe Data Science à ML Engineering
🎙 Le podcast avec Elisa, AI &ML Engineering Manager chez Leboncoin
📚 Les ressources recommandées par Elisa
📆 Dernier appel pour la prochaine session du bootcamp Analytics Engineering
C’est parti !
📢 Vous souhaitez mettre en place Databricks ?
J’ai reçu Frédéric sur le podcast, un expert qui a d’ailleurs monté Datatorii, un cabinet de conseil spécialisé sur la solution.
Il est venu nous faire une masterclass dans l’épisode 167.
• Dans quel contexte on met en place Databricks ?
• A quoi ressemble une stack avec Databricks ?
• Quels sont les avantages et les inconvénients de la solution ?
Tout y passe.
N’hésitez-pas à contacter Frédéric pour vous faire accompagner sur des projets Databricks : fforest@datatorii.com
Un immense merci à Datatorii de sponsoriser DataGen. ❤️
🔍 Zoom sur 8 initiatives pour passer d’une équipe Data Science à ML Engineering - 3 min
Ce zoom est tiré de mon échange avec Elisa, AI & ML Engineering Manager chez Leboncoin, la place de marché en ligne que tout le monde connaît qui permet de trouver un meuble, un appart, une voiture… Ils sont 1500 collaborateurs dont 700 à la Tech.
“Dans mon équipe, il y a 9 Machine Learning Engineers. Je suis en binôme avec une Product Owner. Et pour se rendre compte de l’échelle, il y a environ 60 équipes Tech comme celle-ci chez Leboncoin.”
Les 3 éléments de contexte principaux
1) Chez Leboncoin, les sujets sont variés et donc les membres de l’équipe ont besoin d’une large palette de compétences
“Tu vas faire de la classification, du NLP et du time series sur des sujets de fraude, de Service Client ou d’estimation immobilière. Et la manière de servir les résultats va également varier du batch au temps réel avec des problématiques engineering complètement différentes.”
2) La partie Engineering prend de plus en plus de place
“Par exemple, sur la Generative AI, on fait un Chatbot interne. On va devoir appeler une API, faire du RAG, réfléchir à la meilleure vector database, servir le Chatbot via une application, la maintenir, la déployer. C'est très technique.”
3) Il y avait des disparités de compétences au sein de l’équipe
“Sur la partie Engineering, certaines personnes venaient du développement logiciel, étaient bien capées sur cette partie-là et d'autres venaient plus de la recherche, donc avaient une très bonne compétence sur la partie maths mais avaient peut-être plus l'habitude de coder sur des notebooks.”
Les initiatives lancées au sein de l’équipe
L’objectif était d’harmoniser les compétences de l’équipe et aussi de les renforcer sur la partie Engineering qui est de plus en plus importante.
1) Identifier les compétences dont on a besoin sur nos projets en cours et futurs
“C’est comme ça qu’on va identifier le spectre de compétences dont on a besoin. Par ailleurs, en montrant à l’équipe les compétences dont on a besoin sur les différents projets, ça permet de les engager pour qu’ils se forment et soient partie prenante de l’initiative.”
2) Créer une matrice de compétence
“On l’a créée avec l’équipe. Il y a autant de colonnes que de compétences nécessaires pour les projets. C’est super utile, cette matrice nous permet d’orienter nos efforts de montée en compétence et nos recrutements.”
3) Identifier les différentiels de compétence
“On va positionner chaque membre de l’équipe sur les différents niveaux de maîtrise sur chaque compétence : je n’y connais rien, j’y arrive si on m’aide, je peux le faire en autonomie, je suis expert.”
4) Mettre en place des formations
“On a utilisé un mix de formations externes avec notamment Coursera et des formations faites maison. Par exemple, on a des experts chez nous qui ont délivré des formations du type : comment utiliser la GenAI sur notre propre stack en local.”
5) Mettre en place du mentoring
“On a un système de guilde avec une communauté qui va rassembler tous les Data Scientists. Avec le Lead de cette guilde, on a travaillé sur un programme de mentoring qui a pour objectif d’accompagner l’équipe dans sa montée en compétence, notamment sur les sujets Engineering.”
6) Mettre en place du peer coding
“Ça permet d'unifier les pratiques, c’est intéressant pour des profils juniors ou qui manquent de confiance en eux. Au début, ça peut être le profil senior qui prend le lead. Ensuite, le profil plus junior peut prendre le clavier et produire en suivant les conseils du profil senior.”
7) Mettre en place des MOB
“C'est un peu comme du peer coding, mais en groupe. On en fait au moins 1 par mois. Par exemple, on en a fait un récemment sur le monitoring de nos API avec Datadog.”
8) Créer un rôle tournant de “watcher”
“Le concept est simple. Au lieu d'avoir chaque owner de projet qui gère sa prod, il y a une personne qui est responsable de la prod et ça tourne chaque semaine. Ça permet à tout le monde de monter en compétence sur les sujets Engineering car ils vont devoir apprendre à déboguer des projets.”
🎙 Le podcast avec Elisa, AI & ML Engineering Manager chez Leboncoin
On aborde :
Le parcours d’Elisa de Deezer à Leboncoin
Le contexte qui les a poussés à adopter une approche ML Engineering (cf. zoom)
Les 8 initiatives qu’ils ont mis en place pour y arriver (cf.zoom)
Un zoom sur leur grille de compétences et sa construction
La plus grosse difficulté qu’elle a rencontrée : la conduite du changement
Les prochaines étapes : continuer l’itération, étudier le ROI des projets, le testing
“Par exemple sur le sujet du ROI, on estime sur nos projets GenAI les gains de productivité avec ma Product Owner.”
Liens vers l’épisode : Apple Podcasts | YouTube | Spotify | Deezer
📚 Les ressources recommandées par Elisa
Le podcast DataGen
“Par exemple, je me posais pas mal de questions sur notre tooling GenAI. Je suis allée écouter des épisodes de ton podcast et ensuite, j’ai contacté les invités sur LinkedIn pour échanger. C’était hyper intéressant.”
📆 Dernier appel pour la prochaine session du bootcamp Analytics Engineering
La prochaine session démarre le 10 décembre.
Si vous êtes intéressés, vous pouvez télécharger le programme détaillé ci-dessous.
Et pour candidater, c’est par ici.
Pour rappel, le bootcamp est à temps partiel pendant 6 semaines (10h / semaine), peut être suivi en parallèle de son job et est finançable via CPF.
Si vous souhaitez mieux comprendre le rôle d’Analytics Engineer, vous pouvez écouter l’épisode qu’on a enregistré avec Caroline, une ex-Data Analyst devenue Analytics Engineer en freelance.
Elle nous raconte :
Ses débuts en tant que Data Analyst chez Deliveroo et Stuart
Pourquoi elle a souhaité devenir Analytics Engineer : plus de technique, plus facile de trouver une mission en freelance…
Ses missions en tant qu’Analytics Engineer chez Ledger, Montblanc et Pass Culture
Comment elle s’est formée à ce nouveau métier.
Liens vers l’épisode : Apple Podcasts | YouTube | Spotify | Deezer