Ex-Head of Data chez Lydia, elle monte un nouveau département data chez May
#69 - Le zoom, le podcast, une ressource et une histoire de reconversion avec Vincent
Hello,
Bienvenue dans l’édition #69 de la newsletter DataGen ! 👋
L'agenda de la semaine :
🔍 Zoom sur sa stratégie data : 2 initiatives, la stack et son 1er recrutement
🎙 Le podcast avec Christelle, ex-Head of Data chez Lydia, CDO chez May
📚 La ressource mentionnée par Christelle dans l’épisode
🎙 Une histoire de reconversion avec Vincent
C’est parti !
📢 Cette édition est rendue possible par Eulidia, le cabinet de conseil spécialisé sur la data et l’IA
J’ai rencontré Benjamin, leur Chief Data Science Officer, il est également Docteur en IA et expert IA et IA Génératives.
Je lui ai demandé de nous faire une masterclass IA Génératives sur le podcast.
C’est l’épisode 117, je vous le recommande.
Si vous souhaitez vous faire accompagner par les experts d’Eulidia, contactez-les et dites-leur que vous venez de ma part, ils s’occuperont bien de vous !
-Benjamin : bcohen@eulidia.com
-Elisa : echarbonnier@eulidia.com
🔍 Zoom sur sa stratégie data : 2 initiatives, la stack et son 1er recrutement - 3 min
Ce zoom est tiré de mon échange avec Christelle, ex-Head of Data chez Lydia et désormais Chief Data Officer chez May, la startup qui a développé une application d’avantages salariés (3 millions d’euros levés en 2022).
Cette édition est la 1ère d’une nouvelle série dont l’objectif est d’inviter des Head of Data qui ont déjà monté ou structuré une équipe data et qui recommencent dans une plus petite structure.
Christelle m’a raconté le lancement du département Data chez May après avoir dirigé une équipe de 14 personnes chez Lydia.
Les 2 chantiers qu’elle décide de lancer très tôt
Lorsque Christelle arrive chez Lydia, le produit existe déjà et ne prend pas toujours en compte les besoins data, ce qui a amené de nombreux problèmes par la suite (ex : modèles de données compliqués). Cette fois-ci, chez May, elle peut intervenir très tôt pour les éviter.
1) Mettre en place des Data Contracts
Un problème récurrent des équipes Data est la qualité du modèle de données. Souvent, il n’est pas adapté, il est complexe à comprendre, il correspond à des logiques métiers qui n’existent plus…
C’est en partie ce que vient résoudre l’approche Data Contracts : s’aligner avec l’équipe Tech pour produire de la bonne donnée (ex : la donnée arrive dans le Data Warehouse toujours au bon format et en respectant un certain nombre de règles).
“Si les boîtes s’y mettent dès le début, ça leur fait économiser beaucoup d'argent. On a passé tellement de temps chez Lydia à cleaner, à comprendre comment le modèle marche, à mettre des rustines…”
2) Mettre en place les bonnes pratiques RGPD
Chez Lydia, les bonnes pratiques RGPD n’ont pas pu être mises en place au début car la boîte a été créée avant l’apparition de la réglementation. Or ces bonnes pratiques sont complexes à mettre en place après coup (ex : restreindre les accès, avoir les bons mécanismes d'archives).
Donc Christelle a décidé de le faire le plus tôt possible.
“Par exemple, il y a des cas où un utilisateur a supprimé son compte mais tu dois garder ces données pour des raisons réglementaires. Tu dois avoir un niveau de sécurité supplémentaire pour accéder à cette donnée. Quand la donnée est toute créée et que tu as des milliards de lignes partout, c'est un enfer.”
La stack data qu’elle a mise en place
Lorsque Christelle monte le département Data chez Lydia il y a quelques années, il n’y a pas autant d’outils disponibles et donc ils décident souvent de construire les outils en interne.
Cette fois, chez May, elle adopte une stratégie différente.
“J'ai un peu changé de mindset. J'étais très Build quand on était chez Lydia et là je dirais qu'on est un peu plus Buy.”
- Ingestion : Airbyte
- Cloud : AWS (Amazon) et GCP (Google)
- Transformation : dbt
- Orchestration : Dagster
- Business Intelligence : Metabase
“On est parti sur des outils légers comme Dagter ou Metabase qui conviennent bien à une petite équipe et à nos besoins à court-terme (uniquement quelques 10aines d’utilisateurs des dashboards).”
Le premier profil qu’elle recrute
Christelle décide de recruter un Data Engineer.
“J'ai considéré que le plus important était de prendre un Data Engineer au début pour avoir une stack propre et qu’on puisse ensuite scaler sans avoir besoin de dix personnes dans l'équipe.”
Le Data Engineer a un profil fullstack.
“Je cherchais quelqu’un d’un peu fullstack dans l'ingénierie qui pourrait faire aussi du ML Engineering et la partie DevOps de la Data.”
🎙 Le podcast avec Christelle, ex-Head of Data chez Lydia, CDO chez May
On aborde également :
Son choix de rejoindre une startup après son expérience chez Lydia
Le contexte data chez May et ses premières initiatives
Ses réflexions sur le dilemme Build vs Buy
Sa vision sur la GenAI et comment elle est utilisée chez May.
“Il y a 2 mondes qui s'affrontent sur le sujet GenAI entre l’Open Source et le Propriétaire. Je trouve ça marrant et j’ai hâte de voir la suite.”
Liens vers l’épisode : Apple Podcasts | YouTube | Spotify | Deezer
📚 La ressource mentionnée par Christelle
Le LinkedIn de Chad Sanderson, CEO de Gable.ai
“Les Data Contracts, au fond c’est un grand mot pour dire qu’on fait attention à ce qu'on fait en termes d’ingestion et de modélisation. Mais ça fait gagner beaucoup de temps par la suite de le mettre en place très tôt. Chad Sanderson en parle souvent.”
🎙 Une histoire de reconversion avec Vincent
Vincent était Directeur de Magasin et s’est reconverti vers un rôle de Consultant Data Analyst chez Elevate, le cabinet de conseil spécialisé en data.
On aborde :
Son parcours et ce qui l’a poussé à se reconvertir dans la data,
Pourquoi il a choisi DataBird et le déroulement de la formation,
Les compétences qu’il utilise le plus au quotidien,
Ses principaux chantiers actuels et ses conseils pour se reconvertir.
“J’ai commencé à travaillé à 21 ans dans une boutique de prêt-à-porter en tant que vendeur. Je suis devenu Directeur des Opérations au bout 8 ans. J’ai commencé à faire du Excel et des analyses pour les commerciaux, ça m’a beaucoup plu. C'était un peu mon 1er pas dans la data.”
Liens vers l’épisode : Apple Podcasts | YouTube | Spotify | Deezer