La Lead Data Scientist de Pernod Ricard partage sa stratégie (orga, stack, projets)
#119 - Le zoom, le podcast avec Solène et sa ressource préférée
Hello,
Bienvenue dans l'édition #119 de la newsletter DataGen ! 👋
L'agenda de la semaine :
🔍 Zoom sur la stratégie Data Science de Pernod Ricard
🎙 Le podcast avec Solène, Lead Data Scientist chez Pernod Ricard
📚 Les ressources recommandées par Solène
C’est parti !
🔍 Zoom sur la stratégie Data Science de Pernod Ricard - 4 min
Ce zoom est tiré de mon échange avec Solène Bergaire, Lead Data Scientist chez Pernod Ricard. Elle est arrivée Data Scientist il y a 4 ans. Aujourd’hui, elle lead les équipes sur 2 projets : l’optimisation des promotions et du pricing.
La genèse de l’équipe Data Science
Tout a commencé il y a 4 ans avec un cabinet de conseil externe et un Data Scientist interne pour lancer les premiers projets. En 2021, Pernod a recruté 8 personnes, dont Solène, pour reprendre le périmètre du cabinet et déployer les projets dans les différents pays.
"Au début, on était une équipe de 5 Data Scientists, 2 ML Engineers et 1 Data Analyst. Aujourd'hui, on a toujours 5 Data Scientists mais on a plus que doublé les ML Engineers et les Data Analysts. "
L'organisation actuelle de l'équipe de Solène
Ils sont une dizaine dans son équipe, articulée autour de quatre profils :
Les Data Scientists : Interface avec le Business et développement des modèles
"Ils comprennent les spécificités des pays et adaptent les outils et les modèles pour réussir leur déploiement. Ils travaillent aussi sur des projets transverses aux différents marchés (ex : monitoring, visualisation)."
Les Data Analysts : Point de contact principal avec les pays
"Ils font le relais entre le Business et les Data Scientists. Une fois les modèles déployés, ils assurent le monitoring et réalisent des mises à jour. Ils délivrent également des analyses ad-hoc si besoin."
Les ML Engineers : Industrialisation et infrastructure
"Leur but est de décharger le plus possible les Data Scientists de tout ce qui est dev et software engineering. Ils collaborent notamment avec les Data Scientists sur les outils transverses. On fait beaucoup de pair-programming entre MLE et Data Scientists.”
Research Scientist : Recherche & Développement
“Il intervient en général sur des sujets transverses et exploratoires qui vont bénéficier à l’ensemble des pays (ex : identifier un nouveau modèle avancé, améliorer un modèle existant).”
La stack Data Science chez Pernod Ricard
Librairies Scikit-learn, Pandas, NumPy et Pytorch
“On utilise surtout les librairies classiques. Néanmoins, pour notre module de pricing, on utilise un modèle avancé qui est peu commun qu’on a développé sur PyTorch.”
Stockage des artifacts de modèles : Azure ML
“Sur Azure, on va vraiment stocker toute la partie output de nos modèles.”
Base de données : Snowflake
“Tout ce qui va être stockage des données, ça va être sur Snowflake.”
Partage des résultats : Streamlit ou PowerBI
Transformations de données : dbt
“C’est assez récent.”
Les deux plus gros challenges rencontrés
Technique : Notamment sur le module de pricing
"On a décidé de partir sur une modélisation peu courante. Peu de Data Scientists ont ces compétences sur le marché. Il a fallu former les équipes, ce n’était pas facile.”
Humain : Gérer la croissance rapide de l’équipe
"Quand on fait venir plein de bons profils d'un coup, il faut les former, les onboarder et s’assurer que tout le monde trouve sa place. L’objectif, c’est de les retenir. Et c’est compliqué quand on grossit aussi vite, il faut savoir ralentir un peu et y aller étape par étape.”
🎙 Le podcast avec Solène, Lead Data Scientist chez Pernod Ricard
On aborde :
Son parcours pour devenir Lead Data Scientist
Le lancement de l’équipe Data Science (cf. zoom)
L'organisation de l'équipe Data Science (cf. zoom)
Est-ce que les Data Scientists deviennent ML Engineers ?
La stack Data Science (cf. zoom)
Deux projets : optimisation des promotions et du pricing
Les deux plus gros challenges rencontrés (cf. zoom)
L’évolution de la relation avec les utilisateurs métier
Les profils Data Scientists qu’ils recherchent
Les prochaines étapes : un projet sur l’agriculture régénérative
"On a fait le choix de ne pas avoir des équipes Data Science spécialisées. Les profils sont polyvalents. Ils peuvent travailler sur des projets techniquement avancés mais aussi sur des projets moins techniques ou ce sera la compréhension business qui fera la différence.”
Liens vers l'épisode : Apple Podcasts | YouTube | Spotify | Deezer
📚 Les ressources recommandées par Solène
"Par exemple, quand je suis arrivée chez Pernod Ricard, j'ai fait un Coursera sur l’optimisation parce que c'était un sujet que j'avais à peine effleuré à l'école."
🤝 DataGen, c’est aussi un collectif de freelances data issus des plus belles boîtes
Grâce à DataGen, on a réuni une team de 50 freelances data, que des top profils expérimentés et issus des plus belles boîtes (Google, Criteo, Decathlon, Artefact...).
Travailler avec nous : ici