Qonto : Déployer des projets Data Science appliqués à la décision
#100 - Le zoom, le podcast avec Nicolas, sa ressource préférée et une masterclass sur Databricks
Hello,
Bienvenue dans l’édition #100 de la newsletter DataGen ! 👋
L'agenda de la semaine :
🔍 Zoom sur quelques projets Data Science appliqués à la décision
🎙 Le podcast avec Nicolas, Senior Data Scientist chez Qonto
📚 La ressource recommandée par Nicolas
🎙 La masterclass pour tout comprendre sur Databricks
C’est parti !
📢 Vous connaissez CastorDoc ?
C’est le Data Catalog utilisé par plein de belles boîtes telles que ManoMano, Veolia ou Deliveroo.
J’ai reçu leur CEO Tristan, pour parler de la solution et de comment l’IA vient impacter le marché du Data Catalog.
Par exemple, ils ont lancé une fonctionnalité de Self-Service Analytics. Tu peux poser une question à ta donnée dans un Chatbot et l’utiliser directement dans tes workflows via Slack ou Teams.
C’est maintenant possible grâce aux IA Génératives et avec un Data Catalog bien documenté.
C’est l’épisode 158.
Et depuis 2 ans, ils ont testé plein d’outils Self-Service Analytics et ont tout centralisé dans un benchmark.
N’hésitez pas à contacter Tristan sur LinkedIn ou par mail (tristan@castordoc.com) pour échanger sur le sujet.
Un immense merci à CastorDoc de sponsoriser DataGen. ❤️
🔍 Zoom sur quelques projets Data Science appliqués à la décision - 3 min
Ce zoom est tiré de mon échange avec Nicolas, Senior Data Scientist chez Qonto, la solution financière qui permet aux PME et aux indépendants de gérer leur quotidien financier. Qonto compte aujourd'hui 1600 collaborateurs et a dépassé le demi-million de clients depuis juin 2024. La licorne vient également de s'étendre dans 4 nouvelles géographies : l'Autriche, la Belgique, les Pays-Bas et le Portugal.
Les projets majeurs de l’équipe
1) L'optimisation du budget marketing
L'équipe de Nicolas a développé plusieurs approches pour optimiser l'allocation du budget marketing entre les différents canaux marketing (Facebook, Google, offline…).
“On a mis en place toute une expérimentation avec des géo tests. On a également créé un Marketing Mix Modeling (MMM) : un modèle Bayésien qui prend toutes les données de campagnes et nous permet d’identifier les optimisations à effectuer.”
2) Les modèles prédictifs pour l’équipe Finance
L'équipe développe des modèles pour aider l'équipe Finance à prédire l’évolution de certaines métriques (revenu, nombre de clients…).
“Sur des métriques simples, le Business Plan de l’équipe finance et les modèles Excel suffisent. Mais sur des métriques complexes, on va utiliser du Time Series Forecasting.”
3) Le support à l’équipe Stratégie
L'équipe accompagne également les décisions stratégiques comme un changement de pricing.
"On aide à la construction du business case en amont avec des modèles prédictifs (gains de clients, revenus…), puis on valide après coup si on a atteint nos objectifs et on identifie les leviers qui avaient été mal anticipés."
La méthodologie de Qonto en 5 étapes
1) Value Analysis (2-3 jours)
"On clarifie avec le stakeholder sa définition du succès et ses attentes. L'objectif est de s'assurer que le projet mènera à une action concrète."
2) Exploration (1-2 semaines)
"On fait une revue de littérature, on teste rapidement différentes approches et on explore les données disponibles."
3) Construction (quelques semaines à quelques mois)
"On développe et on optimise le modèle ou l'analyse retenue, toujours en lien avec les stakeholders business."
4) Review & Release
"On présente les conclusions au stakeholder business et aussi à une audience plus senior avec les recommandations sur les décisions à prendre."
5) Documentation & Scale
"On documente tout ce qui a été fait pour que ça puisse être réutilisé, que ce soit les données, les méthodes ou la littérature consultée."
🎙 Le podcast avec Nicolas, Senior Data Scientist chez Qonto
On aborde :
Son parcours : Polytechnique, Conseil en Stratégie (BCG), Data Science
Les projets majeurs de l’équipe (cf. zoom)
La méthodologie de Qonto en 5 étapes (cf. zoom)
Les challenges techniques : créer des modèles qui intègrent les changements liés au scale de l’entreprise
Les challenges business : s’assurer que les projets aboutissent à des décisions et aient un impact sur le Business
Les prochaines étapes : verticalisation et focus rétention
“L’explicabilité d’un modèle c’est primordial. Par exemple, on a un modèle de Churn où on identifie les clients qui veulent partir grâce à l’IA : une équipe va appeler les clients ciblés pour essayer de les retenir, s’ils ne savent pas pourquoi les clients partent, alors ça ne fonctionne pas. Donc notre modèle, on l’a pensé pour qu’il donne des pistes sur ce sujet.”
Liens vers l’épisode : Apple Podcasts | YouTube | Spotify | Deezer
📚 La ressource recommandée par Nicolas
La chaîne YouTube StatQuest
“Ce sont des vidéos sur la Data Science, mais aussi sur tout ce qui est statistique, économétrie, etc. Il y a notamment toute une playlist de Clearly Explained qui sont des petites vidéos courtes de 5, 10 ou 15 minutes sur un sujet. Par exemple pour comprendre ce que c'est une p-value, comprendre ce qu’est un random forest, etc. Tout ça avec des petits schémas et un peu d'humour british.”
🎙 La masterclass pour tout comprendre sur Databricks
Avec Frédéric Forest qui est Directeur Général et cofondateur de Datatorii, le cabinet de conseil spécialisé sur Databricks et Microsoft.
On aborde :
Les contextes dans lesquels les entreprises mettent en place Databricks
Les types de stack qu’on peut mettre en place avec Databricks
Les difficultés et les avantages de la solution (une plateforme très “tech”, un rapport performance / coût imbattable)
Une tendance clé du marché : la coopétition entre Databricks et Microsoft.
“Au départ, Databricks avait ce premier branding un peu typé ML. Mais il y a eu un pivot à un moment donné qui s'est fait vers le Data Engineering. Quand on a des vrais enjeux sur de la performance et des coûts, Databricks, c’est notre solution clé.”
Liens vers l’épisode : Apple Podcasts | YouTube | Spotify | Deezer