Les plus gros challenges des leaders data invités sur DataGen (Decathlon, BlaBlaCar, Doctolib...) 🏋️♀️
#121 - Les challenges data de 34 scaleups, licornes et grosses boîtes
Hello,
Bienvenue dans l’édition #121 de la newsletter DataGen ! 👋
Je t’ai préparé sur ce 2ème trimestre une petite rétrospective des challenges rencontrés par 34 boîtes que j’ai reçues sur le podcast en 2024/2025.
Elles sont réparties en 3 catégories :
Les Scaleups 🚀
Les Licornes 🦄
Les Grosses Boîtes 🔥
Si tu souhaites creuser, tu retrouveras pour chaque boîte le lien LinkedIn de l’invité(e) et le lien vers l’épisode du podcast.
En bonus, je te partage les 3 challenges qui reviennent le plus souvent à la fin.
C’est parti !
👋 DataGen, c’est aussi un collectif de freelances data issus des plus belles boîtes
Grâce au podcast, on a fédéré les meilleurs freelances data du marché. Si tu as un projet data ou IA, on a l'équipe qu'il te faut : Data Engineer, Data Analyst, Data Scientist, etc.
En savoir plus : ici
Les Scaleups 🚀
🔎 Description : Plateforme leader du freelancing en Europe, met en relation des freelances avec des entreprises.
🏋️♀️ Les challenges :
- GenAI : Mettre en place des assistants IA pour booster l'efficacité en interne.
- Stack : Mettre en place un outil no-code et une stack GenAI (Dust, Gemini, Slackbot).
🎙 Episode #159 avec Anaïs Ghelfi
🔎 Description : Plateforme qui permet aux entreprises de créer des formations internes. 240 millions de dollars levés, 400 salariés, 2 000 clients (France, Etats-Unis, Angleterre et Allemagne).
🏋️♀️ Les challenges :
- GenAI : Mettre en place un use case intégré dans le produit (génération d'un cours en ligne).
- Industrialisation : Mise en place d'un RAG, d'une brique d'observabilité avec Datadog et d'une approche LLM-as-a-Judge.
🎙 Episode #122 avec Marie Douriez
🔎 Description : Outil de gestion des réseaux sociaux. 16 millions d'euros levés en 2019. 6 personnes dans l'équipe Data.
🏋️♀️ Les challenges :
- Data Quality : Améliorer la fiabilité des données en migrant de Looker vers Metabase (nécessite moins de tables, allège la code base) et en mettant dbt en place pour centraliser les données (réduction des doublons de code et des transformations).
- Self-Service : Mise en place de dashboards Metabase permettant aux équipes métiers d'interagir en profondeur avec les données (filtres, analyses personnalisées) et d'un accompagnement ("data office hours").
- Analytics Engineering : Transition des Data Analysts vers un rôle d'Analytics Engineer avec une montée en compétence sur dbt et la transformation de données.
- Culture : Développer une mentalité plus ROIste (système de Data Request pour évaluer la pertinence des projets).
- Stack : Optimiser le coût de la Modern Data Stack (Segment, BigQuery, Airbyte, Fivetran, dbt, Airflow, Metabase).
🎙 Episode #176 avec Juliette Duizabo
🔎 Description : Plateforme d'IA conversationnelle permettant aux e-commerçants de mieux gérer leur support client et d'augmenter leurs ventes. Ils ont plus de 15 000 clients.
🏋️♀️ Les challenges :
- GenAI : Déployer le Self-Service Analytics grâce aux IA Génératives.
- Stack : Mise en place de getdot.ai pour créer un assistant IA Data Analyst avec lequel échanger via Slack et d'Omni pour les analyses récurrentes et l’exploration ("drill down").
🎙 Episode #192 avec Elliot Trabac
🔎 Description : FinTech qui propose des prêts aux PME. 25 millions d’euros levés.
🏋️♀️ Les challenges :
- Data Science : Déployer des algorithmes pour scorer la solvabilité des entreprises
- Stratégie : Structurer l'approche en 4 étapes (modèle d'expert, modèle statistique, machine learning, explicabilité).
- Organisation : Mise en place d'une culture "full stack" où les Data Scientists sont aussi des Software Engineers.
- Stack : Mettre en place Dataiku pour l'entraînement des modèles et faciliter la collaboration avec les équipes non techniques.
🎙 Episode #166 avec Dany Srage
🔎 Description : Plateforme leader en Europe pour organiser des webinars. 30 millions de dollars levés en 2020, +4 000 clients, rentables.
🏋️♀️ Les challenges :
- Stack : Mettre en place une Modern Data Stack (Segment, Stitch, Fivetran, Airbyte, Snowflake, Looker, Hightouch).
- Rationalisation : Identifier des outils qui rationalisent les coûts de la stack (Ruddertack, Omni).
🎙 Episode #134 avec Gilles Bertaux
🔎 Description : Application mobile qui facilite le shopping et permet de faire des économies dans +3 000 enseignes partenaires grâce au cashback. 3 millions d'utilisateurs, 10 millions d’euros levés en 2020, 50 collaborateurs.
🏋️♀️ Les challenges :
- Stack : Mettre en place une Modern Data Stack (Airbyte, Snowflake, dbt, Metabase, Amplitude).
- Analytics : Créer de la valeur en créant des dashboards en "mode commando" sur Metabase.
- Organisation : Se rapprocher des équipes Business pour proposer des outils data plus adaptés.
🎙Episode #132 avec Coralie Betbeder-Déchelette
🔎 Description : Marketplace qui propose des produits de qualité (made in France, naturels, faits main...).
🏋️♀️ Les challenges :
- Stack : Mettre en place une Modern Data Stack (Airbyte, GCP, dbt, Prefect, Metabase).
- Organisation : Améliorer l'organisation de l'équipe (un Data Engineer, un Data Scientist, 2 Data Analysts, 1 Product Analyst).
- Management : Responsabiliser les membres de l'équipe avec l'approche "Distributive Ownership".
🎙Episode #130 avec Marie Crappe
🔎 Description : Scaleup qui propose un service de transport de containers nouvelle génération pour les entreprises.
🏋️♀️ Les challenges :
- GenAI : déployer des cas d'usage de productivité à l'échelle.
- Organisation : déployer les projets avec des Software Engineers uniquement et non des Data Scientists.
🎙Episode #138 avec Antoine Sauvage
🔎 Description : Startup qui a développé une application d’avantages salariés (3 millions d’euros levés en 2022).
🏋️♀️ Les challenges :
- Data Contracts : S'aligner très tôt avec l'équipe Tech pour produire des bonnes données.
- RGPD : Mettre place très tôt les bonnes pratiques (ex : restreindre les accès, avoir les bons mécanismes d'archives).
- Stack : Mettre en place une Modern Data Stack (Airbyte, AWS, GCP, dbt, Dagster, Metabase).
🎙 Episode #126 avec Christelle Marfaing
🔎 Description : Scaleup pionnière de l’autoconsommation solaire qui permet aux particuliers et aux entreprises de faire des économies d'énergie. 100 millions d’euros levés en 2023.
🏋️♀️ Les challenges :
- Stack : Mettre en place une Modern Data Stack avec databricks et l'architecture médaillon.
- Organisation : Monter l'équipe Data & IA (2 Data Scientists, 2 Data Analysts et 1 Data Engineer).
- Business : Continuer de servir le Business pendant la migration.
🎙Episode #112 avec Loïc Magnien
Les Licornes 🦄
🔎 Description : Plateforme de transports partagés (voiture et bus) leader en Europe avec 20 millions d’utilisateurs en France. 50 profils Data & IA.
🏋️♀️ Les challenges :
- Management : Former ses managers au management et mieux valoriser les contributeurs individuels.
- Organisation : Réorganiser les équipes Data Engineering en Data Mesh.
- Stack : Mettre en place dbt et les bonnes pratiques de Software Engineering.
- Staff : Adopter une approche “Staff” dans l’équipe Data.
- GenAI : Déployer des use cases GenAI (ex : économie d'1 million d’euros avec un use case de modération de contenu).
🎙 Management : Episode #114 avec Emmanuel Martin-Chave
🎙 Organisation & Stack : Episode #129 avec Thibault Ambard
🎙 Staff : Episode #183 avec Thomas Pocreau
🎙 GenAI : Episode #188 avec Emmanuel Martin-Chave
🔎 Description : Plateforme de prise de rendez-vous et de téléconsultation avec des médecins. Présente en France, en Allemagne et en Italie. Utilisée par 340 000 personnels de santé, 80 millions de patients.
🏋️♀️ Les challenges :
- Stack : Mettre en place une nouvelle stratégie BI (Tableau et Metabase)
- GenAI : Déployer une stratégie GenAI (ChatGPT interne et projets core product tels que le "Medical Assistant").
- Analytics Engineering : Migrer l'équipe Data Analytics au sein de l'équipe Analytics Engineering et mettre en place dbt pour créer une modélisation orientée Self-Service.
🎙 Stack : Episode #115 avec Lucie Bailly
🎙 GenAI : Episode #127 avec Nacim Rahal
🎙 Analytics Engineering : Episode #154 avec Romain Fays
🔎 Description : Marketplace qui propose des produits reconditionnés (téléphones, ordinateurs, etc.).
🏋️♀️ Les challenges :
- Data Science : Déployer des projets coeur Business et monter une équipe de 10 personnes (1 PM, 1 Engineering Manager, 3 Data Scientists, 3 ML Engineers, 2 Backend Developers).
- Stratégie : Recentraliser l'équipe Data avec un manager et des instances communes (1 VP Data, 10 Data Engineers, 10 Analytics Engineers, 15 Data Analysts...).
- GenAI : Déployer une stratégie GenAI avec 2 cas d'usage clés (ChatGPT interne et service après-vente).
🎙 DataScience : Episode #110 avec Anne-Sophie Lavelle
🎙 Stratégie : Episode #150 avec Capucine Delecourt
🎙 GenAI : Episode #162 avec Pierre Pessarossi
🔎 Description : Leader mondial de la sécurisation des crypto-monnaies.
🏋️♀️ Les challenges :
- GenAI : Déployer des projets ChatGPT interne, GitHub Copilot, Chatbot Service Client...).
- Stack : Définir la bonne stratégie entre Buy et Build sur le sujet GenAI.
- Organisation : Faire monter toute l'équipe Data & IA en compétence sur la GenAI.
- Acculturation : Créer le réflexe LLM et GenAI auprès du métier.
🎙 Episode #148 avec Michael Benisti
🔎 Description : Licorne française qui accompagne les entreprises sur le développement de leur eCommerce avec des solutions SaaS notamment pour la marketplace ou le retail media. Levée de fonds record de 555 millions de dollars.
🏋️♀️ Les challenges :
- GenAI : Intégrer des fonctionnalité GenAI dans le produit (onboarding catalogues, modération de contenus, recommandation produits).
- Organisation : Recruter des Data Scientists avec des fortes compétences en Software Engineering et restructurer l'équipe autour de 4 squads IA (on retrouve dans une squad 4-5 Data Scientists et 1 Data Engineer).
- Stack : Mise en place d'une stack pour soutenir la stratégie GenAI (AWS & Databricks, Azure OpenAI, Galileo.ai, Anyscale).
🎙 Episode #172 avec Anne-Claire Baschet
🔎 Description : Solution de gestion des finances et de comptabilité. 600 collaborateurs dont 30 dans l'équipe Data. 148 millions d'euros levés depuis leur création.
🏋️♀️ Les challenges :
- Analytics : Monter l'équipe Data Analytics (10 personnes).
- Recrutement : Définir un plan de recrutement, le périmètre des Data Analysts et le type de profil recherché (problem solvers).
- Organisation : Mise en place d'une organisation hybride (management centralisé mais Analysts dédiés et intégrés aux équipes).
🎙 Episode #201 avec Juliette Bon
🔎 Description : Plateforme qui permet aux entreprises d'utiliser leurs données pour planifier leur activité (aka, un Excel sous stéroïde)
🏋️♀️ Les challenges :
- GenAI : Déployer des fonctionnalités GenAI dans le Produit.
- Organisation : Monter une équipe GenAI dédiée au Produit (15 profils, 50% Data Scientists & ML Engineers, 50% Softawre Engineers).
- Stack : Mettre en place une stack GenAI (OpenAI, LangChain, Langfuse, LangGraph).
🎙 Episode #196 avec Samya Barkaoui
🔎 Description : Banque en ligne pour les PME et les indépendants. 622 millions d’euros levés, 1 600 collaborateurs, 500 000 clients en Europe.
🏋️♀️ Les challenges :
- Organisation : Scaler l'équipe Data de 14 à 60 personnes et adopter une organisation hybride centralisée et décentralisée.
- Data Science : Créer une équipe de Data Scientists dédiés à la décision (Mix Marketing Modeling, prévisions financières, pricing…).
- Stack : Mettre en place une Modern Data Stack (S3 d’AWS, Snowflake, Airflow, dbt, Tableau).
- Analytics Engineering : Mettre en place une approche Analytics Engineering & Self-Service.
- Gouvernance : Mettre en place des Data Contracts pour réduire les problèmes de Data Quality.
🎙 Organisation, Stack & Gouvernance : Episode #136 avec Jérémie Jakubowicz
🎙 Analytics Engineering : Episode #174 avec Alice Fresko
🎙 Data Science : Episode #180 avec Nicolas Augusti
🔎 Description : Licorne française qui améliore l'expérience des employés au travail grâce à ses titres restaurants, cartes cadeaux et avantages mobilité.
🏋️♀️ Les challenges :
- Stratégie : Réorganiser l'équipe Data pour accroître l'impact business et la qualité de données.
- Organisation : Recentrer l'organisation sur 2 sous-équipes Data (15 personnes, équipe Data Infrastructure avec des Data Engineers, équipe BI avec des Product Managers et Analytics Engineers).
- Stack : Refondre l'utilisation de dbt (autres outils de la stack : Stitch, Airflow, Snowflake, Metabase, Looker, Hightouch).
- Fédération : Mettre en place une approche fédérée où chaque équipe Produit & Tech dispose de sa propre stack data.
- Data Contracts : Mettre en place des Data Contracts (les équipes Produit & Tech créent les premiers modèles dans dbt (layer bronze)).
🎙 Episode #198 avec Alma Garcia-Mariller
🔎 Description : Service de téléphonie moderne intégré à tous les outils d’entreprise (ex : CRM, Slack). Plus de 10 000 clients.
🏋️♀️ Les challenges :
- Stratégie : Améliorer le ROI de l'équipe Data.
- Stack : Challenger les choix qu’ils ont pris (baisser l'accès à l'outil de BI, optimiser les requêtes, stopper la collecte de certaines sources).
- Gouvernance : mettre en place une gouvernance globale pour prioriser les projets data.
🎙 Episode #106 avec Edouard Flouriot
🔎 Description : Plateforme de marketing automation qui permet notamment d’orchestrer ses campagnes d'emailing ou de SMS. +100 millions d’euros de revenus annuels. +15 profils Data.
🏋️♀️ Les challenges :
- Stack : Mettre en place une Modern Data Stack (Meltano & Airbyte, BigQuery, Airflow Composer, dbt, Metabase).
- Organisation : Scaler l'équipe (VP Data & Compliance, Directeur Data, 3 Data Engineers, 3 Data Scientists, 2 Analytics Engineers, 1 Data Ops, 5 Data Analysts).
- Embedded Analytics : Mettre en place de l’embedded analytics dans le Produit (Looker).
- DataOps : Lancer une équipe DataOps pour scaler l'impact des équipes Data Analytics, Data Science & Data Engineering.
🎙 Stack & Organisation : Episode #142 avec Bilal Baltagi
🎙 Embedded Analytics : Episode #184 avec Taha Bel Khayate
🎙 DataOps : Episode #211 avec Antoine Tanguy
🔎 Description : Licorne franco-américaine qui produit des chaînes de contenu sur les réseaux sociaux et qui propose une technologie IA à destination des créateurs de contenu.
🏋️♀️ Les challenges :
- Stratégie : Améliorer la qualité des données et absorber la croissance.
- Gouvernance : Mettre en place une approche Data Mesh.
- Stack : Déployer des Data Plateforms pour chaque équipe métier (Terraform).
🎙 Episode #108 avec Virginie Cornu
Les Grosses Boîtes 🔥
🔎 Description : Leader de la grande distribution en Europe. +150 profils au sein de l’Analytics Factory.
🏋️♀️ Les challenges :
- Stratégie : Passer d'un Data Lab à une Analytics Factory et scaler les cas d'usage data & IA.
- Organisation : Trouver le bon équilibre en centralisation et décentralisation.
- Use cases : Trouver le bon équilibre entre sujets stratégiques pour l’entreprise à long terme (ex : promotions) et sujets urgents pour les métiers à court terme (ex : recommandation des produits les moins chers sur la période d’inflation).
🎙 Episode #119 avec Arnaud Grojean
🔎 Description : L’un des plus grands groupes d’assurance au monde.
🏋️♀️ Les challenges :
- Acculturation : Déployer un programme d'acculturation pour tous les collaborateurs (communauté, communication...).
- Organisation : Adopter un modèle de décentralisation gouvernée et redonner l'ownership des données au métier.
- Stack : Mettre en place des technologies et une architecture ouverte et construire des produits data et IA gouvernés.
🎙 Episode #156 avec Chafika Chettaoui
🔎 Description : Leader mondial de la distribution d'articles de sport. 100 000 collaborateurs dans 70 pays.
🏋️♀️ Les challenges :
- People Analytics : Lancer une équipe Data Analytics qui couvre l'ensemble des processus RH (formation, recrutement, rémunération...).
- Organisation : Recruter et centraliser 20 personnes au sein de l'équipe People Analytics.
- Formation : Gérer la montée en compétences des équipes Data sur le métier RH peu connu (reskilling de profils RH vers la data).
- Gouvernance : Centraliser et gouverner les données RH qui sont particulièrement sensibles (rémunération).
🎙 Episode #190 avec Fabien Viossat
🔎 Description : Leader mondial de la beauté qui regroupe 37 marques internationales.
🏋️♀️ Les challenges :
- GenAI : Déployer une stratégie GenAI.
- Organisation : Créer une task force dédiée au sujet GenAI.
- Use cases : Déployer un ChatGPT Interne (L'Oréal GPT) et des projets "core product" (ex : Assistant beauté virtuel).
🎙 Episode #146 avec Jean-Paul Paoli
🔎 Description : Banque leader mondiale.
🏋️♀️ Les challenges :
- Data Science : Lancer un programme IA (20-25 suites IA représentant chacune 5-10 cas d'usage).
- Stratégie : Structurer autour de 6 piliers (avant-vente, vente, après vente, knowledge management, fraude et assistants pour les collaborateurs).
- Culture : Créer de la confiance auprès du management dans un contexte où beaucoup d'acteurs "racontent tout et n'importe quoi" sur l'IA.
🎙 Episode #165 avec Adrien Vesteghem
🔎 Description : Banque universelle qui compte 150 000 collaborateurs.
🏋️♀️ Les challenges :
- Gouvernance : Mettre en place un programme (documentation, conformité RGPD, comités de pilotage...).
- Cas d'usage : Accélérer la mise en place de cas d'usage Business (ex : assistance au traitement des emails via l’IA, détection de cyber attaques, assistance à la remise de justificatifs via l’IA).
- GenAI : Déployer la stratégie du groupe qui s'appuie sur 6 piliers (acculturation, protection, expérimentation, évolution des technologies, souveraineté, industrialisation).
🎙 Episode #152 avec Aldrick Zappellini
🔎 Description : Groupe de Luxe international. 47 000 collaborateurs, 200 experts de la data.
🏋️♀️ Les challenges :
- Data Mesh : Mettre en place l'approche "by the book".
- Data Domaines : Identifier 11 data domains et 3 prioritaires (Supply, Customer, Sales).
- Stack : Mise en place d'une Data Plateform unique (ex : Google Cloud Platform, dbt).
- Autres piliers : Mise en place d'une approche fédérée et d'une approche Produit.
🎙 Episode #101 avec Yannick Beltran
🔎 Description : Leader européen des centres commerciaux.
🏋️♀️ Les challenges :
- Finance : Transformer le département Finance via la data.
- Stratégie : Structurer le projet en 3 étapes (Formation, Data Gouvernance et Automatisation des dashboards).
- Acculturation : Evangéliser le programme auprès des équipes Finance.
🎙 Episode #173 avec Charly Cadet
🔎 Description : Club de foot emblématique. 300 collaborateurs, 25 millions de supporters. 39 personnes dans la DSI, 5 personnes dans l'équipe Data.
🏋️♀️ Les challenges :
- Organisation : Lancer l'équipe Data avec des profils "couteau suisse" (les Data Analysts font aussi de la Data Science et du Data Engineering).
- Stack : Mettre en place une Modern Data Stack (Redshift, scripts custom, dbt, Power BI, Hightouch, Splio).
- Vision 360° : Créer une vision unifiée du supporter (billetterie, merchandising, contenu journalistique).
🎙 Episode #181 avec Jessy Hanzo
🔎 Description : Fleuron de la tech française. 1 500 collaborateurs, 700 côté Tech.
🏋️♀️ Les challenges :
- Machine Learning Engineering : Passer d'une approche Data Science à une approche Machine Learning Engineering.
- Stratégie : Déployer 8 initiatives pour opérer cette montée en compétence (identifier les différentiels de compétence, formations, mentoring, peer coding...).
- Formation : Mettre en place un mix de formations externes (Coursera) et internes (experts qui forment sur la stack locale) pour faire monter en compétence l'équipe.
🎙 Episode #170 avec Elisa Gilles
🔎 Description : Un des leaders mondiaux du secteur de la santé avec 100 000 collaborateurs.
🏋️♀️ Les challenges :
- Stratégie : Déployer de la data et de l’IA sur toute la chaîne de valeur pour réduire de moitié le temps nécessaire à la mise sur le marché d'un médicament (5 ans en moyenne au lieu de 10 ans).
- Data Mesh : Mettre en place une approche Data Mesh (gestion de la donnée par domaine, en suivant une approche Produit...).
- Stack : Créer des Data Foundations, les bases de données harmonisées dans Snowflake qui sont les sources de vérités uniques sur chaque domaine (autres outils de la stack : Dataiku, Airflow, dbt, Informatica).
- Organisation : Mettre en place une approche "user builder" pour favoriser l'adoption.
🎙 Episode #194 avec Thibault Lefèvre
Le top 3 🏆
- Stack : Construire une Modern Data Stack ou la faire évoluer (23 occurrences sur 34 boîtes)
- Organisation : Opérer une réorganisation globale ou adapter son organisation à la marge (20 occurrences sur 34 boîtes)
- GenAI : Mettre en place une stratégie et des projets GenAI (12 occurrences sur 34 boîtes)