Les plus gros challenges des leaders data invités sur DataGen (Airbnb, BlaBlaCar, Air France...) 🏋️♀️
#66 - Les challenges data de 30 scaleups, licornes et grosses boîtes
Hello,
Bienvenue dans l’édition #66 de la newsletter DataGen ! 👋
Je t’ai préparé sur ce 1er trimestre une petite rétrospective des challenges rencontrés par 30 boîtes que j’ai reçu sur le podcast en 2023.
Elles sont réparties en 3 catégories :
Les Scaleups 🚀
Les Licornes 🦄
Les Grosses Boîtes 🔥
Si tu souhaites creuser, tu retrouveras pour chaque boîte le lien LinkedIn de l’invité(e), le lien vers l’épisode du podcast et le lien vers la newsletter dédiée.
En bonus, je te partage les 3 challenges qui reviennent le plus souvent à la fin.
C’est parti !
👋 DataGen, c’est aussi un collectif de freelances data issus des plus belles boîtes
Grâce au podcast, on a fédéré les meilleurs freelances data du marché. Si tu as un projet data, on a l'équipe qu'il te faut : Head of Data, Data Analyst, Data Engineer, Data Scientist, etc.
En savoir plus : ici
Les Scaleups 🚀
🔎 Description : Ecole en ligne qui rend l’éducation accessible avec des formations sur tous les sujets (data, design, tech, etc.). +44 000 changements de carrière accompagnés en 2022.
🏋️♀️ Les challenges :
- Governance : Améliorer la fiabilité des données (guidelines de code, priorisation stricte pour avancer sur ces sujets, communication pour embarquer le Business...)
- Organisation : Recruter une Data Project Manager dédiée
- Stack : Refonte de la stack en parallèle (passage de Dataiku à dbt)
🎙 Episode #72 avec Victoire Renaudin
🔎 Description : 1er média en ligne d’Europe. Ils ont dépassé les 22 milliards de vidéos vues en 2022.
🏋️♀️ Les challenges :
- Organisation : Lancer le département et recruter l’équipe
- Analytics : Mettre en place la Business Intelligence
- Stack : Mettre en place une Modern Data Stack
- Stratégie : Intégrer l'éthique dans la Stratégie Data
🎙 Episode #64 avec Dounia Zouine
🔎 Description : Scale-up qui aide les entreprises à se protéger contre les risques de cybersécurité. +150 collaborateurs, 33 millions d’euros levés en 2020.
🏋️♀️ Les challenges :
- Stratégie : Mettre en place une stratégie Data Gouvernance en 5 pilliers (avoir connaissance de ce qui existe, une donnée de qualité, un gisement de donnée exploitable, des accès à la donnée bien organisés et une vision claire de l’ownership)
- Culture : Lancer un programme Data Experts et embarquer les équipes Business
- Governance : Définir l'ownership des données (ie une grande matrice)
🎙 Episode #94 avec Marie Sacksick
🔎 Description : Plateforme de mise en relation entre propriétaires et locataires de voiture. Ex-Drivy en Europe qui a été racheté 300 millions de dollars par le concurrent américain.
🏋️♀️ Les challenges :
- Organisation : Mettre en place une approche hybride entre centralisée et décentralisée
- Stack : Mettre en place une Modern Data Stack (Snowflake, dbt)
- Governance : Augmenter les standards de qualité de l’équipe Data (bonnes pratiques, tests, meilleurs designs)
🎙 Episode #41 avec Guillemette Maillère
🔎 Description : FinTech qui permet aux PME de réaliser des paiements à l’international facilement. Croissance à +100% par an ces dernières années.
🏋️♀️ Les challenges :
- Data x Product : Améliorer la collaboration entre les équipes Data et Produit et mieux intégrer la data à chaque étape du cycle de vie d’une fonctionnalité
- Organisation : Recruter un Product Data Analyst (pour à terme lancer un pôle Product Analytics)
🎙 Episode #44 avec Fatimata Sall
🔎 Description : FinTech qui permet de s’ouvrir un compte courant depuis un bureau de tabac. +3 millions de comptes clients en France, au Portugal et en Belgique.
🏋️♀️ Les challenges :
- Organisation : Mettre en place une approche hybride entre centralisée et décentralisée et rendre les équipes Métiers autonomes
- Data Science : Déployer des algorithmes qui tournent en temps réel (aka Real-Time Modern Data Stack)
🎙 Episode #51 avec Paul Marcombes
🔎 Description : Scaleup qui propose un service de transport de containers nouvelle génération pour les entreprises. +500 clients, +150 collaborateurs et seulement… 3 personnes en Data !
🏋️♀️ Les challenges :
- Organisation : Mettre en place une approche Self-Service (3 profils Data pour 150 collaborateurs)
- Stack : Centraliser les KPIs dans l'outil dbt pour optimiser les tables pour le Self-Service (peu de jointures)
- Governance : Mettre en place un CI/CD très tôt pour éviter une accumulation de bugs à long terme (revues de code, tests...)
- Culture : Lancer un programme de Data Champions
🎙Episode #90 avec Juliette Duizabo
🔎 Description : Scaleup qui permet de payer au restaurant via un QR code posé sur la table. +100 millions d’euros levés en 2021, 100 employés.
🏋️♀️ Les challenges :
- Governance : Se réorganiser en Data Mesh pour faire face à une réduction d'effectifs côté Data
- Organisation : Déléguer une partie de la préparation de données à l’équipe Tech (jusqu'en Silver, cf architecture Medallion)
- Self-Service : Rendre les équipes Business autonomes via des tables de KPIs suffisamment préparées (Gold)
🎙Episode #77 avec Claire Gouze
🔎 Description : Néo-assurance qui a levé 110 millions de dollars en 2021.
🏋️♀️ Les challenges :
- Analytics : Fournir les premiers dashboards (ex : finance, investisseurs)
- Stack : Mettre en place une Modern Data Stack (Fivetran, Snowflake, Matillion)
- Governance : Mettre en place un langage commun
🎙Episode #58 avec Aymeric Veyron
🔎 Description : Plateforme qui diffuse de l’information immobilière rachetée 200 millions d’euros.
🏋️♀️ Les challenges :
- Stratégie : Internationaliser les projets data suite au rachat
- Data Science : Réaliser une due diligence et un POC en 3 mois
- Organisation : Naviguer dans un nouveau contexte politique et culturel (Allemagne et Belgique dans un contexte de rachat)
🎙 Episode #66 avec Thomas Lefebvre
🔎 Description : Solution de data storytelling.
🏋️♀️ Les challenges :
- Stack : Moderniser la stack Business et Data (Hubspot, Salesforce, Stitch, dbt, BigQuery, Toucan)
- Migration CRM : Migrer vers le nouveau CRM Salesforce
🎙Episode #70 avec Yanni Iyeze
🔎 Description : Plateforme qui référence des offres d’emploi et qui produit du contenu pour accompagner les candidats. 25 millions de visiteurs en 2022 et 5 000 clients.
🏋️♀️ Les challenges :
- Analytics : Mettre en place une méthodologie pour les analyses data à forte valeur ajoutée
- Data x Product : Se concentrer sur l'accompagnement des équipes Produit
- Stack : Consolider la Modern Data Stack (dbt, Airflow, Fivetran, Rivery)
🎙 Episode #55 avec Jean-Nicolas Fine
Les Licornes 🦄
🔎 Description : Marketplace qui propose des produits reconditionnés (téléphones, ordinateurs…).
🏋️♀️ Les challenges :
- Organisation : Réorganiser son équipe Data Engineering par domaine Métier
- Stack : Continuer à maintenir la stack après la réorganisation (Airbyte, Databricks, Snowflake, Tableau, Castor)
🎙 Episode #63 avec Pierre Courvoisier
🔎 Description : Plateforme de transports partagés (voiture et bus) leader en Europe. 20 millions d’utilisateurs en France.
🏋️♀️ Les challenges :
- Data Science : Adopter une approche Produit (Discovery, Planification, POC, Industrialisation)
- Organisation : Se réorganiser en squad avec une approche Data Mesh
🎙 Episode #74 avec Célia Fischbach
🔎 Description : Outil d'analyse data dédié à l'amélioration des parcours utilisateurs. Croissance exceptionnelle nourrie par des levées de fonds records (ex : 600 millions € en 2022. +1500 collaborateurs, 15 bureaux dans le monde, +1000 clients.)
🏋️♀️ Les challenges :
- Organisation : Lancer une équipe Product Analytics
- Stratégie : Délivrer des analyses à forte valeur ajoutée pour prouver l’impact de l’équipe
🎙 Episode #97 avec Chloé Side
🔎 Description : Plateforme de streaming musical avec +90 millions de titres.
🏋️♀️ Les challenges :
- Organisation : Restructurer le département Business Analytics (équipes spécialisées Product, Content/CRM et Business)
- Ressources Humaines : Construire des plans de carrière pour motiver et retenir les Analysts et mettre le recrutement au premier plan
🎙 Episode #96 avec Thibaud Arbes Dupuy
🔎 Description : Licorne qui sécurise les crypto-monnaies. +800 collaborateurs, +6 millions de portefeuilles physiques vendus dans 180 pays.
🏋️♀️ Les challenges :
- Organisation : Lancer le département et recruter 13 profils Data (Data Engineers, Analytics Engineers, Product Analysts et un Data Viz Specialist)
- Stack : Monter une Modern Data Stack (Fivetran, Stitch, Segment, Snowflake, dbt, Airflow, Tableau, Castor)
🎙 Episode #50 avec Michael Benisti
🔎 Description : Plateforme qui facilite les dépenses en entreprise. +180 000 utilisateurs.
🏋️♀️ Les challenges :
- Stratégie : Mettre en place une approche Analytics Engineering
- Stack : Harmoniser la modélisation dans le Data Warehouse (pas de doublons, requêtes faciles, centralisation dans dbt avec les bonnes pratiques de software engineering)
- Self-Service : Mettre en place une approche Self-Service sur la Business Intelligence (Looker)
🎙 Episode #91 avec Jules Jeanroy
🔎 Description : Leader européen des ventes événementielles en ligne. +50 profils Data, 3 millions de visiteurs uniques chaque jour dans 10 pays.
🏋️♀️ Les challenges :
- Data Contracts : Mettre en place une approche Data Contracts où ce sont les différents services qui sont responsables de pousser leurs données dans la plateforme
- Ingestion : Créer un outil d'ingestion in-house
- Stack : Intégrer cet outil dans la stack (BigQuery, dbt, Airflow, MicroStrategy)
🎙 Episode #84 avec Victor Cumer
🔎 Description : Plateforme qui permet d’acheter et vendre des vêtements de seconde main. 700 collaborateurs, 30 en Data.
🏋️♀️ Les challenges :
- Data Science : Développer un algorithme pour valider la qualité et l’authenticité des produits ajoutés sur la plateforme
- POC : Créer une 1ère version simple d’un point de vue technique afin que l’équipe Data Science puisse expliquer les résultats aux stakeholders et créer de l'adhérence au projet
- Industrialisation : Monter en complexité, identifier le bon niveau d’automatisation et mettre en place du monitoring pour s'assurer que l'algorithme ne soit pas en train de "drifter" (perdre en performance)
🎙 Episode #86 avec Adrien Marteau
Les Grosses Boîtes 🔥
🔎 Description : Marque préférée des Français. +400 millions d'utilisateurs sur l'ensemble de ses services. +400 collaborateurs au sein de la BU Data.
🏋️♀️ Les challenges :
- Stratégie : Déployer une nouvelle stratégie Analytics (nouvelles orga et stack)
- Organisation : Mettre en place une BU Data centrale avec nouvelle direction (Directeur Analytics, Staff Engineer), des Managers Analytics et des Analysts spécialisés par domaine Métier
- Stack : Mettre en place une stack data moderne (Databricks, Tableau, GitHub)
🎙 Episode #60 avec Anicet Bart
🔎 Description : La compagnie fait de la data depuis 25 ans et compte aujourd’hui 300 profils data au sein du groupe.
🏋️♀️ Les challenges :
- Governance : Réduire le temps d’industrialisation des produits data, créer une Data Factory physique au siège pour acculturer les Métiers
- Organisation : Créer des rôles de Data Officers dans chaque Métier pour assurer l’adoption des produits data
- Data Science : Industrialiser un algorithme qui prédit quand la pièce d’un avion va être défectueuse
🎙 Episode #78 avec Julie (Luong) Pozzi
🔎 Description : +130 en Data au siège et 19 000 au sein du groupe
🏋️♀️ Les challenges :
- Stratégie : Passer d’un Data Lab à une approche plus industrielle
- Governance : Evangéliser l’organisation sur les approches data
- Organisation : Recruter +100 experts data en 1 an
- Data Science : Mettre en place 3 programmes (optimisation des promotions, efficacité marketing, opportunités commerciales sur le terrain)
🎙 Episode #54 avec David Lepicier
🔎 Description : Leader mondial de la gestion de l’eau et des déchets. 50 profils data au sein du Groupe dont 20 rattachés au “Data Office” au siège.
🏋️♀️ Les challenges :
- Stack : Favoriser l’accès aux données pour les équipes Métiers via la mise en place de nouveaux outils et la centralisation d’une partie des données
- Governance : Créer des nouveaux rôles au sein des organisations Métiers (ex : Data Steward, Data Owner)
- Culture : Mettre en place un programme de formation data pour les Métiers
- Data Science : Monter une équipe de Data Scientists pour déployer des cas d’usage
🎙 Episode #79 avec Claire Mathieu
🔎 Description : Entre 300 et 400 personnes dans l’équipe Data.
🏋️♀️ Les challenges :
- Data x Design : Rapprocher les équipes Data et Design
- Initiatives : Former les équipe Data au storytelling et les équipes Design à la data, créer des rituels communs Data x Design, produire des “summary of knowledge” et des "cheat sheets"
🎙 Episode #47 avec Claire Lebarz
🔎 Description : Leader européen de la vente de voyage éphémère en ligne. +56 millions de membres, 1 milliard d’euros de chiffre d’affaires annuel
🏋️♀️ Les challenges :
- Stratégie : Identifier les limites liées à la stack existante et créer une feuille de route
- Culture : Évangéliser les équipes Métiers sur les besoins en terme de data
- Stack : Migrer vers la Modern Data Stack (Cloud Composer, Airbyte, dbt)
🎙 Episode #45 avec Orianne Friedrich
Le top 3 🏆
- Stack : Mettre en place ou refondre la Modern Data Stack (Fivetran, dbt, Snowflake…)
- Self-Service : Se réorganiser pour que les équipes Business soient autonomes
- Culture : Lancer un programme de formation à destination du Business