Les plus gros challenges des leaders data invités sur DataGen - 2023
#66 - Les challenges data de 30 scaleups, licornes et grosses boîtes
Hello,
Bienvenue dans l’édition #66 de la newsletter DataGen ! 👋
Je t’ai préparé sur ce 1er trimestre une petite rétrospective des challenges rencontrés par 30 boîtes que j’ai reçu sur le podcast en 2023.
Elles sont réparties en 3 catégories :
Les Scaleups 🚀
Les Licornes 🦄
Les Grosses Boîtes 🔥
Si tu souhaites creuser, tu retrouveras pour chaque boîte le lien LinkedIn de l’invité(e), le lien vers l’épisode du podcast.
En bonus, je te partage les 3 challenges qui reviennent le plus souvent à la fin.
C’est parti !
👋 DataGen, c’est aussi un collectif de freelances data issus des plus belles boîtes
Grâce au podcast, on a fédéré les meilleurs freelances data du marché. Si tu as un projet data, on a l'équipe qu'il te faut : Head of Data, Data Analyst, Data Engineer, Data Scientist, etc.
En savoir plus : ici
Les Scaleups 🚀
🔎 Description : Ecole en ligne qui rend l’éducation accessible avec des formations sur tous les sujets (data, design, tech, etc.). +44 000 changements de carrière accompagnés en 2022.
🏋️♀️ Les challenges :
- Governance : Améliorer la fiabilité des données (guidelines de code, priorisation stricte pour avancer sur ces sujets, communication pour embarquer le Business...)
- Organisation : Recruter une Data Project Manager dédiée
- Stack : Refonte de la stack en parallèle (passage de Dataiku à dbt)
🎙 Episode #72 avec Victoire Renaudin
🔎 Description : 1er média en ligne d’Europe. Ils ont dépassé les 22 milliards de vidéos vues en 2022.
🏋️♀️ Les challenges :
- Organisation : Lancer le département et recruter l’équipe
- Analytics : Mettre en place la Business Intelligence
- Stack : Mettre en place une Modern Data Stack
- Stratégie : Intégrer l'éthique dans la Stratégie Data
🎙 Episode #64 avec Dounia Zouine
🔎 Description : Scale-up qui aide les entreprises à se protéger contre les risques de cybersécurité. +150 collaborateurs, 33 millions d’euros levés en 2020.
🏋️♀️ Les challenges :
- Stratégie : Mettre en place une stratégie Data Gouvernance en 5 pilliers (avoir connaissance de ce qui existe, une donnée de qualité, un gisement de donnée exploitable, des accès à la donnée bien organisés et une vision claire de l’ownership)
- Culture : Lancer un programme Data Experts et embarquer les équipes Business
- Governance : Définir l'ownership des données (ie une grande matrice)
🎙 Episode #94 avec Marie Sacksick
🔎 Description : Plateforme de mise en relation entre propriétaires et locataires de voiture. Ex-Drivy en Europe qui a été racheté 300 millions de dollars par le concurrent américain.
🏋️♀️ Les challenges :
- Organisation : Mettre en place une approche hybride entre centralisée et décentralisée
- Stack : Mettre en place une Modern Data Stack (Snowflake, dbt)
- Governance : Augmenter les standards de qualité de l’équipe Data (bonnes pratiques, tests, meilleurs designs)
🎙 Episode #41 avec Guillemette Maillère
🔎 Description : FinTech qui permet aux PME de réaliser des paiements à l’international facilement. Croissance à +100% par an ces dernières années.
🏋️♀️ Les challenges :
- Data x Product : Améliorer la collaboration entre les équipes Data et Produit et mieux intégrer la data à chaque étape du cycle de vie d’une fonctionnalité
- Organisation : Recruter un Product Data Analyst (pour à terme lancer un pôle Product Analytics)
🎙 Episode #44 avec Fatimata Sall
🔎 Description : FinTech qui permet de s’ouvrir un compte courant depuis un bureau de tabac. +3 millions de comptes clients en France, au Portugal et en Belgique.
🏋️♀️ Les challenges :
- Organisation : Mettre en place une approche hybride entre centralisée et décentralisée et rendre les équipes Métiers autonomes
- Data Science : Déployer des algorithmes qui tournent en temps réel (aka Real-Time Modern Data Stack)
🎙 Episode #51 avec Paul Marcombes
🔎 Description : Scaleup qui propose un service de transport de containers nouvelle génération pour les entreprises. +500 clients, +150 collaborateurs et seulement… 3 personnes en Data !
🏋️♀️ Les challenges :
- Organisation : Mettre en place une approche Self-Service (3 profils Data pour 150 collaborateurs)
- Stack : Centraliser les KPIs dans l'outil dbt pour optimiser les tables pour le Self-Service (peu de jointures)
- Governance : Mettre en place un CI/CD très tôt pour éviter une accumulation de bugs à long terme (revues de code, tests...)
- Culture : Lancer un programme de Data Champions
🎙Episode #90 avec Juliette Duizabo
🔎 Description : Scaleup qui permet de payer au restaurant via un QR code posé sur la table. +100 millions d’euros levés en 2021, 100 employés.
🏋️♀️ Les challenges :
- Governance : Se réorganiser en Data Mesh pour faire face à une réduction d'effectifs côté Data
- Organisation : Déléguer une partie de la préparation de données à l’équipe Tech (jusqu'en Silver, cf architecture Medallion)
- Self-Service : Rendre les équipes Business autonomes via des tables de KPIs suffisamment préparées (Gold)
🎙Episode #77 avec Claire Gouze
🔎 Description : Néo-assurance qui a levé 110 millions de dollars en 2021.
🏋️♀️ Les challenges :
- Analytics : Fournir les premiers dashboards (ex : finance, investisseurs)
- Stack : Mettre en place une Modern Data Stack (Fivetran, Snowflake, Matillion)
- Governance : Mettre en place un langage commun
🎙Episode #58 avec Aymeric Veyron
🔎 Description : Plateforme qui diffuse de l’information immobilière rachetée 200 millions d’euros.
🏋️♀️ Les challenges :
- Stratégie : Internationaliser les projets data suite au rachat
- Data Science : Réaliser une due diligence et un POC en 3 mois
- Organisation : Naviguer dans un nouveau contexte politique et culturel (Allemagne et Belgique dans un contexte de rachat)
🎙 Episode #66 avec Thomas Lefebvre
🔎 Description : Solution de data storytelling.
🏋️♀️ Les challenges :
- Stack : Moderniser la stack Business et Data (Hubspot, Salesforce, Stitch, dbt, BigQuery, Toucan)
- Migration CRM : Migrer vers le nouveau CRM Salesforce
🎙Episode #70 avec Yanni Iyeze
🔎 Description : Plateforme qui référence des offres d’emploi et qui produit du contenu pour accompagner les candidats. 25 millions de visiteurs en 2022 et 5 000 clients.
🏋️♀️ Les challenges :
- Analytics : Mettre en place une méthodologie pour les analyses data à forte valeur ajoutée
- Data x Product : Se concentrer sur l'accompagnement des équipes Produit
- Stack : Consolider la Modern Data Stack (dbt, Airflow, Fivetran, Rivery)
🎙 Episode #55 avec Jean-Nicolas Fine
Les Licornes 🦄
🔎 Description : Marketplace qui propose des produits reconditionnés (téléphones, ordinateurs…).
🏋️♀️ Les challenges :
- Organisation : Réorganiser son équipe Data Engineering par domaine Métier
- Stack : Continuer à maintenir la stack après la réorganisation (Airbyte, Databricks, Snowflake, Tableau, Castor)
🎙 Episode #63 avec Pierre Courvoisier
🔎 Description : Plateforme de transports partagés (voiture et bus) leader en Europe. 20 millions d’utilisateurs en France.
🏋️♀️ Les challenges :
- Data Science : Adopter une approche Produit (Discovery, Planification, POC, Industrialisation)
- Organisation : Se réorganiser en squad avec une approche Data Mesh
🎙 Episode #74 avec Célia Fischbach
🔎 Description : Outil d'analyse data dédié à l'amélioration des parcours utilisateurs. Croissance exceptionnelle nourrie par des levées de fonds records (ex : 600 millions € en 2022. +1500 collaborateurs, 15 bureaux dans le monde, +1000 clients.)
🏋️♀️ Les challenges :
- Organisation : Lancer une équipe Product Analytics
- Stratégie : Délivrer des analyses à forte valeur ajoutée pour prouver l’impact de l’équipe
🎙 Episode #97 avec Chloé Side
🔎 Description : Plateforme de streaming musical avec +90 millions de titres.
🏋️♀️ Les challenges :
- Organisation : Restructurer le département Business Analytics (équipes spécialisées Product, Content/CRM et Business)
- Ressources Humaines : Construire des plans de carrière pour motiver et retenir les Analysts et mettre le recrutement au premier plan
🎙 Episode #96 avec Thibaud Arbes Dupuy
🔎 Description : Licorne qui sécurise les crypto-monnaies. +800 collaborateurs, +6 millions de portefeuilles physiques vendus dans 180 pays.
🏋️♀️ Les challenges :
- Organisation : Lancer le département et recruter 13 profils Data (Data Engineers, Analytics Engineers, Product Analysts et un Data Viz Specialist)
- Stack : Monter une Modern Data Stack (Fivetran, Stitch, Segment, Snowflake, dbt, Airflow, Tableau, Castor)
🎙 Episode #50 avec Michael Benisti
🔎 Description : Plateforme qui facilite les dépenses en entreprise. +180 000 utilisateurs.
🏋️♀️ Les challenges :
- Stratégie : Mettre en place une approche Analytics Engineering
- Stack : Harmoniser la modélisation dans le Data Warehouse (pas de doublons, requêtes faciles, centralisation dans dbt avec les bonnes pratiques de software engineering)
- Self-Service : Mettre en place une approche Self-Service sur la Business Intelligence (Looker)
🎙 Episode #91 avec Jules Jeanroy
🔎 Description : Leader européen des ventes événementielles en ligne. +50 profils Data, 3 millions de visiteurs uniques chaque jour dans 10 pays.
🏋️♀️ Les challenges :
- Data Contracts : Mettre en place une approche Data Contracts où ce sont les différents services qui sont responsables de pousser leurs données dans la plateforme
- Ingestion : Créer un outil d'ingestion in-house
- Stack : Intégrer cet outil dans la stack (BigQuery, dbt, Airflow, MicroStrategy)
🎙 Episode #84 avec Victor Cumer
🔎 Description : Plateforme qui permet d’acheter et vendre des vêtements de seconde main. 700 collaborateurs, 30 en Data.
🏋️♀️ Les challenges :
- Data Science : Développer un algorithme pour valider la qualité et l’authenticité des produits ajoutés sur la plateforme
- POC : Créer une 1ère version simple d’un point de vue technique afin que l’équipe Data Science puisse expliquer les résultats aux stakeholders et créer de l'adhérence au projet
- Industrialisation : Monter en complexité, identifier le bon niveau d’automatisation et mettre en place du monitoring pour s'assurer que l'algorithme ne soit pas en train de "drifter" (perdre en performance)
🎙 Episode #86 avec Adrien Marteau
Les Grosses Boîtes 🔥
🔎 Description : Marque préférée des Français. +400 millions d'utilisateurs sur l'ensemble de ses services. +400 collaborateurs au sein de la BU Data.
🏋️♀️ Les challenges :
- Stratégie : Déployer une nouvelle stratégie Analytics (nouvelles orga et stack)
- Organisation : Mettre en place une BU Data centrale avec nouvelle direction (Directeur Analytics, Staff Engineer), des Managers Analytics et des Analysts spécialisés par domaine Métier
- Stack : Mettre en place une stack data moderne (Databricks, Tableau, GitHub)
🎙 Episode #60 avec Anicet Bart
🔎 Description : La compagnie fait de la data depuis 25 ans et compte aujourd’hui 300 profils data au sein du groupe.
🏋️♀️ Les challenges :
- Governance : Réduire le temps d’industrialisation des produits data, créer une Data Factory physique au siège pour acculturer les Métiers
- Organisation : Créer des rôles de Data Officers dans chaque Métier pour assurer l’adoption des produits data
- Data Science : Industrialiser un algorithme qui prédit quand la pièce d’un avion va être défectueuse
🎙 Episode #78 avec Julie (Luong) Pozzi
🔎 Description : +130 en Data au siège et 19 000 au sein du groupe
🏋️♀️ Les challenges :
- Stratégie : Passer d’un Data Lab à une approche plus industrielle
- Governance : Evangéliser l’organisation sur les approches data
- Organisation : Recruter +100 experts data en 1 an
- Data Science : Mettre en place 3 programmes (optimisation des promotions, efficacité marketing, opportunités commerciales sur le terrain)
🎙 Episode #54 avec David Lepicier
🔎 Description : Leader mondial de la gestion de l’eau et des déchets. 50 profils data au sein du Groupe dont 20 rattachés au “Data Office” au siège.
🏋️♀️ Les challenges :
- Stack : Favoriser l’accès aux données pour les équipes Métiers via la mise en place de nouveaux outils et la centralisation d’une partie des données
- Governance : Créer des nouveaux rôles au sein des organisations Métiers (ex : Data Steward, Data Owner)
- Culture : Mettre en place un programme de formation data pour les Métiers
- Data Science : Monter une équipe de Data Scientists pour déployer des cas d’usage
🎙 Episode #79 avec Claire Mathieu
🔎 Description : Entre 300 et 400 personnes dans l’équipe Data.
🏋️♀️ Les challenges :
- Data x Design : Rapprocher les équipes Data et Design
- Initiatives : Former les équipe Data au storytelling et les équipes Design à la data, créer des rituels communs Data x Design, produire des “summary of knowledge” et des "cheat sheets"
🎙 Episode #47 avec Claire Lebarz
🔎 Description : Leader européen de la vente de voyage éphémère en ligne. +56 millions de membres, 1 milliard d’euros de chiffre d’affaires annuel
🏋️♀️ Les challenges :
- Stratégie : Identifier les limites liées à la stack existante et créer une feuille de route
- Culture : Évangéliser les équipes Métiers sur les besoins en terme de data
- Stack : Migrer vers la Modern Data Stack (Cloud Composer, Airbyte, dbt)
🎙 Episode #45 avec Orianne Friedrich
Le top 3 🏆
- Stack : Mettre en place ou refondre la Modern Data Stack (Fivetran, dbt, Snowflake…)
- Self-Service : Se réorganiser pour que les équipes Business soient autonomes
- Culture : Lancer un programme de formation à destination du Business