Lancer le département Data d'une startup avec Joko (10 millions levés et rentable)
#73 - Le zoom, le podcast avec Coralie, ses ressources préférées et l'épisode sur le temps réel avec Popsink
Hello,
Bienvenue dans l’édition #73 de la newsletter DataGen ! 👋
L'agenda de la semaine :
🔍 Zoom sur le lancement d’un département Data
🎙 Le podcast avec Coralie, Lead Data chez Joko
📚 Les ressources recommandées par Coralie
🎙 L’épisode sur le temps réel avec Popsink
C’est parti !
🔍 Zoom sur le lancement d’un département Data
Ce zoom est tiré de mon échange avec Coralie qui est Lead Data chez Joko, l’application mobile qui facilite le shopping à plus de 3 millions d’utilisateurs et qui permet de faire des économies dans plus de 3000 enseignes partenaires grâce au cashback.
Les 3 phases de lancement du département Data
1) Construire la stack - 1 an et demi
“Choisir un Data Warehouse, ingérer les données, choisir un outil de visualisation, de transformation… Ça nous a pris je pense une année et demie.”
2) Créer de la valeur avec le projet “Metabase Commando” - 6 mois
“Une fois la stack implémentée, pour commencer à utiliser les données on a mis en place une initiative qu’on a appelée Metabase Commando pour créer des dashboards pour tous les métiers : Marketing, Product...”
3) Devenir “User-Centric”
“Une fois la stack mise en place, on s’est beaucoup plus rapproché de nos stakeholders pour comprendre leurs limitations et concevoir des outils data qui répondent mieux à leurs besoins.”
Phase 1 : construire la stack - 1 an et demi
- Ingestion : Airbyte
- Data Warehouse : Snowflake
- Transformation : dbt
- Visualisation : Metabase
- Product Analytics : Amplitude
“Si c’était à refaire maintenant avec le recul, j’aurais mis dbt en place plus tôt afin de construire dès le début les data modèles liés aux métriques clés.”
Phase 2 : créer de la valeur avec le projet “Metabase Commando” - 6 mois
L’équipe a construit beaucoup de dashboards, 2 personnes étaient concentrées sur la conception des tableaux de bord et la création des modèles correspondant dans dbt.
L’initiative a permis de générer de l’adoption auprès des métiers et de démarrer une boucle itérative avec eux.
“C’est à partir de ce moment-là qu’on a pu mettre en place un process avec nos stakeholders afin de comprendre finement leurs besoins opérationnels et de prioriser les projets qui ont le plus d’impact.”
Phase 3 : devenir “User-Centric”
De manière générale chez Joko, un système d’OKR (Objective & Key Results) a été mis en place pour définir les objectifs des équipes.
Chaque trimestre, Coralie et son équipe récupèrent les besoins data des équipes métiers liés à leurs objectifs Business.
Une fois ces besoins identifiés, l’équipe Data calcule sa bande passante et priorise les projets les plus impactants (cf. OKR).
“On insiste vraiment sur le fait qu'on ne veut pas des solutions ou une liste de dashboards à créer. On demande des limitations. Par exemple : je n’arrive pas à suivre mes coûts d'acquisition. C’est ensuite l’équipe Data qui propose les solutions.”
🎙 Le podcast avec Coralie, Lead Data chez Joko
On aborde également :
Son parcours du conseil en stratégie à la data
Le process de priorisation plus en détail
L’organisation de l’équipe (e.g. la verticalisation)
La répartition de la bande passante entre le run et le build
Liens vers l’épisode : Apple Podcasts | YouTube | Spotify | Deezer
“On passe 70% sur des sujets de fond (avec 1/3 sur la stack et 2/3 sur les sujets de conception, de modélisation et de construction de dashboards). Puis 15% sur du peer reviewing et les 20% restants sont sur du run (réunions, préparation des sprints…).”
📚 Les ressources recommandées par Coralie
“Il a un profil early adopter dans le sens où il va tester plein de nouvelles technologies. Mais en même temps il garde du recul et reste très pragmatique. J’aime beaucoup.”
Le Medium Modern Data Network
🎙 L’épisode sur le temps réel avec Popsink
Benjamin Djidi est le CEO de Popsink, la plateforme d'intégration et de traitement de données en temps réel.
Fin 2023, j’ai enregistré un épisode sur les tendances data de 2024 avec Christophe Blefari (alias Blef). Une des plus grosses tendances de l’année était le temps réel et il m’a parlé d’une nouvelle solution : Popsink. J’ai donc invité Benjamin sur le podcast pour en savoir plus.
On aborde :
Le parcours de Benjamin et la genèse de Popsink
Le cas d’usage type et la différence avec un ETL “classique” (Fivetran, Airbyte, Rivery…)
Les 2 atouts du temps réel : faible latence et baisse des coûts
Pourquoi le temps réel est particulièrement adopté en 2024 ?
Liens vers l’épisode : Apple Podcasts | YouTube | Spotify | Deezer