Qonto : les 5 chantiers du VP Data
#75 - Le zoom, le podcast avec Jérémie et sa ressource préférée
Hello,
Bienvenue dans l’édition #75 de la newsletter DataGen ! 👋
L'agenda de la semaine :
🔍 Zoom sur 5 chantiers du VP Data de Qonto
🎙 Le podcast avec Jérémie, VP Data de Qonto
📚 La ressource recommandée par Jérémie
C’est parti !
📢 Vous avez vu que Qlik avait racheté Talend ?
Aujourd’hui, Qlik couvre toute la chaîne de l’ingestion à la visualisation.
Côté équipe Data, c’est top parce que tu as un seul interlocuteur et une stack unifiée.
Charles, un expert data de chez eux est venu nous en parler sur le podcast dans l’épisode 135.
Il nous a également parlé d’autres avantages et de quelques innovations orientées IA Génératives qui sortent en 2024.
Ils les présenteront d’ailleurs lors du AI Reality Tour qui aura lieu à Paris le 2 juillet.
Voici le lien pour vous inscrire : ICI
Un immense merci à Qlik de sponsoriser DataGen. ❤️
🔍 Zoom sur 5 chantiers du VP Data de Qonto
Ce zoom est tiré de mon échange avec Jérémie Jakubowicz, VP Data chez Qonto, la banque en ligne des PME et des indépendants. Ils ont levé 622M€ depuis leur création et comptent aujourd’hui 1 500 collaborateurs et 450 000 clients en Europe.
1) Recruter 45+ personnes
L’équipe Data chez Qonto est passée de 14 à 60 personnes depuis l’arrivée de Jérémie il y a 2 ans et demi. Pour scaler autant, Jérémie s’est appuyé sur l’équipe de recrutement de Qonto qui a développé une expertise forte sur les profils data.
2) Créer une équipe Data Science
L’équipe Data Science chez Qonto est un peu différente de ce qu’on peut voir dans la majorité des startups. Cette équipe est spécialisée sur les sujets de Data Science appliqués “à la décision”. Il ne mettent pas d’algorithmes en production, ils utilisent des modèles économétriques pour faire des recommandations d’actions avec des analyses d’impact (ex : si on augmente l’investissement marketing sur tel canal, on aura une augmentation de ROI…).
“On a une autre équipe qui met des algorithmes en production qui s’appelle l’équipe Data Products. Ce sont 2 équipes bien distinctes avec des profils différents.”
3) Prioriser les sujets de l’équipe Business Intelligence
L’équipe Business Intelligence rencontrait des difficultés à prioriser les sujets entre des demandes qui venaient des investisseurs, du marketing, du service client… La solution souvent adoptée est de décentraliser cette équipe en répartissant les membres dans les équipes Business. Qonto a décidé d’adopter un modèle hybride où l’équipe reste centralisée mais avec des membres dédiés par équipe Business (ex : 2 personnes pour le Marketing…).
“Les équipes Business priorisent directement avec leurs interlocuteurs BI dédiés. Par ailleurs, on garde les avantages d’une équipe centralisée : méthodes partagées, culture d’équipe…”
4) Construire la Data Platform
- Stockage des données brutes : S3 d’AWS
- Data Warehouse : Snowflake
- Scheduling : Airflow
- Transformation : dbt
- Business Intelligence : Tableau
“C’est une stack qu’on peut garder encore un bon moment. Elle est très bien, elle passe à l’échelle !”
5) Mettre en place une Data Gouvernance
Jérémie définit la Data Gouvernance de la façon suivante :
L’objectif de la Data Gouvernance est de comprendre pourquoi on a des problèmes de qualité de données.
→ On a des problèmes de qualité de données parce qu’on ne reçoit pas les données qu’on attend.
→ On ne reçoit pas les données qu’on attend parce que les systèmes qui produisent les données évoluent dans le temps.
→ Les systèmes évoluent parce que c’est le job d’un développeur de faire évoluer le produit pour répondre aux besoins Business.
→ Le problème, c’est que ces évolutions changent la manière dont on track les données.
Il conclut que le chantier majeur ici a été de contractualiser ce qu’on s’attend à recevoir, autrement dit de mettre en place des “Data Contracts” avec toutes les équipes qui produisent de la donnée.
“Quand on rentre dans cette discussion, on se retrouve souvent à parler d’outils. Moi, je suis convaincu que ce n’est pas tant une question d’outils mais plutôt une question humaine. Chez Qonto, on utilise tout simplement Notion pour formaliser les Data Contracts.”
🎙 Le podcast avec Jérémie, VP Data de Qonto
On aborde également :
Le parcours de Jérémie, de chercheur à VP Data dans 3 licornes (Veepee, ManoMano et Qonto)
L’organisation de l’équipe Data : BI, Data Science, Data Product & Platform
Ses plus gros challenges depuis son arrivée chez Qonto
Ses 2 chantiers du moment : la modélisation et les IA Génératives
Liens vers l’épisode : Apple Podcasts | YouTube | Spotify | Deezer
“Les Data Warehouse modernes ont eu un impact positif majeur mais amènent aussi des inconvénients. À force de simplifier la fabrication des tables, on a permis au fil des années la création d'une quantité phénoménale de tables non-gouvernées.”
📚 La ressource recommandée par Jérémie
“On a vraiment de la chance d'avoir des promoteurs de l'Open Source et de pouvoir comprendre dans le détail les différentes phases qui sont nécessaires pour fabriquer un modèle tel que celui de Llama 2.”
Note : c’est technique. 😁
👋 DataGen, c’est aussi un Collectif de freelances data issus des plus belles boîtes
Grâce au podcast, on a fédéré les meilleurs freelances data du marché.
Si tu as un projet data, on a l'équipe qu'il te faut : Head of Data, Data Analyst, Data Engineer, Data Scientist, etc.
En savoir plus : ici