Le Lead Data Science de Back Market partage leur stratégie GenAI
#91 - Le zoom, le podcast avec Pierre et sa ressource préférée
Hello,
Bienvenue dans l’édition #91 de la newsletter DataGen ! 👋
L'agenda de la semaine :
🔍 Zoom sur la stratégie GenAI de Back Market
🎙 Le podcast avec Pierre, Lead Data Science chez Back Market
📚 La ressource recommandée par Pierre
📆 Un webinar pour devenir Analytics Engineer en 2025
C’est parti !
❤️ Un immense merci à delaware de sponsoriser DataGen
Tu envisages de mettre en place Fabric de Microsoft ?
Écoute la masterclass que j’ai faite sur le sujet avec l’expert Fabric Enzo Rideau.
Et contacte-le de ma part si tu as besoin d‘aide : enzo.rideau@delaware.pro.
🔍 Zoom sur la stratégie GenAI de Back Market - 4 min
Ce zoom est tiré de mon échange avec Pierre, Lead Data Science chez Back Market, la licorne française qui propose une marketplace de produits reconditionnés.
La genèse : un Staff Data Engineer explore le sujet GenAI
Lorsque ChatGPT fait le buzz début 2023, Back Market identifie rapidement qu’il y a un fort potentiel pour leur Business. Leur 1ère initiative est de missionner un Staff Data Engineer pour qu’il explore le sujet pendant 6 à 8 mois.
“Il a mis en place plusieurs briques sur lesquelles on s’est appuyé par la suite : un ChatGPT interne sécurisé et un premier cas d’usage pour le service après-vente.”
Une fois la valeur prouvée, l’équipe de Pierre qui est responsable des projets de Machine Learning en production a récupéré l’ownership des projets.
Les 2 cas d’usage : ChatGPT interne et service après-vente
1) ChatGPT interne
Cette brique donne accès aux employés de Back Market à un LLM type ChatGPT mais dans un environnement sécurisé. Elle leur permet de réaliser des use cases de productivité interne : automatiser des tâches, résumer ou créer des contenus.
Par ailleurs, ils ont branché leurs bases de connaissances internes confluence sur l’outil via du RAG.
“L’idée de cette méthode, c’est qu’à partir de la question d'un utilisateur, on va faire une recherche dans la base de données de Back Market pour remonter une réponse plus pertinente et les documents associés.”
2) Service après-vente
Cette brique vient proposer des réponses aux équipes service après-vente pour les aider à interagir avec les clients notamment lorsque la résolution du problème nécessite des connaissances techniques.
“Il y a toujours un humain dans la boucle. Simplement, l’agent du service client peut rapidement obtenir de l’aide pour orienter ses réponses.”
Aujourd’hui, Back Market travaille sur l’amélioration de ces cas d’usage.
“Dans un 1er temps, les ML Engineers ont industrialisé les solutions mises en production par le Staff (ex : plus de testing, améliorer la CI/CD). Ensuite, ils se sont concentrés sur l’ajout de nouvelles features (ex : intégration Slack, plus de RAG…).”
L’organisation de l’équipe Data Science
Il y a 7 développeurs qui travaillent sur la partie Machine Learning en production.
- 4 profils plutôt Data Science qui vont faire la partie exploration et choix algorithmiques jusqu’à la mise en production.
- 3 profils plutôt ML Engineers et MLOps qui vont gérer la partie infrastructure, outillage et plateforme pour faciliter la mise en production.
“Au début, seuls 50% de l'équipe ont basculé sur les sujets IA Générative. Aujourd’hui, on est plutôt à 75%. On investit sérieusement sur ces sujets.”
La stack GenAI chez Back Market
- LLM : GPT avec une implémentation back-end sécurisée qui protège leurs données. Ils réalisent également des tests avec Gemini, Mistral et des modèles open source.
“Notre conviction, c’est de ne pas se bloquer sur un provider et de se laisser la liberté de changer si besoin en fonction de comment évolue le marché.”
- Interface Utilisateur : Chainlit
“C’est une solution proposée par une jeune startup française qui fournit sur étagère une interface qui te permet d'avoir du chat à la ChatGPT mais qui nous permet d'avoir l'application back-end qu'on veut (RAG, LLM…).”
🎙 Le podcast avec Pierre, Lead data Science chez Back Market
On aborde :
Le parcours de Pierre pour devenir Lead Data Science chez Back Market
La genèse de leur stratégie GenAI (cf. zoom ci-dessus)
Les 2 cas d’usage : ChatGPT interne et service après-vente (cf. zoom ci-dessus)
L’organisation de l’équipe Data Science (cf. zoom ci-dessus)
Les étapes de développement sur le use case Service Client (POC, MVP…)
La stack GenAI chez Back Market (cf. zoom ci-dessus)
Comment Back Market a créé un environnement sécurisé
Les plus grosses difficultés : l’évolution rapide du secteur
Les prochaines étapes : Self-Service, LLM as a Judge, Open Source
“Notre vison, c’est de rendre autonomes au maximum les autres équipes de développeurs sur la GenAI. Il y a plein de use cases où on n’a pas besoin d’un Data Scientist. Et où on doit juste utiliser les function calling.”
Liens vers l’épisode : Apple Podcasts | YouTube | Spotify | Deezer
📚 La ressource recommandée par Pierre
La chaîne YouTube d’Andrej Karpathy, l'ancien Chief Data Scientist de Tesla
“Il y a des vidéos généralistes où il explique comment les modèles de GenAI fonctionnent et des vidéos plus techniques pour les Data Scientists où il rentre par exemple dans le détail du fonctionnement d’un algorithme de deep learning. Il fait très bien le pont entre la théorie et la pratique dans le code.”
📆 Un webinar pour devenir Analytics Engineer en 2025
L’Analytics Engineering a été l’une des grandes tendances data de 2024 et ce n’est que le début.
Le besoin en Analytics Engineers et en Data Analysts “Full-Stack” a explosé.
100% des boîtes avec lesquelles j’échange sur DataGen ont besoin de ces compétences :
SQL avancé
ETL (ex : Fivetran)
dbt & modélisation
CI/CD et Git
BI orientée Self-Service (ex : Metabase)
…
Pour devenir Analytics Engineer, il faut les acquérir.
On organise avec DataBird un webinar sur le sujet le 13 novembre à 17h (45 min).
Au menu :
La tendance de l’Analytics Engineering et son impact sur le Self-Service
Le retour d’expérience de Caroline, ex-Data Analyst devenue Analytics Engineer
Le programme du bootcamp Analytics Engineering qu’on a lancé en collaboration avec DataBird
Q&A : on répond à toutes vos questions !
Lien pour s’inscrire : Webinar
Hello,
Merci pour tout le contenu Datagen Robin !
Est-ce-que le webinar Databird du 13/11 sera enregistré ?
Guillaume