Malt : Comment déployer un assistant IA (avec Dust, Gemini) pour améliorer l'efficacité des équipes en interne
#90 - Le zoom, le podcast avec Anaïs, ses ressources préférées et le podcast avec CastorDoc
Hello,
Bienvenue dans l’édition #90 de la newsletter DataGen ! 👋
L'agenda de la semaine :
🔍 Zoom sur le lancement d’un assistant IA (avec Dust, Gemini)
🎙 Le podcast avec Anaïs, Head of Data Platform chez Malt
📚 Les ressources recommandées par Anaïs
🎙 L’épisode avec CastorDoc : Data Catalog + GenAI = Self-Service Analytics
C’est parti !
📢 Tu envisages de mettre en place Fabric de Microsoft ?
J’ai fait un post LinkedIn en demandant à la communauté de taguer les meilleurs experts Fabric pour publier un épisode sur la solution.
L’expert Enzo Rideau du cabinet de conseil delaware a été tagué massivement. J’ai donc enregistré une Masterclass avec lui.
delaware est le cabinet de conseil leader sur Microsoft Fabric et SAP en France.
Contactez Enzo de ma part si vous avez besoin d‘aide : enzo.rideau@delaware.pro
Un immense merci à delaware de sponsoriser DataGen. ❤️
🔍 Zoom sur le lancement d’un assistant IA (avec Dust, Gemini) - 3 min
Ce zoom est tiré de mon échange avec Anaïs, Head of Data Platform chez Malt, la scaleup du Next40 qui met en relation des entreprises et des freelances via une marketplace.
Le contexte de départ : un assistant IA spécialisé produit
Chez Malt, le produit est une marketplace et c’est le cœur du réacteur. Tout le monde a besoin constamment d'avoir des informations sur le produit : les équipes commerciales, les équipes légales, etc.
Malt a décidé de créer un assistant IA qui permet de trouver du contenu sur le produit.
“Il connaît toute la Product Knowledge, c’est un peu le cerveau de nos équipes Produit. Par exemple, sur Slack, tu lui demandes : est-ce qu’on a telle fonctionnalité ? Il te répond et te redirige vers la bonne documentation.”
Maintenant, Malt réplique la solution sur les autres domaines (RH, légal…).
Le 2nd cas d’usage : générer du contenu pour des tâches précises
Via Slack, l’assistant peut générer du contenu pour améliorer l’efficacité des équipes.
Par exemple, il peut générer un “post mortem” suite à un incident de production en lisant ce qui s’est passé sur un channel Slack. Il va tout formaliser et synthétiser.
“C'est vraiment ton buddy sur Slack qui peut t'aider à trouver des infos, mais aussi automatiser certaines tâches de ton quotidien.”
Le prototype et 3 enseignements clés
Au départ, Anaïs et son équipe ont créé un prototype en interne. Ils ont fait un RAG* sur quelques documents de leur Product Knowledge et ont construit un Slackbot pour tester.
*RAG : Retrieval Augmented Generation, c’est-à-dire prendre une base de connaissances, la stocker et nourrir son LLM avec cette base.
- Enseignement #1 : Si la documentation n'est pas hyper claire et bien organisée, ça ne marche pas.
- Enseignement #2 : L’équipe Data n’est pas l’équipe qui connaît le mieux la documentation et n’est donc pas en mesure de savoir si l’assistant répond correctement.
“Donc on a été voir la personne qui gère toute la base de connaissances produit et celle qui gère les équipes Customer Care. On leur a dit : on souhaite faire ce projet, on a déjà un prototype. Elles ont dit : ok, ça va nous simplifier la vie, on est hyper motivés.”
Anaïs a donc formé une task force avec ces 2 personnes, un Data Engineer et un MLOps pour la phase suivante.
- Enseignement #3 : Tout construire en interne, ça ne scale pas bien.
“En parallèle, on a découvert Dust. C’est un outil SaaS qui permet de créer des assistants sur des bases de connaissances en quelques clics. On l’a utilisé pour itérer rapidement. L'intérêt, c'est que les gens qui ne sont pas techniques peuvent itérer sur le prompt de l'assistant et améliorer la documentation lorsque c’est nécessaire.”
D’ailleurs, Anaïs précise qu’une grosse partie du travail réside dans l’amélioration de la documentation par les équipes métiers.
La Stack GenAI de l’assistant IA
- Gemini pour le LLM
- Slackbot pour intéragir avec l’assistant
- Dust pour itérer rapidement
“Pour certains assistants, notre Slackbot va parler à Dust et pour d’autres, on a décidé de construire notre stack en interne avec des RAG, nos API et Gemini. Ça dépend du besoin.”
🎙 Le podcast avec Anaïs, Head of Data Platform chez Malt
On aborde également :
Le parcours d’Anaïs (Pernod Ricard, Malt) et les différences entre grosse boîte et scaleup
L’organisation pour délivrer l’assistant
Les plus grosses difficultés : techniques, organisationnelles, prompt engineering, documentation
Les prochaines étapes pour ce projet et la Data chez Malt
“Quand tu n'as pas de la doc claire, ça ne sert à rien. Il faut avoir une knowledge base complète et structurée. Sinon, tu vas te casser les dents sur ton assistant et ça ne changera rien parce que le problème, c'est la documentation.”
Liens vers l’épisode : Apple Podcasts | YouTube | Spotify | Deezer
📚 Les ressources recommandées par Anaïs
La newsletter de Christophe Blefari
“En tant que Data Engineer, je suis une grande fan.”
“Il fait intervenir des leaders sur du Produit, de la Growth et de la Data. Ce sont souvent des sujets métiers. J’adore, c’est hyper intéressant.”
🎙 L’épisode avec CastorDoc : Data Catalog + GenAI = Self-Service Analytics
Tristan est CEO et co-fondateur de CastorDoc, une solution de Data Catalog utilisée aussi bien par des scaleups (IbanFirst, Vestiaire Collective) que par des grandes entreprises (Veolia, Deliveroo). Il nous parle de l'état du marché des Data Catalogs et de leur évolution vers des solutions de Self-Service Analytics, notamment depuis l'émergence des IA Génératives.
On aborde :
Comment CastorDoc s’est imposé comme un Data Catalog de référence
Les fonctionnalités clés de la solution (ex : la brique de Search)
L’évolution de leur positionnement vers le Self-Service Analytics
Pourquoi le Data Catalog est nécessaire aux cas d’usage “text-to-insight”.
“L'IA permet d'aller encore plus loin et encore plus facilement vers ce rêve du Self-Service analytics où tout le monde est en confiance et tout le monde peut consommer toutes les données de l'entreprise.”
Liens vers l’épisode : Apple Podcasts | YouTube | Spotify | Deezer