Mirakl : Intégrer la GenAI dans le Produit
#96 - Le zoom, le podcast avec Anne-Claire et sa ressource préférée
Hello,
Bienvenue dans l’édition #96 de la newsletter DataGen ! 👋
L'agenda de la semaine :
🔍 Zoom sur l’intégration de la GenAI dans le Produit Mirakl
🎙 Le podcast avec Anne-Claire, Chief Data & AI Officer chez Mirakl
📚 La ressource recommandée par Anne-Claire
C’est parti !
📢 Vous souhaitez mettre en place Databricks ?
J’ai reçu Frédéric sur le podcast, un expert qui a d’ailleurs monté Datatorii, un cabinet de conseil spécialisé sur la solution.
Il est venu nous faire une masterclass dans l’épisode 167.
• Dans quel contexte on met en place Databricks ?
• A quoi ressemble une stack avec Databricks ?
• Quels sont les avantages et les inconvénients de la solution ?
Tout y passe.
N’hésitez pas à contacter Frédéric pour vous faire accompagner sur des projets Databricks : fforest@datatorii.com
Un immense merci à Datatorii de sponsoriser DataGen. ❤️
🔍 Zoom sur l’intégration de la GenAI dans le Produit Mirakl - 3 min
Ce zoom est tiré de mon échange avec Anne-Claire, Chief Data & AI Officer chez Mirakl, la licorne française qui propose une solution clé en main pour monter sa marketplace et qui a réalisé une levée de fonds record début 2024 de 555 millions de dollars.
“En novembre 2022, quand ChatGPT est arrivé, il y a eu ce côté : mais en fait, on peut tout refaire !”
Les 3 fonctionnalités IA
1) Onboarding des catalogues
“Par exemple, les vendeurs ont leur catalogue de produits qui est disponible via API ou via csv mais les informations ne sont pas du tout au format attendu pour que tout s’affiche bien sur Mirakl. L’IA aide énormément pour transformer le catalogue.”
Dans l’épisode, Anne-Claire nous détaille en particulier ce projet. Elle nous explique comment ils sont passés d’un process qui mettait 11 jours en moyenne à moins de 2 heures.
2) Modération de contenu
“Une fois que le produit est publié, l’IA va pouvoir vérifier que les informations sont bonnes. Est-ce qu’on a le bon prix, est-ce qu’on a pas un problème avec l’image ? Etc.”
3) Recommandation de produits
“Ici, l’objectif est d’aider nos clients à créer plus de business et de revenus avec des algos de recommandation.”
La création de Squads AI
Dans un 1er temps, Mirakl a adapté le recrutement de Data Scientists en fonction de leurs nouveaux besoins en mettant l’accent sur les compétences en Software Engineering.
“Les compétences ne sont pas les mêmes lorsque tu souhaites déployer des algorithmes à l’échelle dans le Produit que par exemple lorsque tu construis des algorithmes de prévision qui sont affichés dans un dashboard.”
Ensuite, ils ont restructuré l’équipe Data Science autour de 4 Squads IA qui vont travailler sur une fonctionnalité ou sur un objectif précis.
“Elles sont constituées d’environ 5 Data Scientists et d’un Data Engineer / Data DevOps de plusieurs niveaux de séniorité (Lead, Senior, Junior).”
Leur stack GenAI
- Data Platform : AWS & Databricks
- Data Science : MLflow qui est intégré dans Databricks et qui permet aux Data Scientists d’être plus productifs
- LLM : Azure OpenAI et l’API OpenAI en direct pour tester les cas d’usage rapidement. Dorénavant, ils utilisent d’autres modèles type Llama afin de réduire les coûts
- Finetunig de LLM : Galileo.ai qui permet d’optimiser les données utilisées, de minimiser les hallucinations et de mettre en place une approche LLM-as-a-Judge
- Serving : Anyscale qui permet de créer un système qui va sélectionner automatiquement le modèle à utiliser en fonction du besoin
“A l’échelle, on peut vite atteindre 500 000€ par mois. Donc par exemple, on a fine-tuné un petit modèle Llama qui coûte moins cher qu’un GPT-4 mais qui répond très bien à certains besoins. Anyscale nous permet d’orchestrer les différents modèles.”
🎙 Le podcast avec Anne-Claire, Chief Data & AI Officer chez Mirakl
On aborde :
Le parcours d’Anne-Claire : AXA, SNCF, Aramis, Mirakl
Les 3 fonctionnalités IA qui s’intègrent dans le Produit (cf. zoom)
Le lancement des Squads AI (cf. zoom)
L’usage de la GenAI pour transformer le catalogue produit
GenAI versus algorithmes traditionnels
Son plus gros challenge : le scale de l’équipe Data & IA et la collaboration avec les autres équipes tech
Leur stack GenAI (cf. zoom)
La structure de l’équipe
“Le plus gros challenge, c’était un challenge humain. Il y avait un enjeu de collaboration entre les équipes Data, Product et Engineering.”
Liens vers l’épisode : Apple Podcasts | YouTube | Spotify | Deezer
📚 La ressource recommandée par Anne-Claire
Le livre Pré-suasion de Robert Cialdini
“C'est un livre qui aborde un concept intéressant : comment est-ce qu'on met la personne que l’on doit convaincre en condition avant d'avoir la discussion ? C’est utile dans le e-commerce par exemple pour mettre un visiteur en condition de prendre une décision d'achat.”
🎙 Le podcast sur la transformation data du département Finance de Klépierre
Charly Cadet est Group Head of Financial Performance chez Klépierre, le leader européen des centres commerciaux. Charly a initié un programme de transformation du département Finance et un peu plus largement de Klépierre via l'usage de la data. Il explique la genèse du projet, le détail du programme et leurs initiatives data.
On aborde :
Les 3 étapes du programme : Formation, Data Gouvernance et Automatisation des dashboards
La grosse difficulté que Charly a rencontrée : évangéliser le programme auprès des équipes
L’importance de recruter un profil technique pour accompagner l’équipe Finance dans cette transformation
La collaboration avec l’équipe IT et les prochaines étapes (ex : adoption, prédiction).
“Quand je suis arrivé, je me suis dit avec le CFO, mon patron actuel : qu'est-ce qu'on pourrait faire comme programme ad hoc pour faire en sorte que les métiers de la Finance se transforment et qu'on passe beaucoup moins de temps à produire la data, mais plutôt à l'utiliser ? On a contacté DataBird pour le mettre en place.”
Liens vers l’épisode : Apple Podcasts | YouTube | Spotify | Deezer