Pigment : Monter l'équipe GenAI d'une licorne
#112 - Le zoom, le podcast avec Samya, ses ressources préférées et l'épisode sur le déploiement d'agents IA avec Agentforce
Hello,
Bienvenue dans l'édition #112 de la newsletter DataGen ! 👋
L'agenda de la semaine :
🔍 Zoom sur l'approche GenAI appliquée au Produit chez Pigment
🎙 Le podcast avec Samya, Generative AI Research Lead chez Pigment
📚 Les ressources recommandées par Samya
🎙️ Le podcast sur le déploiement d’agents IA avec Agentforce de Salesforce
C’est parti !
🔍 Zoom sur l'approche GenAI chez Pigment - 3 min
Ce zoom est tiré de mon échange avec Samya, Generative AI Research Lead chez Pigment, la nouvelle licorne française qui propose une plateforme permettant à toutes les équipes d'une entreprise d'utiliser leurs données pour planifier leur activité.
“C’est un peu Excel mais sous stéroïdes.”
La genèse de l'équipe GenAI
Chez Pigment, ils ont identifié que les entreprises modernes avaient besoin de plus de réactivité et de personnalisation et que c’était notamment ce que l’IA pouvait apporter.
Lorsque les IA Génératives ont émergé il y a 4 ans, ils ont décidé de lancer une équipe Recherche en IA Générative afin de déployer des fonctionnalités dans le produit qui reposent sur ces technologies.
“On a vu le potentiel énorme des IA Génératives, on a identifié les endroits où l’IA allait apporter un maximum de valeur pour définir les fonctionnalités à développer.”
Les fonctionnalités GenAI développées
Text-to-view : Accéder à la donnée en langage naturel
Cette fonctionnalité permet aux utilisateurs d'interroger leurs données en langage naturel, quel que soit l'écran sur lequel ils se trouvent dans Pigment.
"Tu vas pouvoir interpeller la donnée, l'explorer, demander par exemple : montre-moi l'évolution du taux de churn sur les 6 derniers mois en France. Et tu auras un graph avec les données."
Insights : Analyse automatisée des données
Cette fonctionnalité utilise un système multi-agents pour explorer automatiquement toutes les dimensions d'analyse possibles et fournir des explications sur les variations observées.
"Par exemple, tu vois que ton churn est en baisse. Le système va explorer tous les axes d'analyse et te restituer des insights qui expliquent cette baisse."
L'organisation et l'approche de l'équipe
Ils sont plus d’une 15 aine dans l'équipe GenAI appliquée au Produit chez Pigment :
50% de Data Scientists & ML Engineers qui sont responsables des modèles, des prompts et de l'intégration des dernières avancées en termes de LLM
50% de Software Engineers qui pensent les features pour qu'elles soient complètement intégrées dans l’outil, qui maîtrisent parfaitement le back et le front
"On a fait le choix d'avoir une équipe hybride 100% dédiée à la GenAI, composée de Data Scientists, ML Engineers et de Software Engineers. À cela, tu vas ajouter des Product Designers et Product Managers qui accompagnent l'équipe au quotidien.”
La stack technique mise en place
LLM : OpenAI (GPT-4o)
“Dès le début, on a commencé avec GPT-3, 3.5, 4, puis 4o. On a fait nos benchmarks et on était satisfait des résultats d’OpenAI. Donc on a gardé ce provider.”
LLM chaining : LangChain
“On va faire une chaîne de plusieurs LLM spécialisés où chaque sortie sera utile pour affiner la réponse à l'étape suivante. Pour améliorer les performances, on va pouvoir travailler sur une seule brique à la fois, ça permet d’itérer plus rapidement.”
Monitoring : Langfuse
“Les LLMs ne sont pas déterministes. Pour une même question, tu peux avoir des réponses différentes, qui ne sont pas toujours justes. On a besoin d’un monitoring très fin au quotidien. On crée des LLMs qui vont évaluer la qualité des réponses (LLM-as-a-Judge). Ça facilite le travail de monitoring.”
Multi-Agent : LangGraph
“L’objectif pour 2025 est de créer un réseau d’agents. Par exemple, on aura un supervisor responsable de communiquer avec l’utilisateur et de faire appel aux autres agents, puis on aura un agent Data Analyst, un agent qui envoie des notifications Slack, etc. On a fait le choix du système LangGraph, qui est l'évolution de LangChain, mais spécialisé sur les multi-agents.”
🎙 Le podcast avec Samya, Generative AI Research Lead chez Pigment
On aborde :
Son parcours avant Pigment : conseil, Head of Data en startup, recherche
La genèse de l'équipe GenAI (cf. zoom)
Les fonctionnalités développées (cf. zoom)
L'organisation de l'équipe (cf. zoom)
La différence entre les Data Scientists et les ML Engineers
La stack technique (cf. zoom)
Les plus gros challenges : performance vs latence
Le challenge de l’adoption
Les prochaines étapes : systèmes multi-agents
"Le challenge qu'on rencontre et que je pense qu'on rencontre tous en GenAI aujourd'hui, c'est l'équilibre entre la performance et la latence d'un modèle."
Liens vers l’épisode : Apple Podcasts | YouTube | Spotify | Deezer
📚 Les ressources recommandées par Samya
L’épisode de podcast de Lex Friedman DeepSeek, China, OpenAI, NVIDIA, xAI, TSMC, Stargate, and AI Megaclusters
"2 Data Scientists expliquent parfaitement tout le vocabulaire que tu peux entendre autour de la GenAI."
La newsletter Alpha Signal
"C'est un hebdomadaire très bien écrit qui condense toutes les nouvelles sorties, toutes les innovations, toutes les applications en GenAI."
🎙️ Le podcast sur le déploiement d’agents IA avec Agentforce de Salesforce
Guillaume est Ingénieur Solution chez Salesforce et un expert sur le sujet des agents IA. Après l’adoption des LLMs, c’est la nouvelle priorité pour les entreprises. Récemment, Salesforce a lancé un nouveau produit, Agentforce, qui permet de les déployer.
On aborde :
🔥 La genèse d’Agentforce et la différence entre les LLMs et les agents
🔥 L’état actuel du marché et quelques cas d’usage agent IA pour le Retail
🔥 Les étapes pour mettre en place un agent IA (rôle, data, action, garde-fou, canal)
🔥 Les grandes briques d’Agentforce, les utilisateurs et les prérequis
“Les agents ne vont pas seulement répondre à une question que tu vas leur poser, ils vont raisonner. Par exemple, ils peuvent modifier une commande à ta place, et c'est honnêtement pas si simple que ça. Normalement, ce sont des humains qui ont ce raisonnement-là. Maintenant, des agents sont capables de le faire en autonomie.”
Liens vers l’épisode : Apple Podcasts | YouTube | Spotify | Deezer