Gorgias : Déployer le Self-Service Analytics grâce aux IA Génératives
#109 - Le zoom, le podcast avec Elliot et sa ressource préférée
Hello,
Bienvenue dans l'édition #109 de la newsletter DataGen ! 👋
L'agenda de la semaine :
🔍 Zoom sur le déploiement du Self-Service Analytics via les IA génératives
🎙 Le podcast avec Elliot, Senior Data Analytics Engineering Manager chez Gorgias
📚 La ressource recommandée par Elliot
📆 Prochain bootcamp Analytics Engineer le 3 juin
C’est parti !
❤️ Cette édition est rendue possible par Keyrus, le cabinet spécialisé sur la Data & l’IA
J’ai rencontré Brahim qui est VP chez eux et il est venu nous expliquer comment mettre en place une Data Analytics Factory sur le podcast. C’est l'épisode 189.
D’ailleurs, ils ont également rédigé un ebook qui reprend l’approche dans le détail. Pour le télécharger, il suffit de suivre ce lien.
Et si vous souhaitez vous faire accompagner par Brahim et les experts de Keyrus, contactez-le de ma part : brahim.abdesslam@keyrus.com
🔍 Zoom sur le déploiement du Self-Service Analytics via les IA génératives - 4 min
Ce zoom est tiré de mon échange avec Elliot Trabac, Senior Data Analytics Engineering Manager chez Gorgias, la scale-up qui propose une plateforme d'IA conversationnelle permettant aux e-commerçants de mieux gérer leur support client et d'augmenter leurs ventes. Ils ont plus de 15 000 clients.
Le contexte de départ : améliorer la data discovery
En 2024, l'équipe Data de Gorgias s’est concentré sur la mise en place d’un Data Catalog : OpenMetadata.
"L’objectif était d’avoir une visibilité end-to-end de nos assets data (ex : telle table Produit est utilisée pour calculer tel KPI…).”
Selon Elliot, l’outil est top mais l’expérience utilisateur est limitée pour consommer les métadonnées. C’est pour cela qu’ils ont décidé de lancer un 1er POC IA Générative : un Chatbot qui aide les équipes Business à mieux comprendre les données et les dashboards grâce aux métadonnées collectées dans OpenMetadata.
“On 's’est dit qu’une interface conversationnelle serait adaptée pour la data discovery : quel table utilise se dashboard ? Ou est-ce que je peux trouver ce type de dashboard ? Etc.”
Le POC a bien fonctionné et l’équipe Data de Gorgias a décidé d’aller plus loin et de déployer une IA Générative qui réponde aux demandes de data analyse du quotidien.
L'approche en 3 niveaux de leur stratégie Analytics
Le Self-Service Conversationnel via l’IA : un agent IA répond aux questions simples. Ex : quelle est l'évolution du revenu la semaine dernière ?
"Quand un stakeholder a une question ponctuelle, il passe dans un 1er temps systématiquement par l’agent IA. Il peut la poser directement sur Slack.”
Les Dashboards pour les analyses récurrentes et l’exploration : ils permettent de creuser (“drill-down”) des indicateurs.
"Si tu vois un pic surprenant sur un indicateur, tu peux cliquer dessus, ça va te l’exposer sur différentes dimensions, etc. On met en place Omni en outil de Business Intelligence pour cette partie.”
Les Analyses Complexes par les Data Analysts : pour les analyses approfondies nécessitant une expertise Data. Ex : comment est-ce qu'on explique la diminution des performances marketing sur le trimestre dernier ?
“Au lieu d’être dans un mode Dashboarding, on utilise un outil qui s’appelle Hex qui permet d’avoir une approche notebook ou tu vas retrouver l’analyse globale : les requêtes effectuées, les charts et les recommendations.”
La mise en place du Self-Service Conversationnel via l’IA
POC sur la Data Discovery : ils ont développé leur solution en interne.
“Au départ, les outils du marché avaient des limitations et on souhaitait bien comprendre comment ça fonctionnait : infra, vector database, RAG…”
Mise en place d'une solution externe : l’internalisation avait ses limites
“On s’est rendu compte que l’important n’était pas de maintenir sa propre infrastructure, sa vector database et son système de RAG. C’était plutôt de bien documenter, de donner le bon contexte à l’outil, de travailler son Prompt Engineering pour que le LLM interagisse bien avec nos données. On a donc décidé d’utiliser une solution externe.”
Test et sélection de la solution Dott : capacité à affiner les questions et très bonne intégration avec Slack
“On peut traiter aussi bien les questions de Data Discovery “Ou puis-je trouver ce dashboard ?” que des questions de Data Analyse “Quelle est l’évolution du Revenu ? Le gros plus, c’est que l’outil va te poser des questions pour affiner, te montrer le SQL qu’il va générer et te partager le chart directement dans Slack.”
Intégration avec ses données et sa documentation data : pour que le LLM puisse répondre aux questions
“Toutes les descriptions des modèles et des tables sont celles réalisées initialement dans dbt. Elle sont propagées dans BigQuery qui est intégré avec Dott. On récupère également les guidelines data documentées dans dbt (ex : comment réaliser les requêtes sur telle table).”
Création du “Master Prompt” dans Dott : pour partager tout le contexte Business dont le LLM a besoin pour donner des réponses pertinentes
“En plus de la documentation data, on va ajouter des documentations high-level sur le Business, le Produit, l’organisation des équipes... Toutes les informations nécessaires à la réalisation d’analyses data. Finalement, ce sont les mêmes informations que celles qu’on donnerait à un nouveau Data Analyst qui rejoint l’équipe.”
Déploiement progressif
"On a pas essayé de couvrir toutes les questions d'un coup, on se concentre sur des domaines bien identifiés et on les ajoute les uns après les autres. Ça permet de mettre à jour la documentation et le master prompt au fur et à mesure et de maintenir la confiance des utilisateurs.”
Adoption & accompagnement
“Pendant la phase de déploiement sur un domaine. On travaille main dans la main avec des stakeholders pour récupérer du feedback. Lorsqu’on est prêt sur le domaine, on l’annonce sur les channels Slack pertinents. Pour favoriser l’adoption, on montre des exemples.”
🎙 Le podcast avec Elliot, Senior Data Analytics Engineering Manager chez Gorgias
On aborde :
La mission de Gorgias
Le contexte de départ : pourquoi le Self-Service via l’IA générative (cf. zoom)
Leur stratégie Analytics en 3 niveaux (cf. zoom)
Zoom sur Omni : leur nouvel outil de Business Intelligence
La mise en place du Self-Service Conversationnel via l’IA (cf. zoom)
Le gros avantage de ce projet : l’utilisation via Slack et l’Observabilité
L’organisation et l’approche progressive pour déployer
Les plus grosses difficultés : définition des attentes et qualité des réponses
Les prochaines étapes : déployer à l’échelle et optimiser les modèles
"Un des gros avantages de Dott et de l’utilisation via Slack, c’est l’observabilité. Dott te donne l’historique et toutes les questions qui ont été posées. C’est super utile, si tu vois une question qui revient souvent, il y a peut-être un dashboard à créer sur le sujet.”
Liens vers l’épisode : Apple Podcasts | YouTube | Spotify | Deezer
📚 La ressource recommandée par Elliot
La chaîne YouTube de Dave Ebbelaar, fondateur de Datalumina
"Il évangélise vraiment bien et il propose des tutos précis sur les cas d’usage IA Génératives : comment implémenter un RAG, etc. Ça donne des idées et ça permet de comprendre ce qui se passe en dessous."
📆 Prochain bootcamp Analytics Engineer le 3 juin
On a lancé le 1er bootcamp spécialisé sur l’Analytics Engineering en collaboration avec DataBird. Il permet à des profils déjà en poste de devenir Analytics Engineers ou Data Analysts “Full-Stack” (temps partiel pendant 6 semaines, finançable via CPF / OPCO).
Pour en savoir plus, tu peux pouvez écouter l’épisode qu’on a enregistré avec le Co-fondateur de DataBird pour présenter la tendance de l’Analytics Engineering et le programme du bootcamp.
Tu peux aussi découvrir le programme du bootcamp et prendre rendez-vous : Ici