Les 10 outils Data & IA à suivre en 2026 👀
#142 - Ou ils se positionnent dans la stack, pourquoi les suivre en 2026 ?
Hello,
Bienvenue dans l’édition #142 de la newsletter DataGen ! 🥳
Pour cette édition spéciale, je t’ai préparé une synthèse de 10 outils Data & IA à suivre en 2026. J'ai étudié chaque outil et reçu un expert de chacun d’entre eux sur le podcast.
J'y détaille :
Où se positionnent ces 10 outils dans la stack data & IA ?
Pourquoi les suivre en 2026 ?
Si tu veux creuser, tu trouveras pour chaque outil le lien vers l’épisode et le LinkedIn de l’expert avec lequel j’ai échangé.
C’est parti !
dbt
🔎 Où il se positionne dans la stack data
dbt est l’outil qui est au centre de la Modern Data Stack. Il permet de transformer la donnée dans le Data Warehouse en utilisant du SQL uniquement ce qui accélère le déploiement des projets data. Le 2nd bénéfice majeur est l’amélioration de la fiabilité des données car l’outil permet de centraliser les transformations et facilite l’adoption des bonnes pratiques de software engineering (ex : tests de qualité).
👀 Pourquoi le suivre en 2026
Jusqu’à 2025, dbt était déjà l’outil le plus mentionné sur DataGen et donc potentiellement le plus adopté. En 2025, dbt a été racheté par Fivetran (un des leaders sur le marché de l’ingestion). Ce nouveau groupe devient un géant de la data qui va concurrencer auprès des grandes entreprises les mastodontes du marché de l’ETL, Extract Transform Load (ex : Informatica).
🎙 Episode #179 avec Jeremy Cohen
Palantir
🔎 Où il se positionne dans la stack data
Palantir est une plateforme data & IA qui permet de mettre en production ses cas d’usage à l’échelle. Leur mission est de concilier la puissance de la data & de l’IA avec la sécurité & la confidentialité des données. Ils ont un positionnement unique sur le marché : plateforme end-to-end (nativement), standards de sécurité très élevés et interopérabilité (i.e. on peut activer que la partie de la plateforme dont on a besoin).
👀 Pourquoi le suivre en 2026
Peu connue du grand public, l’entreprise est utilisée par des acteurs clés dans l’automobile (Stellantis, Forvia), l’aéronautique (Airbus), le secteur bancaire et assurance, ainsi que l’industrie au sens large. Elle est valorisée aujourd’hui presque 400 milliards de dollars.
🎙 Episode #187 avec Agathe Verro
Tableau
🔎 Où il se positionne dans la stack data
Tableau est un outil de Business Intelligence historiquement reconnu pour la qualité visuelle des dashboards qu’on peut construire avec l’outil. Il propose également toutes les fonctionnalités de Data Management nécessaires à la construction de dashboards (ex : préparer les données, les modéliser…).
👀 Pourquoi le suivre en 2026
Tableau a sorti rapidement des fonctionnalités d’IA Génératives qui facilitent l’analyse des données en Self-Service aux Data Analysts et aux profils Business. Par exemple, “Tableau Agent” est un assistant intégré dans l’interface de Tableau qui permet à l’utilisateur de poser des questions et d’explorer la donnée liée aux sources qui sont derrière le tableau de bord.
🎙 Episode #191 avec Yann Tanguy
Agentforce
🔎 Où il se positionne dans la stack data
Agentforce est le nouveau produit de Saleforce qui permet de lancer des agents IA. Pour rappel, un agent IA est capable de raisonner et de mener des actions opérationnelles (appels API). Par exemple, il peut modifier une commande sur un site e-commerce, il va vérifier si la commande n’est pas déjà expédiée, vérifier si mes infos de paiement sont enregistrées puis modifier la commande à ma place.
👀 Pourquoi le suivre en 2026
Le potentiel est énorme, c’est la nouvelle priorité des entreprises les plus innovantes. En 2025, le CEO de Salesforce a expliqué qu’ils avaient investi massivement sur le sujet, avec notamment des milliers de recrutements pour déployer Agentforce. Par ailleurs, avec la base énorme de clients qu’a Saleforce, l’adoption devrait être énorme.
🎙 Episode #197 avec Guillaume Leheuzey
Sifflet
🔎 Où il se positionne dans la stack data
Sifflet est une solution de Data Observability qui apporte de la visibilité sur tout ce qui se passe dans une Data Platform et qui accélère la résolution des problèmes. Les fonctionnalités permettent de détecter les anomalies, analyser les causes et gérer & résoudre les incidents (ex : informations fausses sur un dashboard stratégique).
👀 Pourquoi le suivre en 2026
La donnée est devenue un produit transactionnel. À cause d’une erreur dans une base de donnée, une entreprise peut rencontrer un problème opérationnel coûteux (ex : erreur dans une livraison client) ou passer à côté d’une opportunité financière (ex : mauvaise prévision de stocks). Il y a dorénavant une tolérance zéro pour ces erreurs. Depuis 2021, Sifflet a convaincu de nombreux clients : des grands groupes comme Carrefour, BBC, Saint-Gobain mais aussi par des scaleups comme Dailymotion.
🎙 Episode #204 avec Salma Bakouk
Informatica
🔎 Où il se positionne dans la stack data
Informatica propose une plateforme de Data Management complète qui permet de préparer ses données pour l’Analytics et l’IA. Elle couvre beaucoup de besoins : ingestion & qualité de données, Master Data Management (Vision à 360°) et gouvernance & catalogue de données.
👀 Pourquoi le suivre en 2026
Informatica a été racheté en 2025 par Salesforce pour 8 milliards de dollars. J’ai réalisé à quel point la solution était adoptée en découvrant le montant de leur rachat. De fait, elle est utilisée par énormément d’acteurs : Apple, Tesla, Sanofi… mais aussi par des plus petites structures.
🎙 Episode #210 avec Are Hegdal
Airbyte
🔎 Où il se positionne dans la stack data
Airbyte est un outil d’ingestion moderne et open source qui accélère la mise à disposition des données. Avant, pour créer un KPI, il fallait développer des connecteurs en interne pour récupérer les données des différentes sources (ex : CRM…). Ajourd’hui, Airbyte propose tous les connecteurs prêts à l’emploi : tu peux récupérer la donnée de n’importe quelle source dans ton warehouse en quelques clics. Ils font justement ça grâce à une approche open source, c’est la communauté qui développe et maintient les connecteurs.
👀 Pourquoi le suivre en 2026
Airbyte est l’un des outils modernes leaders du marché. La solution rencontre un succès fulgurant depuis quelques années. Elle est utilisée par énormément de boîtes, et c’est d’ailleurs la solution d’ingestion la plus citée sur DataGen. Leur dernière levée de fonds (2021) s’élevait à 150 millions de dollars valorisant la boite à 1.5 milliards de dollars.
🎙 Episode #215 avec Michel Tricot
Retool
🔎 Où il se positionne dans la stack data
Retool est un outil low code qui permet de déployer beaucoup plus rapidement ses solutions data & IA. L’outil est adopté pour 3 autres raisons : 1/ il permet de passer de la visualisation (BI) à l’action (ex : feedback sur les insights, remontée d’erreurs dans les données), 2/ l’outil est pensé pour les Tech (contrairement au no code) et 3/ il intègre des standards de sécurité élevé (ex : réplication automatique des règles de sécurité d’un Data Lake type Databricks).
👀 Pourquoi le suivre en 2026
La tendance du low code explose dans le secteur de la Data et de l’IA. Retool est déjà massivement adopté par les équipes Data & IA aux US et en Europe. Ils ont convaincu des géants comme OpenAI, Nvidia, Disney aux Etats-Unis ou Pernod Ricard et Decathlon en France. L’entreprise était déjà valorisée 3.2 milliards de dollars lors de leur dernière levée en 2022. Récemment, ils ont accéléré sur l’IA et permettent d’intégrer des agents IA directement dans ses solutions Data & IA.
🎙 Episode #222 avec Alexis Ego
Denodo
🔎 Où il se positionne dans la stack data
Denodo est la solution de virtualisation de données qui permet d’accélérer le time-to-market de ses projets Data & IA. Le problème qu’ils résolvent est simple. Les données sont distribuées dans plein de sources (data lakes, on-prem…). L’approche traditionnelle est de centraliser les données en lançant des chantiers de migration longs et coûteux. Avec Denodo, au lieu de répliquer la donnée, tu te connectes directement aux sources et exécutes des requêtes distribuées (une requête SQL appelle simultanément des données dans ton data lake cloud et on prem).
👀 Pourquoi le suivre en 2026
Denodo facilite l’adoption d’une approche multi-cloud et renforce la souveraineté des entreprises (moins de “vendor lock-in”). En 2026, la souveraineté est un enjeu crucial pour les entreprises. Par ailleurs, Denodo est peu connu du grand public mais est un acteur majeur. Ils ont levé 330 millions de dollars en 2023 et sont utilisés par presque un tiers du CAC 40, notamment la BNP, Total Energies ou le Crédit Agricole.
🎙 Episode #230 avec Olivier Tijou
Adobe
🔎 Où il se positionne dans la stack data
Adobe est un éditeur qui propose de nombreuses solutions et notamment des solutions data & IA pour le Marketing : création de visuels via IA Générative (Adobe Firefly), hébergement de visuels (Adobe Experience Manager Assets), Data Plateform (Adobe Real-Time Customer Data Platform), activation marketing (Adobe Campaign) et analyse de données (Adobe Analytics).
👀 Pourquoi le suivre en 2026
Pour leurs campagnes marketing, les grandes entreprises créent des milliers “d’assets” pour tous les canaux (sites web, réseaux sociaux, offline…) et tous les contextes (pays, langues, saisons…). Adobe permet de les décliner automatiquement via des fonctionnalités GenAI type Adobe Firefly.
🎙 Episode #241 avec Kévin Bourlier
Omni (bonus 🎁)
🔎 Où il se positionne dans la stack data
Omni est un outil de Business Intelligence qui est arrivé sur le marché en 2022 avec une vision précise : réconcilier les outils robustes (comme Looker), excellents pour la modélisation de données et la gouvernance, avec des outils plus légers (comme Metabase), mieux adaptés aux analyses rapides (type Excel) et aux requêtes SQL. Omni rassemble ces usages dans un seul outil.
👀 Pourquoi le suivre en 2026
Omni a connu une adoption rapide ces dernières années. En 2025, Omni a levé 69 millions de dollars et a atteint une valorisation de 650 millions de dollars. De nombreux leaders data choisissent désormais d’abandonner leurs outils de BI traditionnels au profit d’Omni. Par ailleurs, avec le Semantic Layer qu’ils ont développé, le cas d’usage IA “chat with your data” fonctionne.
🎙 Episode #247 avec Colin Zima (en anglais, Colin est Américain)
🤝 DataGen, c’est aussi un collectif de freelances data issus des plus belles boîtes
Grâce à DataGen, on a réuni une team de 250 freelances data, que des top profils expérimentés et issus des plus belles boîtes (BlaBlaCar, Decathlon, Critéo, Artefact, 55...) pour délivrer des projets data & IA.
On travaille avec une 30aine de clients (Decathlon, l’Ecole 42, Printemps...).
Travailler avec nous : ici











