Uber : la boîte les plus data-driven au monde ? Avec Marie-Camille, ex-Data Science Manager
#146 - Le zoom, le podcast avec Marie-Camille, sa ressource préférée et les 3 tendances Data Analytics de 2026 à connaître
Hello,
Bienvenue dans l’édition #146 de la newsletter DataGen ! 👋
L’agenda de la semaine :
🔍 Comment Uber est devenue l’une des boîtes les plus data-driven au monde ?
🎙 Le podcast avec Marie-Camille, ex-Data Science Manager chez Uber
📚 La ressource recommandée par Marie-Camille
🎙 Les 3 tendances Data Analytics de 2026 à connaître
C’est parti !
🔍 Comment Uber est devenue l’une des boîtes les plus data-driven au monde ? - 4 min
Ce zoom est tiré de mon échange avec Marie-Camille, qui a passé neuf ans chez Uber dans la Silicon Valley. Elle est arrivée en 2016 en tant que Data Scientist avant d’être promue Data Science Manager. Elle a vu de près comment Uber est devenue l’une des boîtes les plus data-driven au monde.
Son arrivée chez Uber dans la Silicon Valley
Après un parcours assez classique en France (prépa puis les Ponts), Marie-Camille part faire un master en recherche opérationnelle à Berkeley avant de rejoindre Uber.
“L'ambiance et la culture très tech de la Silicon Valley m'ont beaucoup plu. J'ai rapidement su que j'allais rester.
Le projet de lutte contre la fraude sur lequel elle a travaillé
En 2020, Marie-Camille rejoint l’équipe Uber for Business. À cette époque, le taux de perte dû à la fraude est proche de 4%, ce qui représente des sommes considérables.
Les fraudeurs piratent les comptes d’entreprises et vendent des trajets au marché noir à prix réduits. Ils ciblent des comptes qui dépensent des centaines de milliers de dollars par mois pour que la fraude passe inaperçue le plus longtemps possible.
L’équipe a commencé par des algorithmes simples (détection d’anomalies spatiales, vérification des noms suspects) puis a développé des systèmes plus sophistiqués basés sur des structures de graphes.
Résultat : le taux de perte est passé de 4% à 1%.
“On a développé plusieurs algorithmes pour détecter la fraude. Les fraudeurs sont très intelligents et vont toujours trouver de nouvelles failles. C’est un cycle sans fin : ils ouvrent une faille, tu la bouches, ils ouvrent une faille, tu la bouches.”
Le moment où elle a failli se faire virer
À cette époque, Marie-Camille avait changé d’équipe et travaillait pour une startup qui avait été rachetée par Uber : Jump (micro-mobilité, e-bikes et e-scooters).
Pendant le COVID, comme pas mal de boîtes tech, Uber a licencié beaucoup de monde dont la majorité des salariés de cette startup Jump.
“Ça c’est passé du jour au lendemain : c’était un call à 8h du matin, un jeudi, ils ont annoncé aux quasi 500 personnes qui bossaient pour Jump qu’elles étaient virées. J’ai eu du bol, on était une petite vingtaine à ne pas être virée. Les US, c’est sans pitié. ”
Finalement, Marie-Camille a réintégré la maison mère d’Uber et a pris un rôle de Data Science Manager. Sur les années suivantes, elle a encadré jusqu’à 18 Data Scientists.
L’organisation tech & data chez Uber
Uber, c’est une grosse boîte avec environ 25 000 employés. Côté tech (construction d’app, algorithmes, produit), il y a environ 6 000 personnes et les équipes Data Science sont intégrées dans ces équipes tech.
“Il y a environ 200 Data Scientists chez Uber, peut-être un peu plus.”
Ce qui rend Uber vraiment data-driven
De manière générale, Uber travaille énormément sur la mesure d’incrémentalité. L’objectif est de déterminer si une nouvelle initiative ou une décision a un impact positif et apporte un incrément de valeur mais dans des contextes où on ne peut pas réaliser d’AB tests (trop de complexité, de manque à gagner…).
C’est là que le rôle de l’équipe Data Science est clé car il faut développer des modèles qui prennent ces décisions.
“Pendant mes neuf ans chez Uber, j’ai vu une énorme évolution, beaucoup de décisions qui étaient prises manuellement sont maintenant prises par des algos.”
3 facteurs ont accéléré l’adoption des algorithmes selon Marie-Camille :
1) Le niveau de scale : des dizaines de millions de trajets par jour et l’ambition d’atteindre le milliard d’utilisateurs rendent les optimisations impossible à gérer manuellement.
2) La marche vers la rentabilité : entre 2019 et aujourd’hui, Uber a dû faire toujours plus avec moins de personnes. Les algorithmes sont devenus indispensables.
3) Beaucoup de confiance dans la Data Science : l’entreprise au global accorde beaucoup de crédibilité à l’équipe Data Science car l’impact des algorithmes a été prouvé des 10aines de fois. Par ailleurs, tous les collaborateurs ont une appétence tech.
🎙 Le podcast avec Marie-Camille, ex-Data Science Manager chez Uber
On aborde :
Son parcours des Ponts à Berkeley puis Uber
La vie à San Francisco et dans la Silicon Valley
Le projet de lutte contre la fraude
Le moment où elle a failli se faire virer
Son passage de Data Scientist à Data Science Manager
L’organisation tech & data chez Uber
Ce qui rend Uber vraiment data-driven
Sa vision sur le “build vs buy”
“Les fondateurs étaient très orientés maths et tech, notamment Travis. Et les équipes le sont aussi. Bien sûr, tout le monde n’est pas ingénieur mais tout le monde a cette appétence tech.”
Liens vers l’épisode : Apple Podcasts | YouTube | Spotify
📚 La ressource recommandée par Marie-Camille
Le podcast High Signal
“Un ancien collègue d’Uber a créé un podcast, plus récent que le tien, très orienté Data Science et version San Francisco.”
🎙 Les 3 tendances Data Analytics de 2026 à connaître
J’ai reçu Henri-François Chadeisson (HF) qui est expert data depuis 20 ans et qui est aujourd’hui Solution Engineering Director Europe chez Strategy Software (ex-MicroStrategy). Strategy est une solution de BI, de Semantic Layer et d’IA qui est valorisée plus de cinquante milliards de dollars et qui est utilisée par des groupes comme Société Générale, Monoprix ou Leclerc.
Dans cet épisode, on aborde les 3 grandes tendances Analytics du moment :
#1 - L’accélération de la mise à disposition des données : contexte macro-économique, décentralisation, “chaos analytique”, GenAI…
#2 - L’émergence des Semantic Layer Universels : agnostique des outils de Business Intelligence et multi-cloud
#3 - Le cas d’usage IA “chat-with-your-data” : agents conversationnels branchés sur le Semantic Layer qui répond aux questions data
Comment les solutions de Strategy Software s’intègrent dans ces tendances (ex : Mosaic, le Semantic Layer universel)
“Un semantic layer, c’est une couche entre ta data et tes usages. Tu pars de ta data brute et tu la transformes en langage métier exploitable par un utilisateur fonctionnel. La spécificité d’un Semantic Layer universel, c’est qu’au lieu d’être intégré dans un outil de reporting, il est transverse et exploitable pour tous les usages (dashboards, IA, requêtes…).
Liens vers l’épisode : Apple Podcasts | YouTube | Spotify

