Détecter le cancer grâce à l'IA avec Therapixel
#49 - Le zoom, le podcast, la ressource de Yaroslav et le podcast sur une masterclass Modern Data Stack
Hello,
Bienvenue dans l’édition #49 de la newsletter DataGen ! 👋
📢 Cette édition est rendue possible par Rivery, l’ETL qui bouscule le marché
J'ai découvert Rivery lors d'un live que j'avais organisé avec l'équipe data de BlaBlaCar et dans l'épisode que j'ai fait récemment avec Welcome to the Jungle.
Participez au tirage au sort pour gagner des AirPods en répondant à ce questionnaire sur le marché de l'ETL en France (2 min). 🎁
On partagera les réponses du sondage aux participants. 😉
🔍 Zoom sur Therapixel, la pépite française qui détecte le cancer grâce à l’IA - 4 min
Ce zoom est tiré de mon échange avec Yaroslav qui est Head of AI chez Therapixel, la pépite française qui détecte le cancer grâce à une IA qui analyse des radios médicales. Ils ont levé 15 millions d’euros en 2022 et sont déjà implantés dans une quarantaine d’hôpitaux.
La genèse de Therapixel
Créée en 2013 par 2 anciens chercheurs de l’Inria, la startup proposait initialement une solution de visualisation d’images médicales à destination des chirurgiens.
En 2016, ils ont recruté un premier chercheur spécialisé en IA (Yaroslav) et ont participé à un concours sur la détection du cancer du sein. Ils gagnent la 1ère place et décident de développer un produit qui réponde à ce problème spécifique.
“On a également obtenu la 5ème place sur un challenge lié à la détection du cancer du poumon. Mais on a décidé de concentrer nos ressources sur l'analyse des mammographies afin de sortir un vrai produit.”
Le parcours de Yaroslav pour devenir Head of AI
- License à Moscou (Computer Science and Applied Mathematics)
- Polytechnique à Paris (Computer Vision, Image Treatment, Machine Learning)
- ENS Cachan (Mathématiques Vision Apprentissage)
- Research Intern (Siemens Corporate Research, département Computer Vision)
- Research Intern (Philips Healthcare, Deep Learning for Medical Imaging)
- Research Scientist (Therapixel) - 2 years
- Senior Research Scientist (Therapixel) - 3 years
- Head of AI (Therapixel, équipe de 7 Research Scientists) - 2 years
Comment la solution fonctionne ?
Dans de nombreux pays, les femmes vont à l’hôpital réaliser une mammographie vers 45-50 ans pour prévenir les cancers du sein.
Les radios sont stockées dans un système informatique déjà existant de l'hôpital qui réunit toutes les images médicales. La solution d’IA de Therapixel est connectée à ce système afin que les images soient analysées le plus vite possible. Ensuite, le résultat est envoyé sur l’ordinateur du radiologue.
Par ailleurs, Therapixel développe également des extensions qui viennent compléter le produit principal :
- en caractérisant des lésions (éléments visibles sur la radio) pour que le radiologue n’ait plus qu’à valider les descriptions de texte proposées.
- en facilitant la comparaison de 2 images prises sur une même patiente à 1 ou 2 ans d’intervalle afin d’analyser comment les choses évoluent.
L’organisation des équipes chez Therapixel
- L'équipe IA : elle a développé l’algorithme dans un premier temps et le produit IA plus globalement dans un second temps.
- L’équipe Data : elle se spécialise sur le collaboration avec les hôpitaux pour récupérer les données.
“Il y a de nombreuses étapes : négocier les termes, récupérer les données, les préparer, les anonymiser et assigner la vérité terrain avec les radiologues partenaires (valider s’il y a eu cancer ou non pour chaque radio).”
- L’équipe Dev : elle reprend la solution développée par l’équipe IA et la complète afin que celle-ci soit intégrée au système informatique de l’hôpital, que les radios soient analysées automatiquement et que les résultats soient envoyés sur les ordinateurs des radiologues.
- L’équipe Qualité : elle s’assure que les audits de sécurité se passent bien. Il y en a régulièrement car Therapixel manipule des données très sensibles.
- L’équipe Clinique : elle démontre l’intérêt de la solution sur des échantillons représentatifs pour démontrer l’impact de cette IA et ensuite publier des articles dans des journaux spécialisés pour les radiologues.
“Les professionnels de la santé parlent un autre langage et ne vont pas facilement comprendre les arguments des Data Scientists. Il faut donc réaliser des études qui suivent les standards de l'industrie de la radiologie et non de la Data Science.”
- L’équipe Commerciale : elle a été créée assez tôt mais est surtout en croissance aujourd’hui car Therapixel scale son business.
🎙 Le podcast avec Yaroslav, Head of AI chez Therapixel
Découvre l'intégralité de notre échange avec Yaroslav.
On aborde également :
Les outils qu’ils utilisent chez Therapixel (ex : TensorFlow, Docker)
Ses plus gros challenges en tant qu’Head of AI
Les prochaines étapes pour Therapixel
Dans quelle mesure les nouvelles IA génératives telles que ChatGPT constituent un risque pour les startups IA.
Liens vers l’épisode : Apple Podcasts | YouTube | Spotify | Deezer
📚 La ressource recommandée par Yaroslav
“C’est un livre écrit par l’ancien CEO de Ford et de Chrysler. Tu comprends vraiment ce qu’est la R&D.”
🎙 Le podcast sur une masterclass Modern Data Stack avec Matthieu Rousseau
Matthieu Rousseau est un expert en Data Engineering et a lancé Modeo, un cabinet de conseil spécialisé sur la mise en place de Modern Data Stack.
On aborde :
La différence entre une stack traditionnelle et une Modern Data Stack,
Les étapes pour la mettre en place : Audit, Data Warehouse, Ingestion, Orchestration, Transformation, etc.
Les difficultés lorsqu’on met en place une stack data : la mesure de l’impact et de l’usage,
Les conseils de Matthieu pour mettre en place adopter une Modern Data Stack.
Liens vers l’épisode : Apple Podcasts | YouTube | Spotify | Deezer