2004 : l'Institut Curie lance la numérisation des dossiers médicaux de ses patients. 2017 : il est le premier centre à ouvrir un département entièrement dédié aux data. Aujourd'hui, ses datas centers ne contiennent pas moins de 5 pétaOctets de données, issues de 500 000 dossiers médicaux. Chacun d'entre eux contient l'histoire du patient, ses examens génomiques, biologiques et d'imagerie. Une mine d'informations impossible à analyser de façon traditionnelle. « Notre mission est de développer des outils pour agréger les data des patients et faire en sorte qu'elles soient au cœur de la stratégie de traitement », explique Xosé Fernandez, directeur du département data à Curie. Dans notre équipe, de 12 personnes, trois sont médecins pour aider à comprendre les besoins ».
Encore faut-il capturer correctement les données issues du dossier médical. Il s'agit d'un travail à part entière. « Pour extraire les bonnes informations, la connaissance du contexte est fondamentale, détaille Xosé Fernandez. Savoir qui a écrit, par exemple un oncologue ou un anatomopathologiste, peut changer le sens ».
Le consentement pour l'utilisation des données pour la recherche est demandé pendant le soin, dès le début de la prise en charge. Toutefois, « l'information ne se limite pas au consentement, explique X. Fernandez. Les médecins expliquent dans quels projets de recherche vont être utilisées les données anonymisées, mais toujours dans le contexte de la cancérologie. Les refus sont très rares ».
Pour développer des intelligences artificielles capables de lire des scanners et identifier des tumeurs, par exemple, les chercheurs utilisent l'apprentissage profond (machine learning). Celui-ci consiste à fournir à la machine un nombre considérable d'images de patients afin qu'elle s'« entraîne » à reconnaître des cellules cancéreuses par exemple. Elle peut même en extraire des signaux impossibles à distinguer à l'oeil nu. L'Institut a noué des partenariats avec des start-up comme Owkin pour les images numérisées de lames d'anatomopathologie et des industriels, par exemple IBM pour les données d'imagerie. « Les images restent à Curie, rassure Xosé Fernandez. Nos partenaires entraînent leurs systèmes à partir d'un serveur sécurisé auquel ils se connectent. C'est l'algorithme qui bouge, pas les images ».
De plus, alors que l'Institut Curie a créé la plate-forme SeqOIA aux côtés de l'AP-HP et de Gustave Roussy pour enregistrer les données de séquençage du génome, le partage de ces données au niveau national et supranational permettra d'entraîner des algorithmes. Près de 18 000 génomes sont séquencés chaque année, l'objectif étant d'en totaliser 100 000 en 2022.
Article précédent
Les agences du médicament inventent l'évaluation 2.0
Article suivant
La start-up Embleema développe le partage sécurisé des données en vie réelle
Les agences du médicament inventent l'évaluation 2.0
L'Institut Curie mise sur les données patients
La start-up Embleema développe le partage sécurisé des données en vie réelle
Transition de genre : la Cpam du Bas-Rhin devant la justice
Plus de 3 700 décès en France liés à la chaleur en 2024, un bilan moins lourd que les deux étés précédents
Affaire Le Scouarnec : l'Ordre des médecins accusé une fois de plus de corporatisme
Procès Le Scouarnec : la Ciivise appelle à mettre fin aux « silences » qui permettent les crimes