L'Institut Curie mise sur les données patients

Par

Publié le 08/04/2019

Article réservé aux abonnés

Data
Crédit photo : Phanie

2004 : l'Institut Curie lance la numérisation des dossiers médicaux de ses patients. 2017 : il est le premier centre à ouvrir un département entièrement dédié aux data. Aujourd'hui, ses datas centers ne contiennent pas moins de 5 pétaOctets de données, issues de 500 000 dossiers médicaux. Chacun d'entre eux contient l'histoire du patient, ses examens génomiques, biologiques et d'imagerie. Une mine d'informations impossible à analyser de façon traditionnelle. « Notre mission est de développer des outils pour agréger les data des patients et faire en sorte qu'elles soient au cœur de la stratégie de traitement », explique Xosé Fernandez, directeur du département data à Curie. Dans notre équipe, de 12 personnes, trois sont médecins pour aider à comprendre les besoins ».

Encore faut-il capturer correctement les données issues du dossier médical. Il s'agit d'un travail à part entière. « Pour extraire les bonnes informations, la connaissance du contexte est fondamentale, détaille Xosé Fernandez. Savoir qui a écrit, par exemple un oncologue ou un anatomopathologiste, peut changer le sens ».

Le consentement pour l'utilisation des données pour la recherche est demandé pendant le soin, dès le début de la prise en charge. Toutefois, « l'information ne se limite pas au consentement, explique X. Fernandez. Les médecins expliquent dans quels projets de recherche vont être utilisées les données anonymisées, mais toujours dans le contexte de la cancérologie. Les refus sont très rares ».

Pour développer des intelligences artificielles capables de lire des scanners et identifier des tumeurs, par exemple, les chercheurs utilisent l'apprentissage profond (machine learning). Celui-ci consiste à fournir à la machine un nombre considérable d'images de patients afin qu'elle s'« entraîne » à reconnaître des cellules cancéreuses par exemple. Elle peut même en extraire des signaux impossibles à distinguer à l'oeil nu. L'Institut a noué des partenariats avec des start-up comme Owkin pour les images numérisées de lames d'anatomopathologie et des industriels, par exemple IBM pour les données d'imagerie. « Les images restent à Curie, rassure Xosé Fernandez. Nos partenaires entraînent leurs systèmes à partir d'un serveur sécurisé auquel ils se connectent. C'est l'algorithme qui bouge, pas les images ».

De plus, alors que l'Institut Curie a créé la plate-forme SeqOIA aux côtés de l'AP-HP et de Gustave Roussy pour enregistrer les données de séquençage du génome, le partage de ces données au niveau national et supranational permettra d'entraîner des algorithmes. Près de 18 000 génomes sont séquencés chaque année, l'objectif étant d'en totaliser 100 000 en 2022.

Dr Irène Drogou

En complément