Nicolas Garcelon

Plateforme Data science

Publié le 30.04.2020

Présentation

L'équipe "science des données" a été créée à l'institut Imagine en 2012, et a été labellisée plate-forme de science des données en 2017.

 

La plateforme est composée de trois ingénieurs en informatique. La plateforme développe des méthodes pour accélérer la recherche translationnelle entre les médecins et les chercheurs, entre l'hôpital et l'institut. Nous créons des logiciels permettant le stockage et l'analyse des données phénotypiques des patients.

 

Bases de données phénotypiques et génétiques

L'objectif est d'aider les chercheurs et les cliniciens à collecter, mettre en commun, structurer, maintenir et sécuriser les données des patients pour des études locales, nationales ou internationales. Nous avons développé le logiciel "eCohorte" pour mettre en place rapidement une base de données contenant tous les outils nécessaires à la saisie et à la récupération des données. Nous gérons aujourd'hui 82 bases de données avec un total de 131 000 patients. Une grande partie de ce travail implique également la récupération et le chargement automatisés de données rétrospectives.

 

Les outils transversaux

Nous avons développé plusieurs outils pour les chercheurs, les cliniciens et les gestionnaires : BioPancarte pour la visualisation personnalisée des résultats de laboratoire, Auxo pour la création de courbes de croissance, Gecko pour la gestion des études cliniques et des inclusions de patients, Gene2CT pour le suivi automatique des essais cliniques associés à des mutations génétiques, etc. Ces logiciels sont déposés à l'Agence de protection des programmes.

 

Entrepôt de données biomédicales

Nous avons développé Dr. Warehouse, un entrepôt de données biomédicales qui intègre des données en texte libre (hospitalisation, consultation, rapports de prescription, etc.) ainsi que des données codées (résultats biologiques). Dr Warehouse est mis en place à l'hôpital Necker-Enfants Malades. Nous avons intégré 4 millions de documents provenant de 20 sources différentes (EHR, bases de données biomédicales) de 1996 à 2017 pour 480 000 patients. Il contient également 36 millions de résultats biologiques. Les principales fonctionnalités sont de pouvoir rechercher des patients à l'aide d'un moteur de recherche "Google like", de pouvoir effectuer des descriptions phénotypiques automatiques et de proposer des outils d'aide au diagnostic par calcul de similitude entre patients. L'interface de Dr. Warehouse fournit aux médecins des outils ergonomiques pour explorer les dossiers médicaux afin d'accélérer le recrutement des patients dans les études cliniques. Dr Warehouse est désormais également publié sous licence GNU GPL (open source License).

Chiifres clé

    700 000 patients 7 millions de comptes rendus

    35 millions de phénotypes extraits +1000 études réalisées sur Dr Warehouse