Journée scientifique de la Plateforme Imageries du Vivant de Paris Descartes
7 déc. 2017 Paris (France)

Descriptif

Gestion des données scientifiques en imagerie in vivo

La gestion des données scientifiques est un élément moteur de la connaissance scientifique reconnu par de nombreuses instances nationales et internationales (Inserm [1], NIH [2], Horizon H2020 [3], FORCE11 [4], …). Elle est appelée à prendre une importance aussi grande dans la recherche en imagerie in vivo que celle qu’elle occupe en imagerie médicale.

Comme d’autres domaines de la connaissance, l’imagerie médicale constitue de grands dépôts de données consultables par la communauté scientifique [5] qui deviennent à leur tour de nouveaux matériaux d’études. A ces dépôts de données s’ajoutent de nouveaux types de ressources accessibles à la communauté : bases de connaissances pédagogiques et scientifiques, incluant formations et contenus d’articles en lignes [6], ressources matérielles pour le stockage et le calcul intensif par grilles de calcul [7][8] ressources en logiciels partagés, avec de nombreux outils libres ou payants dédiés aussi bien à l’analyse des données et à la mise en œuvre de travaux collaboratifs qu’à la structuration des données en vue de leur consultation ultérieure et de leur archivage [9][10].

L’écosystème scientifique de l’imagerie in vivo est en pleine mutation : pour l’utilisateur un nouveau substrat pour la recherche, et pour le producteur de nouveaux formats numériques d’édition scientifique, dûment identifiés et intégrables comme objets de citation (DOI). L’écosystème en devenir permettra de travailler sur des masses de données bien supérieures aux capacités de production de chaque centre de recherche, réalisant un changement d’échelle avec optimisation des ressources (humaines, animales, financières, temporelles…), et limitant la volatilité des données post-publication. Dans cet écosystème, le croisement d’informations ouvre de nouvelles perspectives de pratique de la recherche.

La mise à disposition des résultats d’études à leurs différents stades d’avancement, permet d’augmenter la reproductibilité des données, donc leur crédit. Cette valorisation implique un effort éditorial pour rendre lisibles les données et les méthodes. Que ce soit pour un usage interne ou pour un dépôt public, cet effort s’ajoute à celui investi lors d’une publication classique dans une revue scientifique. La structuration des données et des pratiques, en vue d’un archivage efficace, rejoint les questions de transparence, de bonne gestion et de qualité. Elle tend à encourager rigueur scientifique et diffusion de l’état de l’art. Accéder aux informations à leur source permettra des méta-analyses de meilleure qualité et de plus grande valeur.

L’évolution en cours pose des questions très concrètes : quelles règles et quelles bornes établir dans les partages de ressources ? A qui appartiennent-elles ? Qui est compétent pour les gérer ? Quelle formation pour les acteurs ? S’agit-il d’un nouveau cœur de métier ? Quels sont les risques associés à la transparence ? Quelle sera l‘acceptabilité de cette évolution par ses acteurs ? A quelle échelle structurer l’activité ? A quel niveau devront se prendre les décisions ? Quel équilibre entre l’investissement et la valeur ajoutée ?  Quel sera le coût associé à cette nouvelle structuration ?

[1] Inserm Workshop 246 : Management and Reuse of health data : methodological issues [2017]

[2] NIH : https://datascience.nih.gov/index

[3] H2020 Programme : Guidelines on FAIR Data Management in Horizon 2020

[4] FORCE11 : https://www.force11.org/about

[5] TCGA Data Portal : https://cancergenome.nih.gov/

[6] MOOCS : https://mooc-francophone.com/ ; Coursera

[7] Grilles de calculs : http://in2p3.fr/ ; www.france-grilles.fr/acceuil/

[8] Grille du CERN http://home.cern/fr/about/computing/worldwide-lhc-computing-grid

[9] PACS : https://en.wikipedia.org/wiki/Picture_archiving_and_communication_system

[10] Gestion: https://fr.wikipedia.org/wiki/Management_du_système_d’information

 

Les acteurs de l’imagerie préclinique sont impliqués depuis plusieurs années dans des démarches de structuration des résultats de leur activité. Les enjeux pour les centres de production concernent la mise à disposition des données et leur sécurisation, la mise en place de bases de données massives impliquant des données à la fois variables et évolutives. Une démarche organisationnelle (DRIVE), fondée sur les outils industriels du Product Life cycle Management (PLM) est en cours dans l’environnement de la plateforme d’imageries du vivant de l’Université Paris Descartes pour améliorer les échanges et la structuration à l’échelle locale. Un autre enjeu concerne la capacité des acteurs d’imagerie à partager des données, des outils matériels et logiciels d’analyse, ainsi que des ressources informatiques, pour constituer des dépôts. Cette démarche est en cours actuellement dans le cadre du regroupement des universités (projet interdisciplinaire d’Imageries du Vivant), avec l’achat de ressources matérielles, la mise en place de machines virtuelles (Cumulus) et la constitution d’une preuve de concept de dépôt multimodal. A plus grande échelle les plateformes d’imagerie se structurent (FLI, Ibisa) en vue d’une amélioration et d’une homogénéisation des pratiques (qualité, traçabilité).

Ces démarches confirment que la gestion des données scientifiques est d’actualité dans les communautés de l’imagerie.  La plateforme d’Imageries du Vivant de l’Université Paris Descartes convie tous les acteurs de la recherche en imagerie à une journée de réflexion autour de la thématique de la Gestion des données scientifiques en imagerie in vivo.

Elle aura lieu le 7 décembre 2017  au Centre de Recherche Cardiovasculaire de Paris PARCC @ Hôpital Européen Georges Pompidou.

Personnes connectées : 1