La position de RéGEF dans le paysage des Infrastructures nationales et européennes :

Dans le paysage national des infrastructures rattachées à l’alliance AllEnvi, RéGEF est considérée comme une infrastructure transversale qui apporte un service à des utilisateurs. Ces utilisateurs pouvant être d’autres infrastructures, des Services Nationaux d’Observation (SNO), ou des programmes de recherche.

Cet aspect transversal est fondamental. Pour l’accompagner, la gouvernance de RéGEF va inclure un « Comité d’Utilisateurs » qui aura pour mission de conseiller régulièrement le « Comité Exécutif » et le « Comité de Pilotage » Inter-Organismes vis-à-vis des besoins de la communauté en termes de production de données, ou de développements spécifiques à mettre en œuvre. Ce Comité d’Utilisateurs pourra avoir aussi pour mission à court-terme de mettre au point une stratégie unifiée de (i) gestion des échantillons et (ii) d’identification et de suivi des collections remarquables d’échantillons. Ceci sera idéalement mis en œuvre grâce à des liens avec l’infrastructure ReCOLNAT qui possède un savoir-faire précieux dans ces domaines, ainsi qu’avec les Commissions Spécialisées (CS) de l’INSU qui représentent la diversité de la communauté et de ses besoins.

Concernant le paysage européen des infrastructures de recherche et ses liens avec les infrastructures miroirs nationales, il est bien développé pour les infrastructures du domaine des Sciences de la Terre et de l’Environnement qui ont une activité basée sur l’observation des différents milieux, et pour lesquelles les communautés se sont rassemblées et organisées à ces différentes échelles Nationale et Européenne (i.e. RéSIF/EPOS, OZCAR/E-LTER, ICOS-Fr /ICOS, ACTRIS-Fr/ACTRIS, EMSO-Fr/EMSO, …).

En ce qui concerne les infrastructures « logistiques » et « transversales », ce lien avec des miroirs Européens ou internationaux est moins facile et ces infrastructures n’ont que rarement de miroir Européen ou International, à l’exception des très grands dispositifs (i.e . ECORD/IODP) ou des très grands instruments (CRG-FAME/ESRF). Ceci est vrai pour les infrastructures « logistique » du domaine Terre-Environnement (i.e. FOF, SAPHIRE), mais aussi pour les infrastructures « transversales » du domaine Ernergie (i.e. THEOREM) ou, encore plus comparables à RéGEF, des infrastructures distribuées du domaine Sciences de la Matière Ingénierie (i.e. METSA, RMN-THC, RENARD, FT-ICR, RENATECH).

Comme pour toutes ces infrastructures, le positionnement transversal de RéGEF, avec des missions de service, n’a donc pas vraiment vocation à être rassemblé à l’échelle européenne in extenso. Cependant, individuellement, certains blocs de RéGEF peuvent trouver un grand intérêt à appartenir à des structurations Européenne spécifiques. Par exemple, une partie des activités de RéGEF émarge actuellement dans le Thematic Core Service Multi Scale Laboratories (TCS MSL) d’EPOS, ou encore dans EuroPlanet et EXCITE, sous forme de Transnational Access (TNA). Nous comptons aussi initier des projets rattachés à RéGEF qui pourraient avoir un intérêt fort à être mis en œuvre à l’échelle européenne. Ce pourrait être le cas notamment de la Géochronologie pour laquelle : (i) des formations de pointes d’utilisateurs sont nécessaires et pourraient être envisagées à cette échelle dans le dispositif Networking Activities (NA), (ii) l’accès à certains grands instruments comme les AMS et les SIMS pourrait être ouvert vers les pays du sud sous forme de TNA, (iii) les problématiques de standardisation et de calibration pourraient être envisagées au sein de Joint Research Activities (JRA).

Les relations de RéGEF avec les Infrastructures proches :

Les relations de RéGEF avec DataTerra et l'archivage des données :

Dans le contexte national et international de science ouverte, l’archivage des données produites par RéGEF est un point crucial, qui doit être traité en étroite association avec les tutelles, partenaires, et infrastructures dédiées.

RéGEF est une infrastructure transversale qui mesure et produit des données pour des commanditaires très différents. Une partie est produite pour d’autres IR ou pour des SNO qui ont généralement déjà une politique d’archivage de ces données de documentation ou d’observation des systèmes naturels. Cependant, une grande majorité des données de RéGEF est produite dans le cadre de projets de recherche spécifiques et multiples, pour lesquels la donnée est mesurée, puis exploitée (sous forme de publication), dans un but stratégique bien précis, pour lequel elle répond parfaitement. Ces données « longue traine » qui s’éloignent de la « norme » en étant nombreuses et très spécifiques, peuvent cependant être valorisées une deuxième fois si elles sont archivées de façon assez précise pour participer à la construction d’un modèle global du Système Terre.

Sur ce constat les premières questions qui viennent sont donc : qui doit archiver ces données, le commanditaire ? Ou l’infrastructure transversale qui les mesure ? Une réponse peut être apportée en se posant les questions connexes : quel type d’archivage envisage-t-on : un simple stockage ? Ou une mise à disposition exploitable scientifiquement avec des services associés ?

Une infrastructure transversale qui fournit un service de mesure de la donnée n’est pas qualifiée pour mettre en œuvre, seule, un archivage dans un contexte où celui-ci pourra être exploité scientifiquement. Ceci doit être fait par la communauté scientifique spécialiste de la discipline dans laquelle la donnée pourra être exploitée effectivement. L’archivage des données analytiques produites par RéGEF devra donc être mis en œuvre dans le futur en étroite collaboration avec l’Infrastructure DataTerra, en constituant un entrepôt thématique (ou une collection d’entrepôts thématiques). Par contre, l’infrastructure qui mesure la donnée est la plus qualifiée pour la préparer à l’archivage en la distribuant sous un format « prêt à archiver » de type F.A.I.R. Cependant, là aussi l’association à l’Infrastructure DataTerra sera nécessaire pour définir et affiner la stratégie.

Nos réflexions menées au printemps 2020 dans le cadre de la préparation des Défis 13 et 14 de l’INSU, nous incitent à poursuivre dans cette voie le chantier de l’archivage des données de RéGEF. Pour ceci il va être nécessaire de mener plusieurs actions en parallèle à court-terme :

       (i) travailler sur la mise au point d’un système unique de déclaration des échantillons et de leurs méta-données, qui permettra aux échantillons une identification universelle lors de leur parcours dans les différentes plateformes analytiques, puis lors de leur archivage. Ce point n’est pas spécifique à RéGEF et devra être mise en œuvre en étroite collaboration avec les CS de l’INSU, et/ou d’autre infrastructures (i.e. RECOLNAT).

       (ii) mettre au point au sein de chaque réseau de RéGEF un plan spécifique de gestion de la donnée et des méta-données analytiques de standardisation qui doivent l’accompagner

       (iii) mettre au point un « outil » (suite logicielle) qui permette aux plateformes de RéGEF d’encapsuler facilement la donnée avec ces trois blocs : Métadonnées de l’échantillon + Métadonnées analytique de standardisation + Donnée elle-même, ceci en association avec la vision stratégique et l’appui logistique des partenaires et de DataTerra.

            (iv) constituer au sein de DataTerra un entrepôt spécifique aux données de RéGEF (ou une collection d’entrepôts spécifiques, en lien avec les bases internationales déjà existantes).

Un groupe de travail vient d’être constitué début 2021 pour réfléchir à la mise en place d’un DMP pour le données de RéGEF et à sa déclinaison spécifique pour chacun des 12 réseaux. 

La stratégie de RéGEF pour l'archivage des données :

Stratégie d'archivage des données de RéGEF