L'ORD, en pratique
Introduction
Ce guide a pour vocation de répondre aux problèmes pratiques que les équipes de recherche rencontreront dans leurs projets.
Pour toute interrogation, vous pouvez aussi directement contacter votre data steward.
-
Obligations légales
- Cadre juridique suisse sur la protection des données
Les données doivent respecter le cadre juridique suisse, notamment la loi fédérale sur la protection des données et la loi fédérale relative à la recherche sur l’être humain. Pour plus d’informations, consulter cet article.
En cas de collaboration avec des équipes européennes, consulter le RGPD.
- Exigences des financeurs
De nombreux acteurs de la recherche, en Suisse et en Europe, soutiennent activement le mouvement d’ouverture de la science. Le Fond National Suisse exige ainsi des équipes de recherche la rédaction d’un Data Management Plan, qui peut évoluer au cours du projet ; sa version finale doit être rendue à la fin du projet de recherche. Par ailleurs, le SNF demande aux chercheurs que les données de recherche soient diffusées et accessibles dans des entrepôts de données publics.
-
Le Data Management Plan
Le Data Management Plan (DMP) est un document qui décrit comment vont être gérées les données produites durant un projet de recherche, depuis leur création jusqu’à leur diffusion. Il est rédigé à titre planificateur au début du projet, mais peut évoluer par la suite si cela est nécessaire.
Le DMP doit répondre à un certain nombre de question, regroupées en quatre catégories.
- Collecte :
- Type de données collectées (formats, volumes…)
- Modalités de collecte des données
- Documentation accompagnant les données
- Aspects éthiques et légaux :
- Gestion des aspects éthiques
- Sécurité des données
- Propriété intellectuelle et droits d’auteurs
- Gestion des fichiers :
- Stockage et sauvegardes pendant la recherche
- Préservation des données
- Partage :
- Modalités et lieu de diffusion des données
- Limitations éventuelles dans l’accès aux données
En définissant les réponses à ces questions en amont du projet de recherche, le DMP permet d’anticiper d’éventuelles situations problématiques.
Pour rédiger votre Data Management Plan :
- Consulter le document officiel du SNF.
- L'Unine met à votre disposition un modèle de Data Management Plan prêt à être rempli.
- Plusieurs outils peuvent vous aider à rédiger votre DMP sans partir de zéro, et mettent à disposition un grand nombre de DMP publics :
Et si vous avez besoin d'aide pour comprendre, rédiger ou faire relire votre DMP, le data steward est là pour vous.
- Collecte :
-
La gestion de données au cours du projet
Cette partie a pour but de vous fournir quelques bonnes pratiques dans la gestion de vos données durant votre projet de recherche, et ainsi à remplir les parties correspondantes du DMP.
- Back-up et stockage : tout au cours de votre recherche, les données doivent être stockées sur un support défini et des procédures de sauvegardes entreprises. Parmi les supports possibles :
- Serveurs institutionnels (recommandé)
- Ordinateur professionnel
- Disque dur externe (solution temporaire, en cas de récolte sur le terrain)
- Gestion des accès et sécurité :
- Lister les personnes ayant accès aux fichiers.
- Modalités de partage : éviter les PJ en mail ou les outils privés comme google drive, privilégier des outils institutionnels de transfert de fichiers comme Switch Filesender.
- Mesures de sécurité (si nécessaire) : encrypter les données, accès par mot de passe
- Gestion des données personnelles (en cas d’études sur l’être humain) : gestion de l'anonymat, collecte des formulaires de consentement.
- La lecture du guide sur l'anonymisation du FORS est recommandée.
- Organisation des fichiers et versioning :
- Adopter une nomenclature fixe pour nommer les fichiers
- Intégrer la question des versions dans le nommage (utiliser des numéros de fichier, ou les date/heure de création)
- Documenter les fichiers à l’aide de fichiers readme : contextualiser aussi bien pour les autres collaborateurs, que parce que l’on peut soit même oublier des choses.
- Pour plus d'informations : consulter la partie correspondante du guide du CESSDA sur le data management
- Back-up et stockage : tout au cours de votre recherche, les données doivent être stockées sur un support défini et des procédures de sauvegardes entreprises. Parmi les supports possibles :
-
Partager mes données
Cette partie vise à vous aider à planifier l'archivage et la diffusion de vos données, et renseigner les parties correspondantes dans le DMP.
- Que diffuser de mes données ?
Théoriquement, on doit respecter la formule « Aussi ouvert que possible, aussi fermé que nécessaire ». Des données sensibles ou soumises à des copyrights restrictifs échappent donc à l’injonction de diffusion. Toutes les autres sont censées être diffusées, mais en pratique, certaines données peuvent présenter un risque d’être mal comprises, ou demander un travail de contextualisation trop important pour être réalisable.
N’hésitez pas à contacter votre data steward pour obtenir son avis quant à ce qu’il est envisageable de diffuser, ainsi que pour les questions relatives à l’anonymisation et les données sensibles.
- Comment documenter mes données ?
Il est vital de correctement documenter ses données pour que celles-ci soient compréhensibles et réutilisables.
- Fichiers Read-Me : ce sont des documents de contextualisation, créés pour décrire certains aspects des données que l’on pense important. Ils permettent aux utilisateurs secondaires de comprendre les données dont ils vont se servir. L'UniNE met à votre disposition un template de Read-me.
- Métadonnées : les informations décrivant l’enquête et les données. Elles peuvent porter sur :
- L’enquête : titre, auteurs, abstract, date, sujet, financement… Ces métadonnées sont directement documentées sur l’entrepôt de données, et permettent de mieux référencer les données diffusées.
- Un fichier de données : la résolution d’une image, durée d’un enregistrement audio, la procédure d'échantillonnage d'un sondage… Ces informations peuvent être contenues dans un fichier Read-me, ou dans un codebook indépendant.
- Où diffuser mes données ?
Les données de la recherche sont diffusées sur des entrepôts de données, ou data repositories. Il est possible que votre financeur ou un éditeur aient des exigences concernant l’entrepôt où diffuser vos données. Si ce n'est pas le cas, voici quelques recommandations :
- SwissUBase est la plateforme partenaire de l’UniNE. Elle présente de nombreux avantages en termes de visibilité, de sécurité et d’harmonisation des métadonnées. De plus, elle est la seule solution à vous offrir un accompagnement personnalisé.
- Entrepôts de données disciplinaires : si une grande partie de la communauté académique dans votre champ de recherche utilise un entrepôt de données en particulier, y recourir est une excellente solution.
- Re3data recense les entrepôts existants.
- Entrepôts génériques : des entrepôts comme Zenodo sont souvent utilisés comme plateforme par défaut pour déposer ses données. Si leur utilisation est tout à fait possible pour les équipes qui y trouvent leur intérêt, ils ne sont pas la solution recommandée par l’UniNE à l'heure actuelle.
- Comment identifier mes données ?
Le Digital Objet Identifier attribue un identifiant unique à tout objet numérique (article, présentation…), de façon à l’identifier formellement.
- Une adresse web permet d’accéder à la référence du DOI : www.doi.org/, suivie du DOI en question.
- Quelle utilisation pour mes données ?
Les licences définissent sous quelles conditions les données que vous partagez pourront être réutilisées. Selon la plateforme et la licence que vous utilisez, vous pourrez décider d'ouvrir complètement vos données, de limiter leur accès à certains publics, voire de n'autoriser l'accès que sur demande directe et motivée.
Les licences les plus répandues sont les Creative Commons (CC).
- CC0 : la licence qui se rapproche le plus du domaine public. Les modifications et usages commerciaux sont autorisés, la citation des auteurs n’est pas obligatoire – mais fait partie des bonnes pratiques.
- CC BY : l’auteur des données originelles doit être cité.
- CC SA : les productions dérivées devront être partagées sous les mêmes conditions que les données originelles.
- CC NC : l'utilisation commerciale des données est proscrite.
- CC ND : les données ne peuvent être modifiées.
Les quatre sigles (BY, SA, NC, ND) peuvent être combinés : une licence CC BY NC signifie ainsi que l’auteur des données originelles doit être cité, et que ses données ne peuvent être utilisées à des fins commerciales.
D'autres licences existent. Par exemple, sur SWISSUbase, vous avez la possibilité d'utiliser un contrat restreint, qui vous permet de savoir qui utilise vos données, et même d'en gérer l'accès.
-
Aide
Vous avez lu l'intégralité de cette page, mais certaines de vos questions restent sans réponses ? N'hésitez pas à consulter les ressources, qui contiennent des liens utiles, un glossaire et une FAQ.
Et s'il vous reste des questions, vous pouvez bien sûr contacter votre data steward à l'adresse mail [email protected].