Trouver un entrepôt de données
Vous cherchez un entrepôt de données généraliste pour rendre accessibles vos données de recherche ?
Cet outil peut vous aider à trouver l'entrepôt qui réponde le mieux à vos besoins.
Pour identifier un entrepôt de données spécialisé pour votre domaine de recherche, interrogez l'annuaire re3data ou contactez-nous.
Pour plus d'informations concernant les données de recherche, consultez les pages "Les données de recherche" de notre site web.
Pour toute question, contactez-nous à l'adresse donnees-recherche@u-bordeaux.fr
Retrouvez tous les éléments de contenu présentés dans ce formulaire dans le fichier PDF : Outil d’aide à la décision « Trouver un entrepôt de données » : version statique
Cet outil est adapté du Data Repository Finder développé par l'université d'Utrecht.
4TU.ResearchData, créé à l'initiative de trois universités techniques néerlandaises, est ouvert à tous les chercheurs, avec un accent sur les sciences exactes, l'ingénierie et le design - voir Data collection policy pour une liste des domaines couverts.
4TU.ResearchData fournit depuis 2010 une infrastructure et des services (assistance pour l'organisation et la documentation des données, modération des dépôts, outils pour la réutilisation des données) pour le partage et la conservation à long terme des données de recherche.
4TU.ResearchData est spécialisé dans le traitement du format NetCDF avec le protocole OPeNDAP, permettant l'utilisation de données provenant d'un serveur distant sans avoir besoin de télécharger les fichiers de données, voir NetCDF and OPeNDAP.
- URL : https://data.4tu.nl/
- Identifiant pérenne : DOI
- Restrictions d'accès aux données : oui, les jeux de données peuvent être en accès ouvert, sous embargo ou restreint
- Flexibilité pour les licences d'utilisation : choix parmi des licences prédéfinies : toutes les licences Creative Commons ; licences spécifiques pour le code informatique et les logiciels : MIT, BSD 3-Clause, Apache-2.0, EUPL-1.2, GPL, LGPL et AGPL
- Fichiers de données volumineux : jusqu'à 10 Go
- Coûts : 10 Go gratuits de données par an et par utilisateur pour les utilisateurs extérieurs ; au-delà de ce seuil, des frais de 4,5€ par Go s'appliquent
- Certification CoreTrustSeal : oui
- Stockage localisé en Union Européenne : oui, aux Pays-Bas
- Préservation : minimum 15 ans
- Propriétaire : consortium associant les universités technologiques de Delft et Eindhoven et l'université de Twente
B2SHARE est ouvert à tous les contributeurs et accepte tous les types de données, de toutes les disciplines. BSHARE est l'un des services proposés par l’infrastructure européenne EUDAT, financée par l'Union européenne ; il est connecté aux autres services de EUDAT : BSTORE, B2DROP, B2NOTE, etc.
B2SHARE propose des options étendues pour la description des données. Le formulaire standard de dépôt permet notamment de saisir plusieurs descriptions, de différents types (résumé, méthode, table des matières, etc.). Les communautés, créées à la demande, permettent d'aller plus loin en paramétrant un formulaire de dépôt spécifique, avec des métadonnées complémentaires personnalisées.
- URL : https://b2share.eudat.eu/
- Identifiant pérenne : DOI et handle
- Restrictions d'accès aux données : oui, les jeux de données peuvent être en accès ouvert, sous embargo ou restreint
- Flexibilité pour les licences d'utilisation : choix parmi des licences prédéfinies grâce à l'outil d'aide à la décision intégré "Select License" ; saisie libre possible dans le champ "License" ; champ "URL" pour indiquer le lien vers la description de la licence que vous souhaitez appliquer
- Fichiers de données volumineux : jusqu'à 10 Go par fichier et 20 Go par jeu de données (dépôt, record) ; des volumes plus importants peuvent être négociés avec EUDAT
- Coûts : gratuit
- Certification CoreTrustSeal : non, le centre de données Datacenter CSC Kajaani est certifié ISO/IEC 27001:2005 pour son système de gestion de la sécurité informatique
- Stockage localisé en Union Européenne : oui, en Finlande (Finnish IT Center for Science, Datacenter CSC Kajaani)
- Préservation : indéfinie ; repose sur le réseau des 25 membres de l'infrastructure EUDAT (organismes de recherche, centres de données et de calcul nationaux, fournisseurs de technologies)
- Propriétaire : EUDAT (European Data Infrastructure)
Dryad est géré par une organisation à but non lucratif, créée à l'initiative de sociétés savantes et d'éditeurs pour diffuser les données associées à des articles. Certaines revues partenaires de Dryad ont intégré la soumission des données dans Dryad à leur processus de soumission des articles.
Les données non associées à des publications sont également acceptées dans Dryad. Tous les jeux de données soumis sont modérés et validés avant d'être mis en ligne et publiés en accès ouvert sous licence CC0.
- URL : https://datadryad.org
- Identifiant pérenne : DOI
- Restrictions d'accès aux données : non, seul un accès ouvert est possible. Un accès sous embargo peut être sollicité auprès du support Dryad lors de la soumission des données. Un jeu de données peut rester privé pendant le processus de publication de l'article auquel il est lié : une URL privée de téléchargement des fichiers est alors fournie.
- Flexibilité pour les licences d'utilisation : seule la licence Creative Commons Zero CC0 est disponible pour les données. Les fichiers supplémentaires et le code informatique associés aux données sont hébergés sur Zenodo, respectivement sous la licence Creative Commons CC-BY et sous une licence adaptée au code informatique.
- Fichiers de données volumineux : jusqu'à 300 Go par jeu de données ; des volumes plus importants peuvent être négociés avec Dryad.
- Coûts : 120 $, auxquels s'ajoutent des frais de 50 $ par tranche de 10 Go pour les jeux de données excédant 50 Go. Ces frais de publication ne sont pas facturés aux contributeurs provenant de certains pays ou d'institutions membres de Dryad, ni aux auteurs d'articles publiés dans des revues partenaires.
- Certification CoreTrustSeal : indirectement : Dryad est archivé dans l'entrepôt Merritt de l'U3C (University of California Curation Center), certifié CoreTrustSeal
- Stockage localisé en Union Européenne : non, aux Etats-Unis
- Préservation : indéfinie
- Propriétaire : Dryad
Figshare, fourni par l'éditeur commercial Digital Science, est ouvert à tous les contributeurs, accepte tous les types de productions scientifiques (publications, données, images, fichiers audio et vidéo, ressources en ligne, etc.), de toutes les disciplines.
Figshare offre des fonctionnalités complémentaires de travail collaboratif et d'éditorialisation des données telles que : collections, référencement de données déposées dans d'autres entrepôts, référencement de données sans fichiers associés.
- URL : https://figshare.com/
- Identifiant pérenne : DOI
- Restrictions d'accès aux données : oui, les jeux de données peuvent être en accès ouvert, sous embargo ou fermé (dépôt confidentiel). L'embargo peut s'appliquer seulement aux fichiers ou au dépôt lui-même ; dans ce dernier cas, les métadonnées ne sont alors pas visibles pendant la période d'embargo. Tant que le dépôt n'est pas publié et reste privé, une URL de partage privée peut être générée.
- Flexibilité pour les licences d'utilisation : choix parmi des licences prédéfinies : licences Creative Commons CC0 et CC-BY ; licences MIT, GNU et Apache pour le code infromatique et les logiciels.
- Fichiers de données volumineux : jusqu'à 5 Go par fichier ; espace de stockage privé jusqu'à 20 Go
- Coûts : gratuit ; des services complémentaires sont disponibles via un abonnement institutionnel ou l'offre Figshare+.
- Certification CoreTrustSeal : non
- Stockage localisé en Union Européenne : non précisé, Figshare est hébergé par Amazon Web Services, mais la localisation des serveurs n'est pas spécifiée
- Préservation : archivage à long terme assuré par Chronopolis (University of California at San Diego)
- Propriétaire : Digital Science
Mendeley Data, fourni par l'éditeur commercial Elsevier, est ouvert à tous les contributeurs et accepte tous les types de données, de toutes les disciplines. Le processus de dépôt est simple et rapide.
Mendeley Data bénéficie des services de l'infrastructure nationale néerlandaise d'archivage Data Archiving and Network Services (DANS).
- URL : https://data.mendeley.com/
- Identifiant pérenne : DOI
- Restrictions d'accès aux données : non, seul un accès ouvert est possible. Un embargo d'un an maximum peut être paramétré. Tant que le dépôt n'est pas publié et reste privé, une URL privée de téléchargement des fichiers peut être générée.
- Flexibilité pour les licences d'utilisation : choix parmi des licences prédéfinies : licences Creative Commons et licences spécifiques à l'informatique (code, software et hardware)
- Fichiers de données volumineux : jusqu'à 10 Go par jeu de données
- Coûts : gratuit; des services complémentaires sont disponibles via un abonnement institutionnel (volumétrie des données déposées par exemple).
- Certification CoreTrustSeal : oui
- Stockage localisé en Union Européenne : oui, en Irlande
- Préservation : archivage à long terme assuré par DANS
- Propriétaire : Elsevier
Open Science Framework (OSF) est une plateforme créée par le Center for Open Science (COS), une organisation à but non lucratif fondée à l'université de Virginie aux Etats-Unis. OSF permet à la fois le partage des données de recherche et le travail collaboratif, grâce à des fonctionnalités telles que la gestion des droits et des contributions, le versionnement, l'organisation en projet et en composants imbriqués, ou la connexion avec des services tiers (Google, GitHub, Zotero, etc.).
OSF héberge également des services de prépublications (PsyArXiv et SocArXiv par exemple) et d'enregistrement d'études.
- URL : https://osf.io/
- Identifiant pérenne : DOI
- Restrictions d'accès aux données : non, seul un accès ouvert est possible. Un projet OSF peut rester privé à ses membres : une URL privée est alors fournie et peut être transmise aux personnes extérieures au projet qui doivent accéder aux données.
- Flexibilité pour les licences d'utilisation : choix parmi des licences prédéfinies ; possibilité de définir sa propre licence en téléchargeant un fichier "license.txt"
- Fichiers de données volumineux : jusqu'à 5 Go pour les projets et composants privés, jusqu'à 50 Go pour les projets et composants publics ; des services de stockage tiers (Dropbox, GitLab, etc. ) peuvent être connectés à un projet - voir l'article OSF Storage Caps dans la FAQ OSF
- Coûts : gratuit
- Certification CoreTrustSeal : non
- Stockage localisé en Union Européenne : oui, en Allemagne
- Préservation : le financement est assuré pour 50 ans
- Propriétaire : Center for Open Science
Recherche Data Gouv est une composante de l'infrastructure de données portée par le Ministère de l'enseignement supérieur et de la recherche. Il est ouvert à tous les membres de la communauté scientifique française et accepte tous les types de données, de toutes les disciplines.
Les espaces institutionnels offrent à chaque institution un portail pour les données produites par ses membres. Une logique arborescente permet d'organiser finement les fichiers et jeux de données en sous-collections et collections (pour un laboratoire, un projet de recherche, etc.) ..
Recherche Data Gouv est fondé sur le logiciel libre Dataverse, utilisé par d'autres entrepôts de données comme Harvard Dataverse ou CIRAD Dataverse.
- URL : https://recherche.data.gouv.fr/
- Identifiant pérenne : DOI
- Restrictions d'accès aux données : oui, les jeux de données peuvent être en accès ouvert ou restreint. Les restrictions peuvent être paramétrées pour chaque fichier individuellement. La fonctionnalité de demande d'accès par les utilisateurs peut être désactivée. Tant que le dépôt n'est pas publié et reste privé, une URL de partage privée peut être générée.
- Flexibilité pour les licences d'utilisation : choix entre la licence Creative Commons Zero CC0, la "Licence Ouverte / Open License" Etalab ou une licence d'utilisation personnalisée définie par le contributeur
- Fichiers de données volumineux : jusqu'à 50 Go par fichier
- Coûts : gratuit
- Certification CoreTrustSeal : en cours
- Stockage localisé en Union Européenne : oui, en France
- Préservation : l'hébergement sécurisé et la mise à disposition des données sont garantis pendant un minimum de 5 ans renouvelables après la publication.
- Propriétaire : développement et hébergement par l'Institut national de recherche pour l’agriculture, l’alimentation et l’environnement - INRAE, pour le Ministère de l'enseignement supérieur et de la recherche (France)
Zenodo, financé par l'Union Européenne et hébergé par le CERN, est ouvert à tous les contributeurs, accepte tous les types de productions scientifiques (publications, données, images, fichiers audio et vidéo, livrables de projet, etc.), de toutes les disciplines.
Zenodo offre une interface de dépôt très simple et propose des services tels que : la création et organisation de collections (communautés), la synchronisation avec GitHub ou encore l'intégration dans le système de reporting pour les projets européens.
- URL : https://zenodo.org/
- Identifiant pérenne : DOI - Zenodo enregistre au moins deux DOI pour chaque jeu de données : un DOI représentant chaque version spécifique et un DOI représentant toutes les versions du jeu de données
- Restrictions d'accès aux données : oui, les jeux de données peuvent être en accès ouvert, sous embargo, restreint ou fermé
- Flexibilité pour les licences d'utilisation : choix parmi de très nombreuses licences prédéfinies pour les dépôts en accès ouvert ou sous embargo ; possibilité de définir sa propre licence en téléchargeant un fichier "license.txt"
- Fichiers de données volumineux : jusqu'à 50 Go par jeu de données ; des volumes plus importants peuvent être négociés avec Zenodo
- Coûts : le dépôt est gratuit, toutefois Zenodo accepte les dons
- Certification CoreTrustSeal : non
- Stockage localisé en Union Européenne : oui, en Suisse
- Préservation : minimum 20 ans
- Propriétaire : CERN