Co je datový repozitář a k čemu je prospěšný

Datový repozitář je informační systém, který slouží k dlouhodobému a bezpečnému ukládání, uchovávání, ochraně, integritě, autenticitě a zveřejňování datových sad.

Důvěryhodný repozitář by měl umožňovat přinejmenším následující funkce:

  • Poskytnutí otevřeného přístupu k datovým sadám
  • Přiřazení perzistentního identifikátoru k nahrávanému obsahu
  • Přidělení standardizovaných strojově zpracovatelných metadat k nahrávanému datasetu. To se děje prostřednictvím formuláře, který se uživateli zobrazí k vyplnění při nahrávání datasetu do repozitáře
  • Možnost přidělení požadované licence pro datové sady
  • Zajištění uchování autentického obsahu v dlouhodobém horizontu
  • Nesimuluje vzdálené úložiště. Co se zde zveřejní, nelze s výjimkou odůvodněných případů znovu skrýt
  • Při opravě obsahu datasetu vznikne nová verze, ale stará nezmizí
  • Umožňuje registraci pod akademickou identitou

Jaký repozitář vybrat

ČVUT nemá institucionální datový repozitář. Při výběru repozitáře se proto doporučuje následující postup:

  1. Pokud existuje důvěryhodný oborový repozitář, využijte ten. Jejich výhodou je větší vstřícnost vůči oborovým specifikům v oblasti metadat, případně vyšší viditelnost výzkumu v odborné komunitě a naplňování specifických oborových požadavků. Takovými oborovými repozitáři mohou být například HEP data pro fyziku vysokých energií nebo DANTEc pro materiální vědy, který je vyvíjený v rámci Národní repozitářové platformy (NRP).
  2. Velmi častou volbou jsou multioborové repozitáře. Jejich výhodou je uživatelská přívětivost, ale nemusí vyhovovat některým oborově specifickým požadavkům.

Z multioborových repozitářů je možné uvést dva následující příklady:

Zenodo – nejčastěji využívaný repozitář provozovaný společností CERN. Jedná se o tzv. „catch all“ repozitář, do kterého je možné nahrávat vedle výzkumných dat také například články, software nebo prezentace.

Nabízí kapacitu 50 GB na dataset, přidělení perzistentního identifikátoru DOI, přidělování licencí včetně Creative Commons. Metadatový popis je v schématu DataCite, ale Zenodo umožňuje v případě potřeby i další schémata (např. Dublin Core).

Národní repozitář – multioborový repozitář vybudovaný sdružením CESNET jako součást Národní datové infrastruktury. Nabízí kapacitu 500 GB na dataset, přiděluje perzistentní identifikátor DOI a licence včetně Creative Commons. Metadatový popis je v novém českém schématu CCMM (Czech Core Metadata Model).

Repozitáře je také možné vyhledat s pomocí repozitářových databází RE3 Data a OpenDOAR, ovšem ne každý nalezený repozitář je důvěryhodný.

Za důvěryhodné repozitáře můžeme považovat ty, které obdrželi některou z následujících certifikací: CoreTrustSeal, Nestor Seal nebo ISO16363. To však neznamená, že repozitáře bez certifikace nemohou být důvěryhodné. Například Zenodo žádnou certifikaci nemá, a přesto je důvěryhodný.

S výběrem repozitáře Vám rovněž rádi pomůžeme v Metodickém centru Ústřední knihovny ČVUT.



, Poslední změna: 27.05.2026