Co jsou výzkumná data v otevřené vědě?

Výzkumná data a další výzkumné výstupy jsou veškeré informace, které vznikly měřením, pozorováním, výpočtem, generováním nebo shromažďováním za účelem dosažení, uchování, ověření nebo reprodukce výsledků výzkumu. V praxi může jít např. o záznamy z přístrojů, výpočty, dokumenty, tabulky, audio a video nahrávky, laboratorní deníky, software, obrázky, dotazníky, poznámky, vzorky nebo exempláře.

Výzkumná data mají být přístupná v souladu s níže uvedenými tzv. FAIR principy. V rámci těchto principů je možné ponechat uzavřená data z relevantních důvodů, například ochrany osobních údajů, práva na ochranu soukromí, oprávněných obchodních zájmů, obchodního tajemství, duševního vlastnictví v případě podávání žádosti o patent, bezpečnosti státu, dalších oprávněných zájmů a omezení nebo komerčního využití. Všechny důvody k uzavření dat je třeba vysvětlit v plánu správy dat, případně v návrhu projektu. Pokud pominou důvody k uzavření výzkumných dat, je možné je zpřístupnit.

Standardní formáty dat

Digitálním výstupem výzkumného projektu jsou různé druhy standartních formátu dat. Například digitální video je nejčastěji ve formátu MPEG, AVI, MXF, MKV. Soubory vhodné pro akustickou analýzu a archivaci jsou ve formátu WAVE, AIFF, MP3, MXF, FLAC. Texty mohou mít typ dat: XML, PDF/A, HTML, JSON, TXT, RTF, obrázky: jpg, gif, tiff, png, ai, svg, geoprostorová data: SHP, DBF, GeoTIFF, NetCDF, e00, archivace více souborů: TAR, GZIP, ZIP a další. Změřená data (surová měření např. CO2 atd.) jsou v hodnotách oddělených čárkami v prostém formátu ASCII. Podrobný popis práce s různými typy dat je uveden například na webové stránce How To FAIR.

Otevřený přístup k výzkumným datům (Otevřená data) je přínosný pro vědeckou komunitu z mnoha pohledů. Zveřejněním podkladových výzkumných dat vědeckých publikací nebo zveřejněním samostatných výzkumných dat (dataset) vědec zviditelní svou práci široké vědecké a odborné komunitě, zvýší se citovanost jeho publikací, zefektivní kvalitu výzkumu a podpoří se spolupráce. Sdílení otevřených dat také přispívá k lepšímu využití finančních prostředků výzkumu a je inspirací pro další výzkum. Z tohoto důvodu většina poskytovatelů finanční podpory výzkumných projektů požaduje otevřené sdílení dat. Výzkumná data mají být přístupná dle hesla „otevřená, jak možno, uzavřená, jak nutno”, tj. výzkumná data budou standardně otevřená, pokud neexistují oprávněné důvody pro jejich uzavření.

Bezpečné nakládání s daty je nedílnou součástí práce výzkumných pracovníků. Existují základní 4 kategorie spravovaných dat, které ovlivňují způsob, jak s nimi správně zacházet: veřejná data, interní data, diskrétní data a citlivá data.

Kategorie spravovaných dat

  • Veřejná data jsou zpřístupněná komukoliv bez jakýchkoliv omezení. V otevřeném přístupu k výzkumným datům platí pravidla dle tzv. FAIR principů.
  • Interní data jsou určená jen pro vnitřní potřebu obecně definované skupiny osob (např. spolupracovníci projektu, pracovníci instituce apod.).
  • Diskrétní data jsou určená výhradně pro vnitřní potřebu přesně definované skupiny osob (např. zaměstnanec, vedoucí pracovník). Vyžadují ze své povahy regulaci nebo ochranu, typicky jsou data chráněná ze zákona nebo na základě nějaké smlouvy/licence.
  • Citlivá data jsou určená striktně jen pro vnitřní potřebu přesně definované skupiny osob (např. zdravotník a jeho pacient, řešitelé projektu pracující s daty podléhajícími komerčnímu či podobnému tajemství apod.). Vyžadují ze své povahy zvláštní regulaci nebo obzvláštní ochranu, typicky jsou to data přísně chráněná ze zákona nebo na základě smlouvy/licence.

V otevřené vědě existují 4 kategorie přístupů k výzkumným datům:

  • Otevřená data je termín používaný v kontextu otevřeného přístupu k výzkumným datům volně data používat, upravovat a sdílet kýmkoli k jakémukoli účelu. Výzkumná data sdílená prostřednictvím otevřeného přístupu v kontextu FAIR principů jsou data zpřístupněná za jasně definovaných podmínek. Otevřený přístup k výzkumným datům bývá zpravidla realizován prostřednictvím elektronických datových repozitářů. Výzkumná data musí být zpřístupněna ve formě, která umožní jejich další využití jak z hlediska technického, tak právního. Přístup, využití, reprodukce a šíření dat musí být bezplatné. Výzkumná data jako výzkumné sady mohou být zveřejněna samostatně nebo jako doprovodná data k publikacím v otevřeném přístupu.
  • Přístup dat s embargem. Správce dat uvede v repozitáři datum, od kdy bude dataset zpřístupněn veřejnosti, např. z důvodu požadavku vydavatele.
  • Přístup dat s omezením je specifický případ, kdy správce dat určuje podmínky, za kterých uživatelům udělí přístup k datasetům v repozitáři. Uživatel žádající o přístup v repozitáři je vyzván, aby zdůvodnil důvod žádosti o přístup k datům. Za udělení přístupu k datům správce dat, např. v repozitáři Zenodo, nesmí uživatelům účtovat poplatky.
  • Uzavřený přístup k datům se aplikuje z důvodu obchodního tajemství, ochrany duševního vlastnictví, bezpečnostních pravidel a dalších důvodů. Uzavřená data mohou být uložena v repozitáři s uzavřeným přístupem k datům s uvedením základního popisu.

FAIR data je termín používaný v kontextu sdílení výzkumných dat v otevřené vědě, tj. principy FAIR. Akronym představuje 4 základní požadavky na data: nalezitelná (Findable), dostupná (Accessible), interoperabilní (Interoperable) a opětovně využitelná (Reusable). Podrobný popis je uveden v FAIR principy.



, Poslední změna: 04.04.2024