Research Data

Research Data

1. What are research data?

Research data can take various forms and may be digital as well as non-digital. Apart from common forms such as spreadsheets, these can be, for example, photographs, audio and video recordings, questionnaires, test responses, interview transcripts, laboratory notebooks, field notes, codebooks, software, code, or samples and specimens.

2. What are metadata?

Metadata are a description of data. They include information about who the author is or how and when the data were collected. The Digital Curation Centre provides a list of examples of disciplinary metadata standards

3. What is a Data Management Plan (DMP)?

Data Management Plan (DMP) is a document that specifies what data will be created and how, and outlines the plans for sharing and preservation of the data, both during and after the research project. Some funders (e.g., H2020: ORD Pilot) require that a DMP is completed and submitted as part of the grant agreement. More information about DMPs can be found at the OS Centre’s website

4. What DMP template should I use?

Different institutions or funders may have different requirements regarding a DMP template, in which case you should use the template provided by the institution or the funder. If there are no specific requirements, we recommend using one of the existing templates, such as the Digital Curation Centre template or the ERC data management plan template. Charles University does not have any specific requirement for a DMP template. 

5. Are example DMPs available?

You can find a list of completed DMPs on the Digital Curation Centre’s website or at the DMPonline website in the Public DMPs section. 

6. How can I create a DMP?

Data management plans can be created as a simple document in a text editor. However, there are several free web-based tools that can help you prepare a data management plan by providing you with a template, asking you specific questions about data management or providing you with further guidance on how to answer the questions. Two such tools are DMPonline and Data Stewardship Wizard

7. Who can I turn to if I need help completing a DMP?

If you need help creating a DMP, you can contact the Open Science Support Centre at researchdata@cuni.cz  

8. Where can I find existing data on my subject?

As an increasing number of academic journals require that underlying data are shared, you can find links to relevant datasets as part of published articles. You can also find existing datasets in research data repositories. These can be either general (such as ZenodoFigshareDryadOSF) or subject specific (you can use the Registry of Research Data Repositories to find subject specific repositories). A reliable source of existing datasets are data journals, which publish peer-reviewed papers that describe published datasets and so ensure that the datasets are well described and of high quality. In addition to these sources, you may also use dataset search engines such as Mendeley Data or Google Dataset Search. In your research, you can also use public administration data published as open data which you can find in the National Open Data Catalogue (NKOD).

9. I have found data related to my subject. How can I tell that the data are useful and I can use them?

Make sure that the data come from a trusted source, e.g., a certified repository, a well-known author, peer-reviewed data journal.

Make sure that the data are sufficiently described and indicate the context in which they were collected, e.g., who were the research participants, in what conditions were the data collected.

Make sure you are allowed to reuse the data and under what conditions, e.g., does the license specify the reuse conditions? Do you have the author’s permission? 

How long will the data be retained? Is there a risk that the data could be lost or deleted (e.g., if they are published on the author’s personal website)? 

If you use someone else’s data in your research, don’t forget to cite them properly :) 

10. How can I cite the data I used?

As with citing publications, it is important to include enough information so that the data can be easily found and identified. Some repositories provide a recommended citation format for the datasets which you can use. If such recommendation is not provided, you should include at least the author’s name, publication year, dataset title, publisher/repository, persistent identifier (if it is assigned to the data). 

11. How can I assign a persistent identifier (e.g., DOI) to my dataset?

Assigning a persistent identifier requires a service which is authorised to assign them – for publications it is typically the publisher, for research data, some repositories may provide this service. When choosing an appropriate data repository, make sure that it assigns a persistent identifier to your data. 

12. Where should I store my data during my research?

To store your data during your research, we recommend that you use data storage operated on the Charles University infrastructure, or data storage provided by CESNET. You may also use cloud storage provided as a part of the Microsoft Office 365 service for Charles University. In particular, this relates to the personal storage OneDrive and the document library service SharePoint and O365 Groups. The management of data as a part of this cloud service is secured through an agreement concluded between CU and Microsoft. To learn more about data security and data storage, check the guide created by the Computer Science Centre and the Data Protection Officer. 

13. I am at the beginning of my research project and I know I would like to share my data when the project ends. What do I need to do?

If you are using someone else’s data, make sure that their author allows data sharing (e.g., via a license). 

If you work in a team, make sure your collaborators agree to share the data.

If you work with human subjects during your research, you need their informed consent with sharing their data. To ensure you can share your participants’ data, you can have them sign an informed consent, or anonymise the data before sharing. You can find an example of an informed consent form at the GDPR Sharepoint.

14. I would like to share my data, but they contain personal data. What can I do about that?

If it is possible, remove any personal information from your data. 

Anonymise your data before sharing. For example, use numbers instead of names to identify the participants, use age range instead of a specific age or date of birth, etc. To anonymise your data, you can also use anonymisation tools such as Amnesia.  If personal data cannot be removed or anonymised, you need an informed consent from the participants to share such data.  For more information regarding personal data protection, please contact the University Data Protection Officer at gdpr@cuni.cz

15. I would like to share my research data. Where can I store them so that other scientists can access them?

The best way to store and share your research data is to deposit them in a subject specific repository. Subject specific repositories are usually better equipped to meet the needs of a community, and can ensure that your data reaches the scientists in your field. You can find a suitable repository, e.g., at re3data.org. If you cannot find a suitable subject specific repository, you can deposit your data in a general-purpose repository, such as ZenodoFigshare, or Dryad. More information regarding data sharing can be found at the OS Centre website

16. Does Charles University have an institutional repository for storing data?

Charles University does not have its own data repository yet. For sharing data, we recommend using subject specific repositories, which you can find, e.g., at re3data.org, or a general-purpose repository such as ZenodoFigshareDryad or OSF

17. What does it mean that data are FAIR?

FAIR data are such data that are easily Findable, Accessible, Interoperable, and Reusable. You can read more about FAIR principles at the GO FAIR initiative website and you can use this checklist to see how FAIR your data are. 

18. Which funders have any requirements regarding research data?

The European Commission is taking the initiative in including open science requirements in their funding programmes (e.g., Horizon 2020 and Horizon Europe), however, other research funders are joining the effort, too, for example the KAPPA Programme of the TA CR, or the institutional funding programme Primus.  

You can find more information about individual funder’s policies in a separate section on Research funders’ policies on the Centre’s website.

19. I am an academic publisher / a journal editor and I would like the authors to share underlying data for published research articles. What should I do?

It is becoming increasingly common that academic publishers or journals have open data policies in place which specify the authors’ responsibilities when it comes to underlying data, for example Nature ResearchThis study by Sturges et al. shares recommendations on what should a journal data policy include and presents a model policy. For further questions related to the issue of journal data policies, do not hesitate to contact the Open Science Support Centre

Open science

Open science není pouze publikační režim open access a správa výzkumných dat.   

Mezi nejznámější odvětví open science spadá: open access, správa výzkumných dat, citizen science, open educational resources a další. Portál FOSTER nabízí následující taxonomii open science

Dle portálu FOSTER Open Science, je „otevřená věda (open science, OS) hnutím, jehož cílem je zpřístupnit a šířit vědecký výzkum, data a informace na všech úrovních společnosti". Jedná se o nový směr / iniciativu, jejíž principy lze aplikovat na celý výzkumný proces, následné šíření výsledků a jejich zpřístupnění široké veřejnosti. Zároveň open science podporuje kolaboraci ve vědě, stejně jako zapojení společnosti do vědy.

Jaké podmínky se vztahují k open science v programu Horizon Europe?

Stejně jako v předchozím rámcovém programu, i Horizon Europe ukládá všem příjemcům povinnost zajistit otevřený přístup k vědeckým informacím, a to jak k publikacím, tak výzkumným datům a dalším výstupům, a také povinnost vytvořit plán managementu dat. Nově se také open science dostává do hodnocení projektů.

Více informací k open science v Horizon Europe naleznete na samostatné stránce Centra.

Open Access

Open access (OA,otevřený přístup) je publikačním modelem, který vede k okamžitému, trvalému, bezplatného a svobodnému přístupu k výsledkům veřejně financované vědy a výzkumu na internetu. 

Existuje open access politika Univerzity Karlovy?

Univerzita Karlova nemá stanovenou mandatorní (povinnou) open access politiku. Nicméně Akademický senát Univerzity Karlovy na svém zasedání dne 15. prosince 2017 schválil návrh společné deklarace k politice otevřeného přístupu na Univerzitě Karlově, jejímž cílem je nastavit na UK dostatečné podmínky pro následné zavedení institucionální politiky.

Jaký je rozdíl mezi zelenou a zlatou cestou open access?

Zelená cesta open access je kombinací publikování článku v časopisu (otevřeném nebo tradičním s obsahem dostupným za poplatek/předplatné) a uložením plného textu článku do otevřeného repozitáře autorem (tzv. autoarchivace).

Zlatá cesta open access znamená publikování v otevřeném (open access) časopisu, otevřený přístup tedy nezajišťuje autor, nýbrž vydavatel.

Obě cesty open access jsou plně komplementární (nevylučují se) a z hlediska zvýšení viditelnosti své práce je vhodné je kombinovat.

Jaké jsou možnosti financování publikačních poplatků (APC) na Univerzitě Karlově?

Univerzita Karlova v současnosti nemá centrální fond pro pokrytí nákladů na open access poplatky. Tyto poplatky jsou vesměs uznatelnými náklady v projektových rozpočtech (je proto potřeba na tyto náklady pamatovat při navrhování rozpočtu u nových projektů).

Korespondenční autoři z Univerzity Karlovy také mohou využít slevy a vouchery na open access publikační poplatky u vybraných vydavatelů.

Již jsem publikoval/a článek v časopisu a nyní bych jej chtěl/a zpřístupnit v otevřeném repozitáři. Co mám dělat?

Již publikovaný článek lze zpřístupnit zelenou cestou open access, tedy nahráním článku do otevřeného repozitáře (autoarchivace). Užitečným nástrojem pro vyhledání vhodného repozitáře je kupř. databáze OpenDOAR nebo OpenAIRE.

Je ale vždy nezbytné si předem ověřit, zda vydavatel, u kterého jste článek publikovali, autoarchivaci dovoluje. Podmínky autoarchivace jsou zpravidla uvedeny v licenční smlouvě, kterou vydavatel před publikování s autorským kolektivem sjednává. Pakliže nemáte vy ani korespondenční autor k dispozici licenční smlouvu, nabízí se využít službu SHERPA/RoMEO, která má ale pouze referenční charakter. Pokud vydavatelská smlouva autoarchivaci neumožňuje, vyžádejte si před podpisem výjimku prostřednictvím dodatku k licenční smlouvě.

Existuje seznam nedůvěryhodných časopisů a vydavatelství (tzv. predátorů)?

Nejznámějším seznamem nedůvěryhodných vydavatelů a časopisů byl tzv. Beallův seznam, jehož provoz byl v roce 2017 ale ukončen. Důvody k zařazení časopisu na tzv. blacklisty nemusí být vždy jednoznačné a mohou vyvolat právní odezvu od nařčeného vydavatele. Z tohoto důvodu je vždy nezbytné individuálně posoudit důvěryhodnost konkrétního vybraného časopisu či vydavatele, u kterého chcete publikovat.

Na stránkách Centra pro podporu open science naleznete typické znaky predátorů a tipy, jak se jim vyvarovat. Zároveň Centrum připravilo návod pro autory z UK, obsahující základní informace o predátorských časopisech.

 Kteří poskytovatelé financí open access u publikovaných výsledků vyžadují?

V čele poskytovatelů financí, vyžadujících open access, je Evropská komise, nicméně se dá předpokládat, že jich bude v budoucnu přibývat. Zasadit se o to může zejména iniciativa cOAlition S.

Jaký je rozdíl mezi otevřenými repozitáři a vědeckými sociálními sítěmi jako ResearchGate a Academia.edu?

Academia a ResearchGate jsou komerčními akademickými sociálními sítěmi, jejichž hlavním záměrem je propojení výzkumných pracovníků. Často se snaží shromažďovat osobní údaje a pro přístup k obsahu je často nutné se přihlásit. Tím nesplňují definici otevřeného přístupu, který má být okamžitý, bezplatný, trvalý a svobodný.

Otevřené repozitáře jsou nekomerčními platformami, které obvykle mají širší možnosti při ukládání článků (vyplnění metadat apod.), zároveň jsou interoperabilní s ostatními nástroji a prohledatelné běžnými vyhledávači i agregátory vědeckého obsahu. Některé repozitáře zajišťují dlouhodobou archivaci.

Myšlenka open access mě zaujala, ale potřeboval/a bych se poradit, jak postupovat. Na koho se mohu na Univerzitě Karlově obrátit?

Na Univerzitě Karlově bylo za tímto účelem zřízeno Centrum pro podporu open science při Ústřední knihovně. Zároveň existuje fakultní podpůrná síť koordinátorů open access.

Výzkumná data

Výzkumná data mohou mít různou podobu a mohou být jak digitální, tak analogová. Kromě typických tabulek s naměřenými hodnotami se může jednat například o fotografie, audio a video nahrávky, dotazníky, odpovědi na testové otázky, přepisy rozhovorů, laboratorní deníky, terénní poznámky, číselníky, software, počítačový skript, nebo také o vzorky či exempláře.

Co jsou to metadata?

Metadata jsou popisem dat. Obsahují například informace o tom, kdo je autorem dat nebo kdy a jakým způsobem data vznikala. Na stránkách Digital Curation Centre najdete informace k oborovým metadatovým standardům.

Co je to plán managementu dat / Data Management Plan / DMP?

Plán managementu dat (DMP) je dokument, který specifikuje, jaká data a jakým způsobem budou během výzkumu vytvářena, a obsahuje informace o jejich dostupnosti a využití. Někteří poskytovatelé financí (např. H2020: ORD Pilot) pak vyžadují vyplnění a odevzdání DMP jako součást plnění podmínek grantové dohody. Více k DMP naleznete v samostatné sekci.

Seznam vyplněných DMP můžete nalézt na stránkách Digital Curation Centre nebo na stránkách nástroje DMPonline v záložce Public DMPs.

Data management plán můžete vytvářet jako dokument v textovém editoru. Doporučujeme však využít online nástroje, které mohou tvorbu DMP usnadnit pomocí vhodně položených otázek nebo mohou vědce navigovat na konkrétnější vysvětlení otázek. Mezi tyto nástroje patří například DMPonline nebo Data Stewardship Wizard

Pokud potřebujete podporu při tvorbě DMP, obraťte se na Centrum pro podporu open science na adrese researchdata@cuni.cz.

Jakou šablonu mám pro tvorbu DMP použít?

Různé instituce, či poskytovatelé financí mohou mít specifické požadavky na podobu data management plánu, v takovém případě použijte jimi poskytnuté šablony. Pokud instituce ani poskytovatel financí specifické požadavky nemají, doporučujeme využít již existující šablony, například od Digital Curation Centre nebo šablonu pro ERC granty. Univerzita Karlova nemá specifické požadavky na šablonu DMP. 

Kde mohu najít existující data, která mohu využít ve svém výzkumném projektu?

Odkazy na relevantní datové sady mohou být součástí publikovaných článků. Dále můžete datové sady najít v datových repozitářích a to jak obecných (např. ZenodoFigshareDryadOSF) tak oborově zaměřených (oborové repozitáře můžete vyhledat pomocí Registru datových repozitářů re3data.org). Spolehlivým zdrojem datových sad jsou také datové časopisy, které publikují recenzované články popisující online dostupné datové sady a zajišťují tak, že publikovaná data jsou vysoké kvality a jsou dobře popsaná. Kromě těchto zdrojů můžete využít také vyhledávače datových sad Mendeley Data nebo Google Dataset Search. K výzkumu je také možné použít data veřejné správy publikovaná formou otevřených dat, která můžete najít v Národním katalogu otevřených dat (NKOD). 

Našel/a jsem data, která se týkají problematiky, kterou zkoumám. Jak poznám, že jsou data užitečná a mohu je použít?

  1. Zkontrolujte, že jsou data z důvěryhodného zdroje (např. certifikované datové repozitáře, známý autor, recenzovaný datový časopis).
  2. Zkontrolujte, že jsou data důkladně popsána a uvádí kontext, ve kterém byla sbírána (např. na jaké populaci a v jakých podmínkách byl sběr dat provádět).
  3. Zkontrolujte, zda nalezená data můžete opětovně využít a za jakých podmínek (licence, svolení autora s využitím dat).
  4. Jak dlouho budou nalezená data uchovávána (nehrozí, že budou data ztracena či smazána, např. pokud jsou publikována na osobní stránce autora?)  
  5. Pokud použijete ve svém výzkumu data někoho jiného, nezapomeňte je řádně ocitovat.

Jak mám citovat použitá data?

Stejně jako u citování publikací je důležité uvést dostatek informací tak, aby data mohla být snadno vyhledatelná a identifikovatelná. Některé repozitáře uvádí doporučený formát citace uloženého datasetu, který můžete využít. Pokud u dat není uvedený doporučený formát citace, pak byste měli uvést alespoň autora dat, rok, kdy byla data publikována, název datasetu, vydavatele nebo repozitář, perzistentní identifikátor (pokud je datům přidělen).

Kam mám data ukládat během svého výzkumu

Během výzkumného procesu doporučujeme ukládat výzkumná data na zabezpečená úložiště provozovaná na infrastruktuře Univerzity Karlovy nebo na úložiště provozovaná sdružením CESNET. Využít můžete také cloudová datová úložiště poskytovaná v rámci služby Microsoft Office 365 pro Univerzitu Karlovu. Zejména se jedná o osobní úložiště OneDrive a dokumentové knihovny služby SharePoint a Skupin O365. Nakládání s daty v rámci této cloudové služby je zajištěno smlouvou uzavřenou mezi UK a společností Microsoft. Podrobné informace o bezpečném nakládání s daty naleznete v publikovaném metodickém materiálu, který zpracovalo ÚVT ve spolupráci s Pověřencem pro ochranu osobních údajů.

Jsem na začátku výzkumu a vím, že bych po skončení projektu chtěl/a svá data otevřeně publikovat. Co pro to musím udělat?

  1. Pokud využíváte data, která vytvořil někdo jiný, zkontrolujte, že jejich autor (např. prostřednictvím licence) sdílení dat povoluje.
  2. Pokud pracujete v týmu, domluvte se na sdílení se svými spolupracovníky.
  3. Pokud během výzkumu pracujete s lidskými subjekty, musíte mít se zveřejněním takto získaných dat jejich souhlas. Pojistit se můžete například získáním jejich informovaného souhlasu, nebo anonymizací dat před jejich zveřejněním.
  4. Doporučení, jak napsat informovaný souhlas a vzorový formulář naleznete na Sharepointu GDPR.
  5. Pokud je to možné, osobní údaje z dat odstraňte.
  6. Data před zveřejněním anonymizujte. Např. místo jmen účastníků výzkumu použijte číselné označení, místo uvádění konkrétního věku uveďte věkové rozmezí atd. K anonymizaci dat můžete také využít některé nástroje, jako je např. Amnesia.
  7. Pokud není možné osobní údaje odstranit nebo anonymizovat, musíte mít ke sdílení takových údajů informovaný souhlas od účastníků výzkumu.
  8. Pro další informace týkající se práce s osobními údaji se obraťte na pověřence pro ochranu osobních údajů Univerzity Karlovy na gdpr@cuni.cz.

Chtěl/a bych svá výzkumná data sdílet, kam je mohu uložit, aby k nim ostatní vědci měli přístup?

Nejvhodnějším způsobem uchovávání a sdílení výzkumných dat je jejich uložení do oborového datového repozitáře. Oborové repozitáře jsou zpravidla lépe uzpůsobené potřebám komunity a navíc zajistí, že se vaše data dostanou k vědcům z vašeho oboru. Vhodný oborový repozitář můžete najít např. na re3data.org. Pokud se vám nepodaří najít vhodný oborový repozitář, můžete svá data uložit do obecného repozitáře jako např. ZenodoFigshare nebo Dryad. Více informací ke sdílení dat naleznete v samostatné sekci na stránkách Centra.

Co znamená, že jsou data FAIR?

FAIR data jsou taková data, která jsou snadno nalezitelná (Findable), dostupná (Accessible), interoperabilní (Interoperabilní) a opakovaně použitelná (Reusable). Více o principech FAIR se můžete dočíst na stránkách Centra pro podporu open science a pomocí tohoto checklistu si můžete ověřit, jak FAIR vaše data jsou. 

Kteří poskytovatelé financí mají nějaké požadavky týkající se výzkumných dat?

V čele poskytovatelů financí, kteří se ve svých podmínkách věnují výzkumným datům, stojí Evropská komise se svými rámcovými programy na podporu výzkumu a inovací (Horizon 2020 následovaný programem Horizon Europe), nicméně se přidávají i další poskytovatelé, a to i v ČR (např. Program KAPPA TA ČR nebo institucionální soutěž Primus).

Bližší informace o podmínkách konkrétních poskytovatelů financí, které se vztahují k open science, naleznete na stránkách Centra v samostatné sekci OS a poskytovatelé financí.  

Jsem vydavatel / editor akademického časopisu a chtěl/a bych, aby autoři sdíleli podkladová data k publikovaným článkům. Jak na to?

Postupně se stává běžnou praxí, že vydavatelé akademických časopisů nebo i jednotlivé časopisy mají datové politiky, které stanovují, jak by měli autoři nakládat s podkladovými daty k publikovaným článkům, jako příklad můžeme uvést např. Nature Research. V tomto příspěvku pak najdete několik tipů, co by se mělo v datové politice akademického časopisu objevit. V případě dotazů na tuto problematiku se můžete na Centrum obrátit.