Przejdź do treści Przejdź do stopki

Metadane

Metadane to ustrukturyzowane informacje opisujące dane, ułatwiające ich odnalezienie, zrozumienie, wykorzystanie i zarządzanie nimi.
Nazywane są także "danymi o danych" lub "informacjami o informacjach". 

Metadane pomagają innym naukowcom zrozumieć:  

  • co zawiera zbiór danych;  
  • jak go używać;  
  • kto go stworzył i kiedy;  
  • jakie są prawa dostępu i licencje.  

Dzięki metadanym zbiory danych są odnajdywane, interpretowane i wykorzystywane w przyszłych badaniach. 

Trzy główne typy metadanych

  1. Opisowe - dostarczają informacji niezbędnych do odszukania czy też identyfikacji zbioru danych; mogą zawierać elementy takie jak tytuł, streszczenie, autora i słowa kluczowe.  
  2. Strukturalne – opisują relacje i zależności pomiędzy poszczególnymi zbiorami oraz elementami tych zbiorów w celu np. ułatwienia nawigacji.  
  3. Administracyjne – zawierają informacje pomocne w zarządzaniu danym zasobem np. sposób i datę jego utworzenia, typ pliku, prawo dostępu.  Istnieje kilka podzbiorów danych administracyjnych. Najczęściej wymieniane to:
    - zarządzanie prawami (prawa własności) oraz 
    - konserwacja (archiwizacja i utrzymanie zasobów). 

Standard metadanych

Sposób, w jaki metadane są ustrukturyzowane, jest określony przez ich standard. Standard określa zarówno to, jakie informacje mogą zostać ujęte w jego obrębie, jak i wymagania dotyczące ich struktury. Istnieje wiele standardów metadanych, które porządkują sposób opisu danych. Dzięki nim metadane mają jasną strukturę i zrozumiałe pola – zarówno dla ludzi, jak i programów komputerowych.  

Wyszczególnić można standardy ogólne, dziedzinowe oraz instytucjonalne, które wykorzystują określone instytucje i dziedziny. 

Jako przykłady ogólnych standardów metadanych najczęściej wymieniane są Dublin Core i Data Cite, oraz Data Documentation Initiative (DDI). Są one uniwersalne dziedzinowo i powszechnie stosowane.  

Ogólne informacje dotyczące zbioru danych, takie jak te wymienione powyżej, stanowią domenę ogólnych (generycznych) schematów metadanych. W wypadku danych badawczych najważniejszym schematem tego rodzaju jest standardowy schemat DataCite. Schemat ten jest ważny z uwagi na popularność identyfikatora DOI powszechnie używanego w świecie danych badawczych. Aby go otrzymać, dane muszą być opisane zgodnie ze standardem DataCite. Oznacza to, że metadane muszą spełniać określone, minimalne wymagania. Aby dało się opisać każdy zbiór danych, standard metadanych musi być ogólny, dlatego najczęściej zawiera tylko podstawowe informacje (np. tytuł, autorzy, finansowanie). Szczegóły dotyczące samych danych czy metod badań są w nim ujęte tylko ogólnie. Dokładniejszy opis umożliwiają specjalistyczne, dziedzinowe standardy metadanych. 

To, jakie informacje są ważne w opisie danych, zależy od dziedziny, w której je zebrano. Inne dane są ważne dla geologa, a inne dla socjologa czy językoznawcy. Dlatego tak ważne jest dobranie odpowiedniego standardu metadanych do danej dyscypliny – pozwala to dokładnie i jasno opisać dane.  

Do opisu deponowanych danych badawczych RODBUK wykorzystuje standard Dublin Core.

Gdzie można sprawdzić standard metadanych stosowany w danej dyscyplinie?

  1. Brytyjskie Digital Curation Centre prowadzi listę standardów metadanych, z podziałem według dziedzin, opisy standardów, ich rozszerzenia, narzędzia i przykłady użycia.
    Zalecane standardy metadanych w poszczególnych dyscyplinach.
  2. Serwis sygnowany przez Uniwersytet Oxfordzki, FAIRsharing, gromadzi informacje na temat standardów metadanych, repozytoriów i baz danych oraz polityk czasopism naukowych i instytucji finansujących badania naukowe, ze szczególnym uwzględnieniem rozwiązań mających na uwadze zasady FAIR.  
  3. Witryna utrzymywana przez organizację Research Data Alliance, umożliwia przeglądanie standardów metadanych alfabetycznie i tematycznie. Zawiera też informacje o narzędziach, przykładach użycia, organizacjach wspierających oraz umożliwia dostęp do danych przez API. 

Wybrane standardy metadanych wykorzystuje się także w różnych instytucjach np.: SDMX (ECB, EUROSTAT, IMF, OECD, UN), SAFE (ESA), INSPIRE ISO 19139 (nauki o ziemi), Project Open Data Metadata Schema v1.1 (Agencje federalne USA), TEI i CDWA (dyscypliny humanistyczne). 

Istnieje wiele narzędzi do tworzenia metadanych np. Nesstar Publisher zgodny ze standardami DDI i Dublin Core, a także narzędzia takie jak STATA, SPSS, a także eENVplus oraz Edytor Metadanych, które przygotowano z myślą o tworzeniu metadanych w standardzie Inspire. 

Stopka