
Metadane to ustrukturyzowane informacje opisujące dane, ułatwiające ich odnalezienie, zrozumienie, wykorzystanie i zarządzanie nimi.
Nazywane są także "danymi o danych" lub "informacjami o informacjach".
Metadane pomagają innym naukowcom zrozumieć:
Dzięki metadanym zbiory danych są odnajdywane, interpretowane i wykorzystywane w przyszłych badaniach.
Sposób, w jaki metadane są ustrukturyzowane, jest określony przez ich standard. Standard określa zarówno to, jakie informacje mogą zostać ujęte w jego obrębie, jak i wymagania dotyczące ich struktury. Istnieje wiele standardów metadanych, które porządkują sposób opisu danych. Dzięki nim metadane mają jasną strukturę i zrozumiałe pola – zarówno dla ludzi, jak i programów komputerowych.
Wyszczególnić można standardy ogólne, dziedzinowe oraz instytucjonalne, które wykorzystują określone instytucje i dziedziny.
Jako przykłady ogólnych standardów metadanych najczęściej wymieniane są Dublin Core i Data Cite, oraz Data Documentation Initiative (DDI). Są one uniwersalne dziedzinowo i powszechnie stosowane.
Ogólne informacje dotyczące zbioru danych, takie jak te wymienione powyżej, stanowią domenę ogólnych (generycznych) schematów metadanych. W wypadku danych badawczych najważniejszym schematem tego rodzaju jest standardowy schemat DataCite. Schemat ten jest ważny z uwagi na popularność identyfikatora DOI powszechnie używanego w świecie danych badawczych. Aby go otrzymać, dane muszą być opisane zgodnie ze standardem DataCite. Oznacza to, że metadane muszą spełniać określone, minimalne wymagania. Aby dało się opisać każdy zbiór danych, standard metadanych musi być ogólny, dlatego najczęściej zawiera tylko podstawowe informacje (np. tytuł, autorzy, finansowanie). Szczegóły dotyczące samych danych czy metod badań są w nim ujęte tylko ogólnie. Dokładniejszy opis umożliwiają specjalistyczne, dziedzinowe standardy metadanych.
To, jakie informacje są ważne w opisie danych, zależy od dziedziny, w której je zebrano. Inne dane są ważne dla geologa, a inne dla socjologa czy językoznawcy. Dlatego tak ważne jest dobranie odpowiedniego standardu metadanych do danej dyscypliny – pozwala to dokładnie i jasno opisać dane.
Do opisu deponowanych danych badawczych RODBUK wykorzystuje standard Dublin Core.
Wybrane standardy metadanych wykorzystuje się także w różnych instytucjach np.: SDMX (ECB, EUROSTAT, IMF, OECD, UN), SAFE (ESA), INSPIRE ISO 19139 (nauki o ziemi), Project Open Data Metadata Schema v1.1 (Agencje federalne USA), TEI i CDWA (dyscypliny humanistyczne).
Istnieje wiele narzędzi do tworzenia metadanych np. Nesstar Publisher zgodny ze standardami DDI i Dublin Core, a także narzędzia takie jak STATA, SPSS, a także eENVplus oraz Edytor Metadanych, które przygotowano z myślą o tworzeniu metadanych w standardzie Inspire.