Przejdź do treści Przejdź do stopki

Krok 5. Pliki

Podczas weryfikacji dołączonych plików zwróć uwagę: 

  • jaki jest całkowity rozmiar zdeponowanych plików? Przy dużym rozmiarze archiwum plików, należy liczyć się z wydłużonym czasem jego pobrania/otwarcia;
  • jakich rozmiarów są pojedyncze pliki w zbiorze? Pojedynczy plik nie może być większy niż 4 GB. Przesłanie większych plików wymaga użycia tokena API oraz skryptu, który jest dostępny na GitHub. Użytkownik, który chce przesłać taki plik, powinien wcześniej skontaktować się z data stewardem swojej instancji, a ten z RODBUK Support (ACK CYFRONET AGH); 
  • czy zastosowano programy do kompresji i archiwizacji danych? Rekomendujemy stosowanie programów ZIP, 7-ZIP.  Archiwum nie powinno mieć zbyt długiej nazwy, ponieważ może pojawić się problem z wyodrębnieniem plików po pobraniu;
  • czy do zestawu plików dołączono plik readme.txt? Jeśli zbiór danych zawiera archiwum lub archiwa plików, to pojedynczy plik readme, opisujący całość (tj. metodologię i strukturę wszystkich plików w zbiorze) powinien znajdować się na zewnątrz archiwum. Ważne, aby ten plik był odpowiednio pozycjonowany tzn. wyświetlał się jako pierwszy w strukturze wszystkich dodanych do zbioru plików. Ponieważ oprogramowanie wyświetla dodane pliki alfabetycznie, można "wymusić" pozycjonowanie pliku readme, dodając cyfry przed jego nazwą - w tym wypadku 00_readme.txt. W sytuacji, kiedy zbiór danych zawiera kilka archiwów z własnymi plikami readme, wówczas główny plik readme, opisujący całość, powinien znajdować się na zewnątrz.
    Dataverse umożliwia prezentowanie lokalizacji pliku w strukturze folderów poprzez opcję widok – Tabela i/lub Drzewo znajdującej się powyżej zamieszczonych plików. Gdy użytkownik przesyła plik .zip zawierający strukturę folderów o więcej niż jednym poziomie, system Dataverse automatycznie rozwija informacje w widoku Drzewo dla każdego pliku zawartego w archiwum;
  • czy pliki zdeponowane są w formatach otwartych, powszechnie dostępnych i bezpłatnych (np. OpenDocument, PNG, FLAC, WebM, HTML, CSS)? Wyjątki stanowią sytuacje, kiedy konwersja plików z oprogramowania specjalistycznego do otwartego może wpłynąć na jakość danych, wówczas informacja o niezbędnych oprogramowaniu, koniecznym do odczytania zdeponowanych danych, powinna być zawarta w pliku readme.txt.;
  • czy pliki przesłane są zarówno w formacie oryginalnym, jak i w preferowanym formacie otwartym (kopia) mają te same nazwy? W przeciwnym razie tworzenie przeglądów plików na potrzeby długoterminowego przechowywania będzie bardzo trudne;
  • czy zdeponowane pliki otwierają się poprawnie? Jeśli nie (a ich otwarcie nie wymaga specjalistycznego oprogramowania), to czy wskazany jest kontakt z deponującym;
  • czy nazwy plików są spójne i ustrukturyzowane oraz nie zawierają spacji, przecinków ani innych znaków specjalnych, w tym polskich znaków?
  • czy deponujący ma świadomość konsekwencji nałożenia embargo lub ograniczenia? W przypadku nałożenia embargo należy upewnić się, że informacja o przyczynie ograniczenia jest zamieszczona w zakładce Licencje i warunki w polu Warunki dostępu.  

Uwaga: czasu raz nałożonego embarga nie można zmienić.  System zdejmie embargo dopiero po jego upływie.

Uwaga: w momencie nałożenia embarga przez Użytkownika nie masz możliwości edycji pola określającego warunki embarga.  Jeśli nie są wpisane musisz odesłać dataset do uzupełnienia.

Opcja embarga znajduje się: w zakładce Pliki – przycisk Edytuj plikiEmbargo. Embargo można nałożyć na wszystkie pliki (z wyłączeniem pliku 00_readme) jak i na pojedyncze pliki. Nakładając embargo trzeba zaznaczyć „ptaszkiem”, o które pliki nam chodzi. Plik z nałożonym embargiem charakteryzuje się czerwoną kłódką przy grafice pliku/zbioru. 

W przypadku zastrzeżenia plików poprzez funkcję Ogranicz (przy plikach wyświetli się zielona kłódka) upewnij się, że informacja o przyczynie ograniczenia jest zamieszczona w zakładce Licencje i warunki w polu Warunki dostępu. Opcja Ogranicz znajduje się w zakładce Pliki – przycisk Edytuj plikiOgranicz. Ograniczenie plików deponujący może zdjąć w dowolnym momencie. Można zastrzec pojedynczy plik lub kilka plików.
Pamiętaj, że wstępnie system zaznaczy tylko te pliki, które znajdują się na bieżącej stronie. Jeśli zależy Ci na zastrzeżeniu wszystkich plików, możesz skorzystać z jednej z dwóch opcji: rozszerzyć wyświetlane pliki do 50 na stronę lub zaznaczyć wszystkie z paska informacyjnego. 

Przykłady dobrych praktyk przygotowania danych do udostępniania:  

Przygotowanie danych badawczych do udostępnienia, Centrum Kompetencji Otwartej Nauki, Politechnika Gdańska
Organizacja folderów i nazewnictwo plików, Uniwersytet Ekonomiczny w Krakowie
Research data management: a practical guide. Organising your data, University of York 

Co powinno znaleźć się w pliku readme?

  • jasny i zwięzły opis wszystkich komponentów zbioru danych; 
  • podsumowanie eksperymentów, pytania badawcze lub hipotezy, którymi kierowano się podczas gromadzenia zbioru danych; 
  • opis struktury i zawartości plików; 
  • definicje wszystkich zmiennych. Jest to szczególnie ważne w przypadku danych tabelarycznych, ale jest również przydatne w przypadku każdego innego rodzaju pliku (np. nazwę zmiennej, krótki opis i typ danych); 
  • powiązania do innych publicznie dostępnych lokalizacji danych; 
  • wszystkie inne szczegóły, które mogą wpłynąć na replikację uzyskanych wyników.  

Stopka