Odpowiednia organizacja danych badawczych jest niezwykle ważna, aby uniknąć pomyłek i bałaganu w plikach dotyczących projektu.
Organizacja plików musi być zrozumiała dla autora, całego zespołu badawczego oraz każdej potencjalnej osoby, która będzie miała dostęp do danych.
Podczas pracy w grupie lub przygotowywaniu się do udostępnienia zbioru danych konieczne jest użycie jak najbardziej przejrzystej struktury folderów.
Ponadto:
Unikaj:
Nazwy plików mogą zawierać wiele informacji o ich zawartości. Powinny być spójne, logiczne, opisowe, krótkie i czytelne. Pracując zespołowo, trzeba ustalić konwencję nazewnictwa w celu uniknięcia błędów. Elementy opisu powinny być uporządkowane od ogółu do szczegółu.
Co może zawierać nazwa pliku:
Wskazówki:
| Rodzaj danych | Rekomendowane formaty |
|---|---|
| Dane tekstowe |
.txt (Plain text) .pdf (Portable Document Format) .tex (LaTeX documents) .html (Hypertext Markup Language) .odt (Open Document Format) .xml (Extensible Markup Language) |
| Tabele, arkusze kalkulacyjne, bazy |
.txt/.tsv/.tab (Tab-separated tables) .csv/.txt (Comma-separated tables) Standardowe separatory, np. dwukropek, pionowa kreska Format stałej szerokości (Fixed-width) .ods (OpenDocument Spreadsheet) .odb (OpenDocument Database) |
| Obrazy |
.tiff/.tif (TIFF) .jpg/.jp2 (JPEG) .png (Portable Network Graphics) .svg (Scalable Vector Graphics) .pdf (Portable Document Format) .gif (Graphics Interchange Format) .bmp (Microsoft Windows Bitmap Format) |
| Pliki audio |
.wav (WAVE) .flac (FLAC) .mp3 (MPEG-3) - zazwyczaj odpowiedni dla rejestru ludzkiego głosu i dźwięku o średniej jakości, ale może być nieodpowiedni dla dźwięku Hi-Fi .aiff (Audio Interchange File Format) |
| Pliki wideo |
.mp4 (MPEG-4) .mxf (Material Exchange Format) |
| Bazy danych |
.xml (Extensible Markup Language) .csv (Comma-separated tables) |
| Dane geoprzestrzenne |
.tiff (Geo-Referenced TIFF) .shp, .shx, .dbf (ESRI Shapefile) .kml (Keyhole Markup Language) .nc (Network Common Data Format) |
| Dane internetowe |
.json (Javascript Object Notation) .xml (Extensible Markup Language) .html (Hypertext Markup Language) |
| Dane z sieci | .warc (WebARChive) |
| Wielowymiarowe tablice |
.cdf (Common Data Format) .nc (Network Common Data Format) .hdf/.h5 (Hierarchical Data Format) |
| e-book | .epub (Electronic Publication) |
Źródło: File Formats - Research Data Management - Best Practices - Research Guides at Ohio State University (Modyfikacja: tłumaczenie)