Dane badawcze - informacje ogólne

Głównym zadaniem Modułu Repozytorium Danych Badawczych jest stworzenie naukowcom możliwości deponowania w Uczelnianej Bazie WIedzy danych badawczych realizowanych w projektach badawczych zgodnie z wymogami głównych instytucji finansujących badania, obecnie przede wszystkim NCN. Ponadto a moduł ma pozwlić Uczelni gromadzić pełną wiedzę o danych badawczych naukowców Uczelni, dostępnych w świecie, a realizowanych przez pracowników uczelni.

Poza wymaganiami formalnymi związanymi z wymogami NCN, czy szerzej, Unii Europejskiej, istotnym zadaniem repozytorium jest z jednej strony spełnienie warunków otwartej nauki, z drugiej zaś, możliwie kompleksowe promowanie osiągnięć naukowych pracowników Uczelni.

Przyjęte założenia

Podstawowym celem modułu danych badawczych jest możliwość deponowania danych badawczych przez naukowców uczelni, w taki sposób, aby spełnione były wymagania repozytoriów danych badawczych, w szczególności te wymagania, które są narzucane przez krajowych grantodawców.

Niezależnie od tego, ważne jest, aby moduł upowszechniał w świecie wiedzę o danych badawczych naukowców Uczelni. Wiąże sie to z wymaganiami związanymi z „widocznością” danych badawczych w świecie (zarówno przez użytkowników końcowych, jak też w najważniejszych globalnych serwisach informacyjnych. Dlatego uwzględniane są wymogi jakościowe i strukturalne głównych globalnych dostawców informacji naukowych. Jednym z ważniejszych uwarunkowań na działanie systemu jest zbiór zasad FAIR:

https://www.go-fair.org/fair-principles/

Ponadto podjęto starania aby moduł spełniał rekomendacje OpenAire nakładane na repozytoria danych badawczych (https://www.openaire.eu/find-trustworthy-data-repository ).

Jednym z ważniejszych założeń jest założenie, że dane badawcze są wprowadzane samodzielnie przez naukowców pragnących zdeponować swoje dane.

Ponieważ proces wprowadzania danych nie jest prosty i wymaga określonej wiedzy, powstaje w PW specjalna służba wspierająca wprowadzanie danych przez naukowców. W szczególności wprowadzono rolę stewarda danych badawczych, którego zadaniem jest wsparcie naukowca w procesie deponowania danych. 

W repozytorium można zdeponować dane: 

  1. z projektów krajowych i międzynarodowych pozyskanych przez Uczelnię – zachodzi konieczność powiązania danych z odpowiednim projektem i publikacją (jeżeli powstała) 

  2. z projektów krajowych i międzynarodowych niepozyskanych przez PW, ale pracownik jest np. wykonawcą grantu – konieczność dodania informacji o źródle finansowania w odpowiednim polu (konieczność dodania takiego pola) 

  3. powstałe z grantów wewnętrznych (np. IDUB; środki wydziałowe itd.); zachodzi konieczność dodania tej informacji w odpowiednim polu o źródle finansowania

Rolą Uczelnianej BW jest gromadzenie możliwie kompletnej informacji o dorobku naukowców Uczelni, dlatego zakłada się, że oprócz deponowanych danych w repozytorium gromadzone są także metadane o danych badawczych zdeponowanych poza UBW (są to rekordy referencyjne).

Dla danych badawczych zdeponowanych w UBW, Uczelnia jest wydawcą. 

Możliwości funkcjonalne modułu

W module zaimplementowano wiele funkcjonalności ułatwiających naukowcom deponowanie danych badawczych. Poniżej pokrótce scharakteryzujemy najważniejsze.

Nadawanie DOI

Zgodnie z rekomendacjami FAIR najważniejszą cechą systemu jest trwałość składowanych danych. Wiąże się to z koniecznością nadawania trwałych identyfikatorów globalnych (DOI). Istotną tego konsekwencją jest warunek nieusuwalności rekordów, wraz ze zdeponowanymi danymi. Co więcej, rekordów tych nie można zmieniać,  nawet jeżeli przestają być aktualne. W tym zakresie moduł danych badawczych spełnia wymagania DataCite (por.  

Wielowersyjność

Pojawienie się nowszych (lepszych, bardziej adekwatnych) danych badawczych w działalności autora skutkuje potrzebą utworzenia nowej wersji. To oznacza konieczność wdrożenia wielowersyjności:

Każdy z współautorów może zainicjować utworzenie nowej wersji. Podstawą do zainicjowania nowej wersji jest ostatnia opublikowana wersja. Nową wersję można zainicjować tylko wtedy nie nie istnieje inna nowa wersja w fazie edycji.

Ponadto, w celu usunięcia niebezpieczeństwa, że ktoś wciąż może nieświadomie próbować korzystać ze starszej wersji, system zawsze pokazuje wszystkie wersje danych badawczych w jednym widoku i wyjaśnia na czym polegają zmiany w każdej kolejnej wersji i jakie są pomiędzy nimi różnice.     

Proces deponowania

Odpowiedzialność naukowców za wiarygodność i jakość danych badawczych wymusza na docelowym systemie, aby to naukowiec mógł własnoręcznie wprowadzić opis swoich danych badawczych. Wiążą się z tym następujące funkcjonalności: 

  1. istnienie przyjaznego interfejsu wprowadzania danych, takiego, aby naukowiec mógł samodzielnie wprowadzić rekord metadanych oraz zdeponować dane badawcze w repozytorium.  

  2. proces wprowadzania danych może trwać dłużej niż typowy proces wprowadzania danych bazach tranzakcyjnych, dlatego:   

    1. w dowolnym momencie można go przerwać i móc powrócić do niego bez utraty danych; 

    2. wprowadzono narzędzia komunikowania się edytującego naukowca z data-stewardem. Dzięki temu można skonsultować się z opiekunem (data steward). Przedmiotem konsultacji mogą być sprawy techniczne związane z wprowadzaniem danych, jak też merytoryczne, np. konsultacje w zakresie sposobu udostępniania danych i licencji,    

    3. po zakończeniu fazy edycji naukowiec daje czas data stewardowi na zweryfikowanie poprawności i kompletności danych; 

Z uwagi na powyższe założenia wyróżnia się w cyklu życia danych badawczych następujące etapy:

  1. Wprowadzania danych - faza edycji danych przez naukowca;  ponieważ proces wprowadzania danych może być złożony, w fazie wprowadzania danych przewidziana jest możliwość zmiany osoby deponującej:

  2. Zmiana osoby deponującej dane - naukowiec deponujący dane może w dowolnym momencie w fazie edycji przekazać prawa edycji innemu współautorowi (lub osobie z inną niż autor rolą, wyszczególnionej w rekordzie metadanych;

  3. Weryfikacji danych - faza weryfikacji przez stewarda;

    1. zidentyfikowanie błędów przez stewarda, przekazanie deponującemu uwag i komentarzy i przekierowanie do (1);

    2. akceptacja metadanych i zdeponowanych plików i przejście do etapu opublikowania; 

  4. Opublikowanie wersji (zamrożenie zmian)

    1. Nadania identyfikatora DOI  - opcja

    2. zmiana stanu na opublikowane

  5. utworzenia nowej wersji przez naukowca, dla tworzonej wersji) następuje przejście do etapu (1).

W momencie nadania DOI określona wersja przestaje być edytowalna. Ewentualne drobne zmiany mogą polegać na usunięciu literówek przez stewarda. Wzbogacenie danych w ramach kolejnych prac badawczych może wymagać utworzenia nowej wersji danych. Decyzję o utworzeniu nowej wersji danych podejmuje naukowiec w uzgodnieniu ze stewardem. Również decyzja o nadaniu DOI nowej wersji jest podjęta po uzgodnieniu ze stewardem.

Rekordów opublikowanych nie można usunąć. W bardzo szczególnych przypadkach istnieje możliwość zmienić stan konkretnej wersji z Opublikowane na Usunięte. Status Usunięte ogranicza dostęp do plików, jednak dostęp do meadanych pozostaje niezmienionych (dodatkowo pojawia sie wyjaśnienie przyczyny usunięcia danych.

 Zarządzanie plikami

Moduł dostarcza naukowcom narzędzi pozwalających sprawniej zarządzać plikami w procesie deponowania danych badawczych. Naukowiec ma możliwość zbiorczego (dla wybranej grupy plików) definiowania atrybutów dostępności oraz licencji, usuwania plików, wyszukiwania określonych typów, itp. Pozwala to sprawniej kontrolować proces przekazywania plików w przypadku, gdy jest ich wiele.