Dane badawcze - informacje ogólne
Głównym zadaniem Modułu Repozytorium Danych Badawczych jest stworzenie naukowcom możliwości deponowania w Uczelnianej Bazie WIedzy danych badawczych realizowanych w projektach badawczych zgodnie z wymogami głównych instytucji finansujących badania, obecnie przede wszystkim NCN. Ponadto a moduł ma pozwlić Uczelni gromadzić pełną wiedzę o danych badawczych naukowców Uczelni, dostępnych w świecie, a realizowanych przez pracowników uczelni.
Poza wymaganiami formalnymi związanymi z wymogami NCN, czy szerzej, Unii Europejskiej, istotnym zadaniem repozytorium jest z jednej strony spełnienie warunków otwartej nauki, z drugiej zaś, możliwie kompleksowe promowanie osiągnięć naukowych pracowników Uczelni.
Przyjęte założenia
Podstawowym celem modułu danych badawczych jest możliwość deponowania danych badawczych przez naukowców uczelni, w taki sposób, aby spełnione były wymagania repozytoriów danych badawczych, w szczególności te wymagania, które są narzucane przez krajowych grantodawców.
Niezależnie od tego, ważne jest, aby moduł upowszechniał w świecie wiedzę o danych badawczych naukowców Uczelni. Wiąże sie to z wymaganiami związanymi z „widocznością” danych badawczych w świecie (zarówno przez użytkowników końcowych, jak też w najważniejszych globalnych serwisach informacyjnych. Dlatego uwzględniane są wymogi jakościowe i strukturalne głównych globalnych dostawców informacji naukowych. Jednym z ważniejszych uwarunkowań na działanie systemu jest zbiór zasad FAIR:
Ponadto podjęto starania aby moduł spełniał rekomendacje OpenAire nakładane na repozytoria danych badawczych (https://www.openaire.eu/find-trustworthy-data-repository ).
Jednym z ważniejszych założeń jest założenie, że dane badawcze są wprowadzane samodzielnie przez naukowców pragnących zdeponować swoje dane.
Ponieważ proces wprowadzania danych nie jest prosty i wymaga określonej wiedzy, powstaje w PW specjalna służba wspierająca wprowadzanie danych przez naukowców. W szczególności wprowadzono rolę stewarda danych badawczych, którego zadaniem jest wsparcie naukowca w procesie deponowania danych.
W repozytorium można zdeponować dane:
z projektów krajowych i międzynarodowych pozyskanych przez Uczelnię – zachodzi konieczność powiązania danych z odpowiednim projektem i publikacją (jeżeli powstała)
z projektów krajowych i międzynarodowych niepozyskanych przez PW, ale pracownik jest np. wykonawcą grantu – konieczność dodania informacji o źródle finansowania w odpowiednim polu (konieczność dodania takiego pola)
powstałe z grantów wewnętrznych (np. IDUB; środki wydziałowe itd.); zachodzi konieczność dodania tej informacji w odpowiednim polu o źródle finansowania
Rolą Uczelnianej BW jest gromadzenie możliwie kompletnej informacji o dorobku naukowców Uczelni, dlatego zakłada się, że oprócz deponowanych danych w repozytorium gromadzone są także metadane o danych badawczych zdeponowanych poza UBW (są to rekordy referencyjne).
Dla danych badawczych zdeponowanych w UBW, Uczelnia jest wydawcą.
Możliwości funkcjonalne modułu
W module zaimplementowano wiele funkcjonalności ułatwiających naukowcom deponowanie danych badawczych. Poniżej pokrótce scharakteryzujemy najważniejsze.
Nadawanie DOI
Zgodnie z rekomendacjami FAIR najważniejszą cechą systemu jest trwałość składowanych danych. Wiąże się to z koniecznością nadawania trwałych identyfikatorów globalnych (DOI). Istotną tego konsekwencją jest warunek nieusuwalności rekordów, wraz ze zdeponowanymi danymi. Co więcej, rekordów tych nie można zmieniać, nawet jeżeli przestają być aktualne. W tym zakresie moduł danych badawczych spełnia wymagania DataCite (por.
Wielowersyjność
Pojawienie się nowszych (lepszych, bardziej adekwatnych) danych badawczych w działalności autora skutkuje potrzebą utworzenia nowej wersji. To oznacza konieczność wdrożenia wielowersyjności:
Każdy z współautorów może zainicjować utworzenie nowej wersji. Podstawą do zainicjowania nowej wersji jest ostatnia opublikowana wersja. Nową wersję można zainicjować tylko wtedy nie nie istnieje inna nowa wersja w fazie edycji.
Ponadto, w celu usunięcia niebezpieczeństwa, że ktoś wciąż może nieświadomie próbować korzystać ze starszej wersji, system zawsze pokazuje wszystkie wersje danych badawczych w jednym widoku i wyjaśnia na czym polegają zmiany w każdej kolejnej wersji i jakie są pomiędzy nimi różnice.
Proces deponowania
Odpowiedzialność naukowców za wiarygodność i jakość danych badawczych wymusza na docelowym systemie, aby to naukowiec mógł własnoręcznie wprowadzić opis swoich danych badawczych. Wiążą się z tym następujące funkcjonalności:
istnienie przyjaznego interfejsu wprowadzania danych, takiego, aby naukowiec mógł samodzielnie wprowadzić rekord metadanych oraz zdeponować dane badawcze w repozytorium.
proces wprowadzania danych może trwać dłużej niż typowy proces wprowadzania danych bazach tranzakcyjnych, dlatego:
w dowolnym momencie można go przerwać i móc powrócić do niego bez utraty danych;
wprowadzono narzędzia komunikowania się edytującego naukowca z data-stewardem. Dzięki temu można skonsultować się z opiekunem (data steward). Przedmiotem konsultacji mogą być sprawy techniczne związane z wprowadzaniem danych, jak też merytoryczne, np. konsultacje w zakresie sposobu udostępniania danych i licencji,
po zakończeniu fazy edycji naukowiec daje czas data stewardowi na zweryfikowanie poprawności i kompletności danych;
Z uwagi na powyższe założenia wyróżnia się w cyklu życia danych badawczych następujące etapy:
Wprowadzania danych - faza edycji danych przez naukowca; ponieważ proces wprowadzania danych może być złożony, w fazie wprowadzania danych przewidziana jest możliwość zmiany osoby deponującej:
Zmiana osoby deponującej dane - naukowiec deponujący dane może w dowolnym momencie w fazie edycji przekazać prawa edycji innemu współautorowi (lub osobie z inną niż autor rolą, wyszczególnionej w rekordzie metadanych;
Weryfikacji danych - faza weryfikacji przez stewarda;
zidentyfikowanie błędów przez stewarda, przekazanie deponującemu uwag i komentarzy i przekierowanie do (1);
akceptacja metadanych i zdeponowanych plików i przejście do etapu opublikowania;
Opublikowanie wersji (zamrożenie zmian)
Nadania identyfikatora DOI - opcja
zmiana stanu na opublikowane
utworzenia nowej wersji przez naukowca, dla tworzonej wersji) następuje przejście do etapu (1).
W momencie nadania DOI określona wersja przestaje być edytowalna. Ewentualne drobne zmiany mogą polegać na usunięciu literówek przez stewarda. Wzbogacenie danych w ramach kolejnych prac badawczych może wymagać utworzenia nowej wersji danych. Decyzję o utworzeniu nowej wersji danych podejmuje naukowiec w uzgodnieniu ze stewardem. Również decyzja o nadaniu DOI nowej wersji jest podjęta po uzgodnieniu ze stewardem.
Rekordów opublikowanych nie można usunąć. W bardzo szczególnych przypadkach istnieje możliwość zmienić stan konkretnej wersji z Opublikowane
na Usunięte
. Status Usunięte
ogranicza dostęp do plików, jednak dostęp do meadanych pozostaje niezmienionych (dodatkowo pojawia sie wyjaśnienie przyczyny usunięcia danych.
Zarządzanie plikami
Moduł dostarcza naukowcom narzędzi pozwalających sprawniej zarządzać plikami w procesie deponowania danych badawczych. Naukowiec ma możliwość zbiorczego (dla wybranej grupy plików) definiowania atrybutów dostępności oraz licencji, usuwania plików, wyszukiwania określonych typów, itp. Pozwala to sprawniej kontrolować proces przekazywania plików w przypadku, gdy jest ich wiele.