Podstawowym celem modułu danych badawczych jest możliwość deponowania danych badawczych przez naukowców uczelni, w taki sposób, aby spełnione były wymagania repozytoriów danych badawczych, w szczególności te wymagania jakie są narzucane przez krajowych grantodawców. To narzuca szereg warunków, jakie zostały uwzględnione w module. Można je pogrupować według ich charakteru na:
Organizacyjne
Techniczne
związane z możliwościami systemu, jego funkcjonalnościami i charakterystykami
związane z wdrożeniem określonych procedur związany z bezpieczeństwem danych
Poza powyższymi uwarunkowaniami niezwykle ważne jest, aby moduł upowszechniał w świecie wiedzę o danych badawczych naukowców Uczelni. Wyróżniamy więc także funkcjonalności związane z „widocznością” danych badawczych w świecie (zarówno przez użytkowników końcowych, jak też w najważniejszych globalnych serwisach informacyjnych. Dlatego uwzględniane są wymogi głównych globalnych dostawców informacji naukowych.
Wymagania i rekomendacje organizacyjne
Deponowanie danych badawczych
Jednym z ważniejszych wymagań organizacyjnych jest zrealizowanie założenia, że dane badawcze są wprowadzane samodzielnie przez naukowców pragnących zdeponować swoje dane. Ponieważ proces wprowadzania danych nie jest prosty i wymaga określonej wiedzy, zakłąda się, że uczelnia wdrażająca moduł organizuje specjalną służbę wspierającą wprowadzanie danych przez naukowców. W systemie przewidziano następujące role:
rolę menedżera repozytorium
rolę data-stewardów – są to osoby wspierające naukowców w procesie wprowadzania danych.
W repozytorium można zdeponować dane:
z projektów krajowych i międzynarodowych pozyskanych przez Uczelnię – zachodzi konieczność powiązania danych z odpowiednim projektem i publikacją (jeżeli powstała)
z projektów krajowych i międzynarodowych niepozyskanych przez PW, ale pracownik jest np. wykonawcą grantu – stworzono możliwość dodania informacji o źródle finansowania w odpowiednim polu;
powstałe z grantów wewnętrznych (tj. uczelnianych, np. IDUB; środki wydziałowe itd.). stworzono możliwość dodania tej informacji w odpowiednim polu o źródle finansowania
Rolą Uczelnianej BW jest gromadzenie możliwie kompletnej informacji o dorobku naukowców Uczelni, dlatego zakłada się, że oprócz deponowanych danych w repozytorium gromadzone są także metadane o danych badawczych zdeponowanych poza UBW (rekordy referencyjne).
Dla danych badawczych zdeponowanych w UBW, Uczelnia jest wydawcą.
Stałe identyfikatory
Istotnym wymaganiem jest możliwość identyfikowania danych badawczych. Najważniejszym identyfikatorem globalnym jest DOI (Digital Object Identifier). Warunek Findability w warunkach FAIR narzuca konieczność wdrożenia możliwości nadawania DOI. Możliwość nadawania DOI wymaga „wykupienia” określonej usługi. Zaimplementowano w tym względzie interoperatywność z organizacją DataCite. Przyjmuje się, że Uczelnia wdroży określone procedury związane z zakupami numerów DOI oraz nadawaniem identyfikatorów danym badawczym.
Dokumenty związane z działaniem Repozytorium danych badawczych
Należy opracować regulamin wyjaśniający naukowcom Uczelni dokładnie cele repozytorium i sposoby deponowania, a także zgłaszanie potrzeb w zakresie konsultacji pomocy.
Podsumowując, rekomenduje się następujące działania zespołu wdrażającego
Opracowanie regulaminu związanego z deponowania danych badawczych |
Szkolenie dla redaktorów |
Opracowanie dokumentów polityki OA Repozytorium |
Opracowanie deklaracji dostępności (w tym WCAG) |
Repository Preservation |
Rejestracja w RE3data |
Opracowanie wzoru do DMP (w jaki sposób spełniamy warunki FAIR) |
Porządki w dotychczasowych danych |
Rolą Uczelnianej BW jest gromadzenie możliwie kompletnej informacji o dorobku naukowców Uczelni, dlatego zakłada się, że oprócz deponowanych danych w repozytorium, w UBW gromadzone będą także metadane o danych badawczych zdeponowanych poza UBW.
Wymagania techniczne
Możliwości funkcjonalne modułu
Nadawanie DOI
Najważniejszą cechą systemu jest trwałość składowanych danych. Wiąże się to z koniecznością nadawania trwałych identyfikatorów globalnych (DOI). Istotną tego konsekwencją jest warunek nieusuwalności rekordów, wraz ze zdeponowanymi danymi. Co więcej, rekordów tych nie można zmieniać, nawet jeżeli przestają być aktualne.
Pojawienie się nowszych (lepszych, bardziej adekwatnych) danych badawczych w działalności autora skutkuje potrzebą utworzenia nowej wersji. To oznacza konieczność wdrożenia wielowersyjności. Ponadto, w celu usunięcia niebezpieczeństwa, że ktoś wciąż może nieświadomie próbować korzystać z poprzedniej wersji, system powinien zawsze pokazywać wszystkie wersje danych badawczych w jednym widoku i wyjaśniać na czym polegają zmiany w każdej kolejnej wersji i jakie są pomiędzy nimi różnice.
Wielowersyjność
Odpowiedzialność naukowców za wiarygodność i jakość danych badawczych wymusza na docelowym systemie, aby to naukowiec mógł własnoręcznie wprowadzić opis swoich danych badawczych. Wiążą się z tym następujące funkcjonalności:
istnienie przyjaznego interfejsu wprowadzania danych, takiego, aby naukowiec mógł samodzielnie wprowadzić rekord metadanych oraz zdeponować dane badawcze w repozytorium.
proces wprowadzania danych może trwać dłużej niż typowy proces wprowadzania danych bazach tranzakcyjnych, dlatego:
w dowolnym momencie można go przerwać i móc powrócić do niego bez utraty danych;
można skonsultować się z opiekunem (data steward) – przedmiotem konsultacji mogą być sprawy techniczne związane z wprowadzaniem danych, jak też merytoryczne, np. konsultacje w zakresie sposobu udostępniania, licencji,
po zakończeniu fazy edycji naukowiec daje czas redaktorowi i/lub data stewardowi na zweryfikowanie poprawności i kompletności danych;
Z uwagi na powyższe założenia wyróżnia się w cyklu życia danych badawczych następujące etapy:
Wprowadzania danych (faza edycji danych)
Weryfikacji danych przez redaktora i/lub stewarda
stwierdzenie błędów i powrót do (1)
akceptacja metadanych i zdeponowanych plików i przejście do etapu opublikowania
Opublikowanie wersji (zamrożenie zmian)
Nadania identyfikatora DOI - opcja
zmiana stanu na opublikowane
utworzenia nowej wersji (przejście do etapu (1) dla tworzonej wersji)
W momencie nadania DOI określona wersja przestaje być edytowalna. Ewentualne drobne zmiany mogą polegać na usunięciu literówek przez stewarda. Wzbogacenie danych w ramach kolejnych prac badawczych może wymagać utworzenia nowej wersji danych. Decyzję o utworzeniu nowej wersji danych podejmuje naukowiec w uzgodnieniu ze stewardem. Również decyzja o nadaniu DOI nowej wersji jest podjęta po uzgodnieniu ze stewardem.