Wymagania i rekomendacje techniczne

Wymagania techniczne

Trwałość danych

Najważniejszym wymogiem technicznym nakładanym na system jest trwałość składowanych danych. Wiąże się to z koniecznością nadawania trwałych identyfikatorów globalnych (DOI[1]) (por. Wymagania i rekomendacje organizacyjne). Istotną tego konsekwencją jest warunek nieusuwalności rekordów metadanych, wraz ze zdeponowanymi danymi. Co więcej, opublikowanych rekordów nie można zmieniać,  nawet jeżeli przestają być aktualne.

Wielowersyjność

Pojawienie się nowszych (lepszych, bardziej adekwatnych) danych badawczych w działalności autora skutkuje potrzebą utworzenia nowej wersji. To oznacza konieczność wdrożenia wielowersyjności[2]. Ponadto, w celu usunięcia niebezpieczeństwa, że ktoś wciąż może nieświadomie próbować korzystać z poprzedniej wersji, system zawsze pokauje wszystkie wersje danych badawczych w jednym widoku i wyjaśnia na czym polegają zmiany w każdej kolejnej wersji i jakie są pomiędzy nimi różnice.    

Deponowanie danych

Odpowiedzialność naukowców za wiarygodność i jakość danych badawczych wymusza na systemie, aby to naukowiec mógł własnoręcznie wprowadzić opis swoich danych badawczych. Wiążą się z tym następujące rozwiązania, które wprowadzono:

  1. Stworzono nowy przyjazny interfejs wprowadzania danych, taki aby naukowiec mógł samodzielnie wprowadzić rekord metadanych oraz zdeponować dane badawcze w repozytorium.

  2. Proces wprowadzania danych może trwać dłużej niż typowy proces wprowadzania danych bazach tranzakcyjnych, jest on zorganizowany w taki sposób, aby

    1. w dowolnym momencie można go przerwać aby później powrócić do niego  bez utraty danych;

    2. można doprosić innych naukowców (współautorów) do współedytowania rekordu danych badawczych

    3. można było skonsultować się z opiekunem (data steward) – wdrożono komunikację pomiędzy naukowcami a zespołami redaktorów/stewardów, przedmiotem konsultacji mogą być sprawy techniczne związane z wprowadzaniem danych, jak też merytoryczne, np. konsultacje w zakresie sposobu udostępniania, licencji;

    4. zaimplementowano proces współpracy (workflow) pomiędzy nukowcami a data-stewardami;

Ad. 2c: Tylko jedna osoba może edytować konkretną wersję danych badawczych. Doproszenie innej osoby oznacza przekazania tej osobie uprawnień do edycji, ale osoba przekazująca sama traci te uprawnienia.

Z uwagi na powyższe założenia zaprojektowano i zrealizowano w systemie obsługę procesów:

a.       Wprowadzania danych (faza edycji danych)

b.       Weryfikacji danych przez zespół redaktorów/stewardów

c.       Nadania identyfikatora DOI

d.       Utworzenia nowej wersji

 

Rekomendacje dotyczące infrastruktury IT

Rekomenduje się zweryfikowanie:

  1. Procedury bezpieczeństwa systemu oraz odporności na ataki

  2. Zabezpieczenia trwałości zasobów informacyjnych i ich odporności na awarię sprzętu

 


[1] Nadanie DOI danym badawczym jest rozumiane, podobnie jak w publikacjach, jako tożsame z „opublikowaniem” danych badawczych, podobnie więc jak nie można zmieniać raz opublikowanego artykułu, nie można zmieniać raz opublikowanych danych badawczych. Można jedynie „opublikować” nowszą wersję

[2] Cecha wielowersyjności jest obowiązującym kryterium dla repozytoriów danych badawczych w wymaganiach DataCite.