W tym punkcie omówimy problemy związane z jakością danych przede wszystkim w zakresie wymagań opisu bibliograficznego przekazywanych danych.
Jednym z podstawowych problemów jest to, że przekazywane dane powinny odwoływać sie do identyfikatorów słownikowych. W przypadku danych wysoko punktowanych warunek ten jest na ogół spełniony. gorzej wygląda sytuacja w przypadku tych osiągnięć, które są opublikowane w wydawnictwach z listy lub też w czasopismach spoza listy. W takich przypadkach wciąż istnieje możliwość przekazania danych do PBN, jednakże opis bibliograficzny musi być bardzo dokładny, aby można było zmapować wymagane dane na strukturę PBN. Dotyczy to przede wszystkim książek autorskich i redagowanych, rozdziałów w książkach, wystąpień konferencyjnych na konferencjach spoza wykazu, oraz artykułów z czasopism spoza wykazu.
Dla wszystkich typów danych bibliograficznych poza obowiązkowymi elementami opisu bibliograficznego, takimi jak autorzy, tytuł, źródło (czasopismo, książka), są
język (kod z listy języków)
Książki i rozdziały z książek
Podstawowe dane o które trzeba zadbać w przypadku opisów książek to:
ISBN i/lub DOI
wydawca
W przypadku braku ISBN i DOI w zasadzie nie ma możliwości wysłania opisu z udziałami) do PBN. Dlatego należy zidentyfikować publikacje książkowe i uzupełnić braki w tym zakresie.
W przypadku wydawców spoza listy ministerialnej należy zadbać o to aby dodatkowo podać URL strony wydawcy.
Przy okazji badania jakości danych bibliograficznych monografii, należy zweryfikować czy wydawca jest prawidłowo wstawiony w polu wydawcy instytucjonalnego, w szczególności trzeba zweryfikować czy wydawca jest na liście MNiSW i czy daje punkty. W szczególności, należy zidentyfikować takie przypadki, ewentualnie wybrać właściwego wydawcę z wykazu, tak aby nadana była odpowiednia punktacja.
Zdarzają się też przypadki z poprawnie wstawionymi wydawcami, ale Rodzaj wydawnictwa jest ustawiony na ‘inne’ i wtedy książka otrzymuje 0 pkt.
Przydatne zapytania dla książek:
Książki od 2017 roku, z punktacją poniżej 20pkt, z powiązaną instytucją wydawcy, ale rekord wydawcy prawdopodobnie nie jest aktualny (tylko wyjątkowo, może to faktycznie być wydawca spoza wykazu), nie oznaczone jako pomijane przy parametryzacji:
score < 20 and publisherInstitution-id>0 and not(noEvaluation='true')
W tym oznaczone jako Rodzaj wydawnictwa książkowego = Inne:
score < 20 and publisherInstitution-id>0 and not(noEvaluation='true') and @bookType='INNE'
W tym z ISBN/DOI/ISSN - być może można oznaczyć jako Monografia
score < 20 and publisherInstitution-id>0 and not(noEvaluation='true') and @bookType='INNE' and (@isbn or @doi or @journalseries-issn)
Błędy w rekordzie książki przenoszą się na błędy w rodziałąch w książce. Po poprawieniu opisów w książkach, po pewnym czasie, powinny te opisy przenieść się do rozdziałów i spowodować nadanie odpowiedniej punktacji rozdziałom. Jednak, na wszelki wypadek, można to jeszcze potem sprawdzić wykorzystując poniższe zapytania
Przydatne zapytania dla rozdziałów:
Rozdziały z książki od 2017 roku, punktacją poniżej 20pkt (w tym za mat. konferencyjny WoS), powiązaną instytucją wydawcy, ale rekord wydawcy prawdopodobnie nie jest aktualny (tylko wyjątkowo, może to faktycznie być wydawca spoza wykazu), nie oznaczone jako pomijane przy parametryzacji:
book-id>0 and score < 20 and book-publisherInstitution-id>0 and not(noEvaluation='true') and not(book-noEvaluation='true')
w tym oznaczone jako Rodzaj wydawnictwa książkowego = Inne 374
book-id>0 and score < 20 and book-publisherInstitution-id>0 and not(noEvaluation='true') and not(book-noEvaluation='true') and @book-bookType='INNE'
w tym z ISBN/DOI/ISSN - być może można oznaczyć jako Monografia 320
book-id>0 and score < 20 and book-publisherInstitution-id>0 and not(noEvaluation='true') and not(book-noEvaluation='true') and @book-bookType='INNE' and (@book-isbn or @book-doi or @book-journalseries-issn)
Materiały konferencyjne
Aktualne testy pokazują, że PBN nie akceptuje publikacji, w których wydarzenie konferencji nie posiada informacji dotyczącej website. Zaleca się zatem uzupełnienie danych w tym zakresie.
W celu zidentyfikowania takich błędów w publikacjach konferencyjnych (zakładka artykuły
, filtr daty od roku 2017) należałoby zadać pytanie:
score>0 and ((book/conference/id>0 and (scoreSource='conferenceList' or scoreSource='conferenceIndex') and not(book/conference/@url)) or (journalissue/conference/id>0 and (scoreSource='conferenceList' or scoreSource='conferenceIndex') and not(journalissue/conference/@url)))
W zależności od potrzeb można zwiększyć wymaganie na score:
score>20 and ((book/conference/id>0 and (scoreSource='conferenceList' or scoreSource='conferenceIndex') and not(book/conference/@url)) or (journalissue/conference/id>0 and (scoreSource='conferenceList' or scoreSource='conferenceIndex') and not(journalissue/conference/@url)))