Swepub version 1.8
I dag produktionssattes Swepub version 1.8.
En ny version av Swepub har blivit satt i produktion den 19 maj. Tre områden har varit i fokus för releasen:
- Effektivisering av datahämtningen och -hanteringen samt förenkling av förvaltningen av Swepub.
- Förbättring av identifieringen och sammanslagningen av dubbletter.
- Implementering av den uppdaterade Svenska listan från Vetenskapsrådet.
Utöver fokusområden har det arbetats med återkoppling av berikningar i Swepub-data och nya variabler i API:et för Bibliometri. I samband med releasen påbörjas även datahämtningar från Högskolan Kristianstad som har bytt systemleverantör. I organisationsmenyerna har namnen för Ersta Sköndal Bräcke högskola bytts till Marie Cederschiöld högskola och Mälardalens högskola till Mälardalens universitet.
I anslutning till lanseringen av den nya versionen kommer all data att hämtas och uppdateras på nytt. Beräknad tid för detta är cirka åtta timmar.
För frågor eller vidare information kontakta Libris kundservice.
Effektivisering av datahantering
Förbättrad datahantering i Swepub för att snabbare hämta och bearbeta data.
Refaktorering av Swepub
Swepubs programkod har omstrukturerats. Syftet med denna så kallade refaktorering har varit att förenkla vidareutveckling och underhåll av Swepubs kod. Refaktoreringen har inte påverkat funktionaliteten i Swepub.
I och med refaktoreringen har datahämtningar och -bearbetningar effektiviserats i Swepub. Datamiljön består inte längre av mikrotjänster vilket har lett till att en total omladdning av data sker nu i ca åtta timmar i stället för de tidigare tre-fem dygnen. Eftersom även datalagringen har flyttats, har den tidigare avgränsningen på max 10 000 poster i Bibliometritjänsten kunnat avlägsnas.
I samband med refaktoreringen har Swepubs kod dokumenterats och tillgängliggjorts i GitHub Länk till annan webbplats..
Dubbletthantering
Förbättringar i identifiering och sammanslagning av dubbletter. Läs mer om dubbletthanteringen i Swepub. Observera att trots förbättringar i dubbletthanteringen förekommer det fortsatt dubbletter och felaktiga sammanslagningar.
Identifiering av dubblettkandidater
Dubblettidentifieringen har förbättrats genom att titlar och sammanfattningar nu jämförs på ett sätt som bättre tolererar felstavningar och smärre avvikelser. Vid jämförandet av titel läggs nu mindre vikt på titlar som förekommer ofta, exempelvis Inledning, Förord, Proceeding.
Sammanslagning av information om upphovspersoner och affilieringar
Identifieringen och sammanslagningen av information om upphovspersoner och deras affilieringar har förbättrats genom att i stället för exakt match av hela namnet, jämföra delnamn med så kallat Levenshteinavstånd Länk till annan webbplats.. Detta möjliggör matchningar trots felstavningar och variationer i ordningen på delnamnen. Även i sådana fall där namn i en post skulle ha skrivits med fullständigt förnamn och i en annan post med initial, kan Swepub ändå identifiera dessa två som samma upphovsperson.
Vid sammanslagningen av poster utgås från fullständiga namnformer för upphovspersoner och auktoriserade affilieringar. Affilieringar som inte lyckas matchas med den auktoriserade affilieringen eller andra fritextaffilieringar läggs till.
Öppna API:er till Swepub
För att göra det enklare att använda Swepub-data i egna applikationer är API:er till Swepubs tjänster Länk till annan webbplats. öppna och dokumenterade enligt OpenAPI - specifikationen i Swagger.
BibliometriAPI
API:et mot Bibliometritjänsten har uppdaterats med att lägga till möjlighet att anropa:
- Om publikationen har fått autoklassning.
- Mer fullständig information om serie.
- Om publikationen ingår i en publiceringskanal som i sin tur ingår i Directory of Open Access Journals - DOAJ.
- Om versionen för fulltexten.
Swepub bibliometri
Nya och förbättrade funktioner i Swepub bibliometri Länk till annan webbplats..
Uppdaterat svenskt register för sakkunniggranskade publiceringskanaler
Den så kallade Svenska listan har uppdaterats av Vetenskapsrådet. Den uppdaterade listan har implementerats i Swepub. Poster som har ISSN och utgivningsår som matchar med ISSN och bedömningsår i Svenska listan märks upp. Vid sökning i bibliometritjänsten går det att avgränsa enligt den uppdaterade listan.
Avgränsningen på max antal poster avlägsnad
Avgränsningen på max antal poster som Swepubs tjänst för Bibliometri har haft (max 10 000 poster per uttag) har nu kunnat avlägsnas. Avgränsningen berodde på systemarkitektoniska hinder som i och med refaktoreringen har kunnat tas bort.
Avgränsning till öppet tillgänglig output
Vid sökning i bibliometritjänsten går det nu även att avgränsa till endast öppet tillgänglig output.
Förbättrad matchning mot nyckelord
Sökning på nyckelord är nu mer tillåtande mot gemener och versaler. Sökningen genererar träff oavsett hur man har angett nyckelordet.
Swepub databearbetning
Nya och förbättrade funktioner i Swepub databearbetning Länk till annan webbplats..
Berikade data om öppen tillgång
Nu visas metadata som Swepub har hämtat från de externa datakällorna Unpaywall och Directory of Open Access Books (DOAB). Här visas:
- URI för fulltexten
- Åtkomstpolicy i form av URI till KB:s tjänst id.kb.se
- Version av fulltexten
- Källa för URI:n
Observera att när data från de externa datakällorna uppdateras en gång per halvår, kan status på berikningarna ändras. Det är rekommenderat att kontrollera de berikningar som har gjorts i Swepub och återkoppla dem till sitt lokala system så att berikningarna även finns i originalposten.
Ogiltiga ORCIDs avlägsnade
ORCID-ID:n som inte följer formatet censureras från utgående Swepub-data. Syftet är att felaktigheter så som e-postadresser och personliga inloggningar som kan återfinnas i originaldata inte förs vidare i datauttagen från Swepub.
Det är rekommenderat att åtgärda ogiltiga ORCIDs omgående för att personuppgifter som felaktigt har angetts som ORCIDs inte återfinns i originaldata.
Ogiltiga identifikatorer flyttade till incorrectlyIdentifiedBy
Identifikatorer som inte går att validera och verifiera mot externa datakällor flyttas nu till fältet incorrectlyIdentifiedBy i Swepub-data. Det gäller identifikatorerna DOI, ISBN, ISI ID och ISSN.
Vill du ha fler nyheter från KB?
Under Prenumerera på Nytt från KB kan du välja de områden som intresserar dig. Du kan också följa oss på LinkedIn Länk till annan webbplats..