Metadata vid dubletter

I ett MRSS-flöde, vad är önskad leverans om ett dokument samtidigt publiceras på två olika platser och därmed får två olika URL/nätadresser (R102)? Valideringen bör ju inte acceptera dubblett av metadatafältet R102. Ska man duplicera objektet med respektive URL? Eller räcker det att välja ett utav dem? Eller ska man välja den ena och lägga den som R102 och den andra som R101a?

Kommentarer

  • En jättebra och viktig fråga.

    Det går bra att leverera ett dokument som är publicerat på två olika nätadresser (R102). Det viktiga är att de refererar samma värde som identifikator (R101 och/eller R101a).

    Kungliga biblioteket
  • Förstår jag dig rätt, man levererar det alltså som två separata dokument med olika R102, men med samma R101 och/eller R101a?

  • Helt rätt uppfattat, alltså i två olika //item med olika //link, men med samma //guid och/eller //dcterms:identifier[@xsi:type]

    Kungliga biblioteket
  • En följdfråga; i de fall där varje dokument på en server har väldigt många URLer, ska då samtliga URL-dubbletter tas med? Eftersom protokoll, host och parametrar ingår i URL kan det i realiteten bli många alternativa URLer. Ett exempel (som i sin tur kan kombineras i närmast det oändliga) :
    http://domän.se/dokument.pdf
    http://www.domän.se/dokument.pdf
    https://www.domän.se/dokument.pdf
    http://www.domän.se/dokument.pdf&lang=sv
    http://www.domän.se/dokument.pdf&lang=sv_SE

  • Hej Kristoffer,

    Det finns flera olika sätt att lösa detta på, men det kan vara svårt för mig att svara på vilket sätt som är enklast i det här fallet.

    Det viktiga för oss är att det inte skapas flera katalogposter för samma dokument. Detta uppnås genom att samma dokument men som publiceras på flera olika platser refererar samma identifikatorer (R101 och/eller R101a).

    Olika lösningar:

    • Filtrera så att dokumentet endast skickas en gång, det finns inget krav på att samtliga URL:er skickas med.

    • Om dokumentet levereras flera gånger med exempelvis olika publiceringsadresser är det viktigt att alla dessa versioner delar minst en gemensam identifikator (R101 eller R101a).

    • Det är förstås möjligt att repetera alla URL:er som //dcterms:identifier@xsi:type="dcterms:uri men det är inget krav.

    För att summera, det viktiga är att dokumentet levereras och att det inte skapas dublettposter. Det finns alltså inget krav att samma dokument levereras en gång för varje publiceringsadress, men om det är svårt att filtrera bort dublettleveranser så måste dessa referera minst en gemensam identifikator så att det inte skapas dublettposter i den nationella bibliografiska katalogen.

    Kungliga biblioteket
  • Hej Daniel!
    Tack för ditt uttömmande svar. Nu vet jag precis vad som gäller.

Kommentera eller skriv ett nytt inlägg

Ditt namn och inlägg kan ses av alla. Din e-post och ditt telefonnummer visas aldrig publikt.