Szakmai munka

Könyvtára révén a nyílt kapcsolt adatok felhőjén, az úgynevezett LOD Cloud-on |

A LOD Cloud a Datahub adatbázis taralmának grafikus megjelenítése. Az adatbázis a világ szemantikus adathalmazainak és azok kapcsolatainak leíró adatait tartalmazza. A hazai intézmények közül az Országos Széchényi Könyvtár, a Szépművészeti Múzeum és az MTA SZTAKI után Magyar Nemzeti Múzeum is felkerült a felhőbe „data-hnm-hu – Hungarian National Museum datasets” néven. Ezt azzal érdemelte ki, hogy a múzeum Központi Könyvtára a teljes online katalógusát publikálta a szemantikus weben [1] BIBFRAME-formátumban  [2].

A híres LOD Cloud a legutolsó (2017-08-22-i) állapota szerint

A publikálás több célt szolgált. A könyvtár már régen elkötelezte magát a nyílt bibliográfiai adatok mozgalma mellett. [3]. Ezzel a mostani lépésével a legmagasabb szinten, nyílt kapcsolt adatok formájában tette közkinccsé bibliográfiai rekordjait. A szinteket Tim Berners-Lee, a web és a szemantikus web létrehozója alkotta meg [4] 

Az egyes szintek az alábbi előnyöket jelentik a felhasználók számára: A felhasználók a bibliográfiai adatokat


megtekinthetik,
kinyomtathatják,
helyileg tárolhatják,
betölthetik a saját rendszerükbe,
módosíthatják a saját igényeik szerint,
megoszthatják másokkal,

★★
speciális szoftverekkel feldolgozhatják,
konvertálhatják más formátumba,

★★★
speciális szoftverek nélkül is feldolgozhatják,

★★★★
bárhonnan linkelhetik,
az azonosító linkeket elmenthetik,
részeiben is felhasználhatják,
más adatokkal egyesíthetik,

★★★★★
más adathalmazokból származó adatokkal együtt tekinthetik meg.

Publikálásunkkal szerettünk volna hozzájárulni a szemantikus web építéséhez. A szemantikus webnek adatokra van szüksége. A könyvtárak rendelkeznek ilyen adatokkal, ráadásul a több évtizedes gépesítésnek és szabványosításnak köszönhetően adataik jól szegmentáltak, ami lehetővé teszi, hogy viszonylag könnyen konvertálják azokat a szemantikus webre.

További célunk volt a BIBFRAME-formátum megismertetése a hazai könyvtárakkal hazai bibliográfiai rekordok konverziója révén. A BIBFRAME

  • a leírást integrálja a hálózatba és a hálózatot bevonja a leírásba – azaz egy szemantikus web alapú formátum -, miközben továbbra is szolgálja a könyvtárak speciális igényeit;
  • világosan különbséget tesz a fogalmi tartalom és a fizikai/digitális megvalósulás között;
  • egyértelműen azonosítja az információs entitásokat,
  • megmutatja és hasznosítja az entitások külső és belső kapcsolatait.

Ez nem kevesebbet jelent, mint hogy a jövőben már nem a könyvtárunk számára, hanem a web számára fogunk katalogizálni. Az egyes könyvtárak a bibliográfia rekordok átvétele helyett egymás leírásaira fognak mutatni, azaz a másolásos katalogizálás helyét a linkelés veszi át. A felhasználók pedig a könyvtárak által készített leírásokat egyetlen egységben fogják látni.

A BIBFRAME-formátumban való publikálásunk specialitása, hogy célunk elérése érdekében, hasonlóan a német nemzeti könyvtárhoz – sőt azon egy kicsit túlmutatva –, összekötöttük a hagyományos - ún. MARC alapú - leírást tartalmazó, online katalógusbeli rekordjainkat a BIBFRAME-leírásokkal. A hagyományos leírástól a BIBFRAME-formátumig a leírás állandó, „Link a rekordhoz” feliratú URL-jéhez illesztett „.rdf” kiterjesztéssel lehet eljutni. Egy példán szemléltetve:

Online katalógus leírásának URL-je: http://link.hnm.hu/lib/bib/MNMKVT19563

A BIBFRAME megfelelőjének az URL-je: http://link.hnm.hu/lib/bib/MNMKVT19563.rdf

És ez fordítva is igaz. A BIBFRAME-leírástól el lehet jutni az online katalógusig a BIBFRAME-leírás URL-jét kiegészítve az „.opac” kiterjesztéssel. Így:

BIBFRAME-leírás URL-je: http://data.hnm.hu/doc/colls/lib/bib/MNMKVT19563

Az online katalógusbeli megfelelőjének URL-je: http://data.hnm.hu/doc/colls/lib/bib/MNMKVT19563.opac

Az online katalógus leírásai és a BIBFRAME-leírások között a kapcsolatot a számítógépek számára is megteremtettük az online katalógus HTML oldalainak <HEAD> részében elhelyezett „LINK rel” elem segítségével:

<link rel="alternate" type="application/rdf+xml"  title="Structured Descriptor Document (RDF/XML format)" href="http://data.hnm.hu/sparql?query=define%20sql%3Adescribe-mode%20%22LOD%22%20%20DESCRIBE%20%3Chttp%3A%2F%2Fdata.hnm.hu
%2Fid%2Fcolls%2Flib%2Fbib%2FMNMKVT19563%3E&amp;output=application%2Frdf%2Bxml"

A fenti elem jelentése a számítógépek számára: a jelen oldal tartalmát alternatív formában RDF/XML szintaxissal meg lehet találni a href attributumban megadott URL-en.

Célunk eléréséhez több problémát is meg kellett oldani.

Először is kellett egy szerver. A szervert a Nemzeti Információs Infrastruktúra Fejlesztési program bocsájtotta a rendelkezésünkre virtuális szerver formájában. A szerver a

http://data.hnm.hu

URL címet kapta a szemantikus weben kialakult szokásoknak megfelelően. Ezen a szerveren foglalnak helyet a webes megjelenéshez és a Java programok futtatásához szükséges szoftverek, valamint a BIBFRAME-adatok tárolására és visszakeresésére szolgáló adatbáziskezelő, a Virtuoso (annak is az ingyenes változata). A telepítéseket Idoia Murua Belacortu végezte a szabad idejében spanyolországi otthonából.

A BIBFRAME-adatok a HUNTÉKA adatbázisból exportált MARC rekordok konverziójával álltak elő. A konverziót az olasz @Cult cég végezte: mi kiküldtük a MARC rekordokat, ők pedig visszaküldték a BIBFRAME-formátumú leírásokat, amiket aztán betöltöttünk a Virtuoso adatbázisba. Az @Cult-féle konverzió specialitása, hogy a konverzió során képes megállapítani, milyen műveket tartalmaz a konvertálandó adathalmaz, és az egyes megjelenési formák leírását ezekhez a tényleges művekhez kapcsolja (szemben más konverterekkel, melyek minden megjelenési formához létrehoznak egy álművet). A konverzió további specialitása, hogy a konvertálandó adathalmaz néventitásait összeköti más, külső adathalmazok néventitásaival. A mi neveink az alábbi adathalmazok néventitásaival lettek összekötve:

  • Bibliothèque nationale de France (BNF) [5]
  • International Standard Name Identifier (ISNI) [6]
  • Library of Congress Name Authority File (LC NAF) [7]
  • Virtual International Authority File (VIAF) [8]
  • Wikidata [9]

Ezen kapcsolatok révén váltak adataink igazi kapcsolt adatokká, ezáltal váltunk jogosulttá az 5 csillagos minősítésre.

Ahhoz, hogy a BIBFRAME-leírásoktól el lehessen jutni az online olvasói katalógus megfelelő oldalaihoz, újabb problémákat kellett megoldanunk.

A könyvtár online katalógusa a Mongúz kft szerverén fut, és egy adott könyv leírását ilyen címen lehetett elérni:

http://hunteka.asp.hunteka.hu/mnm/index.jsp?&page=details&dbname=database&bib1id=4&bib1field=0&record_format=marc&term=19563

Ez az URL nagyon hosszú és ezért megjegyezhetetlen. Ráadásul nem is tartozik a hnm.hu tartományba, ami pedig egyéb céljaink megvalósítását akadályozta. Mindkét problémát a Mongúz kft. által fejlesztett linkfeloldó [10] oldotta meg. A linkfeloldó segítségével a Magyar Nemzeti Múzeum bármely online rekordjához, így a könyvtári rekordokhoz is hozzá lehet rendelni a World Wide Web Consortium ajánlásának [11] megfelelő kinézetű URL-t. A fenti leírás új URL-je ez:

http://link.hnm.hu/lib/bib/mnmkvt19563

Mint látható, ez az URL már bevonja a leírást a hnm.hu tartományba, rövid, kifejező és könnyen megjegyezhető, szintaxisa révén pedig lehetőséget ad egyéb, nemzeti múzeumi adatbázisok rövid URL-lel való ellátására is.

(Azoknak, akik ki is próbálták a fenti URL-eket, feltűnhet, hogy a linkfeloldó nem a hunteka.asp.hunteka.hu tartományba visz, hanem a catalog.library.hnm.hu tartományba. Ez azért van, mert egyéb terveink megvalósítása szükségessé tette, hogy a katalógusszervert is bevonjuk a hnm.hu tartományba. Ez azonban már a BIBFRAME fejlesztés után történt, a BIBFRAME fejlesztéshez erre a lépésre nem volt szükség.)

Munkánk befejező része a részletes dokumentáció elkészítése volt. A teljes dokumentáció elérhető a http://data.hnm.hu címről kiindulva.

Részletes leírást tettünk közzé a Datahub adatbázisban is. A Datahub-beli bejegyzésnek, valamint annak, hogy mind a dokumentáció, mind a szemantikus adatok közzétételének módja megfelel a legmagasabb követelményeknek, köszönhető, hogy az adathalmazunk végül megjelent a már említett LOD cloudon.

Eredményeinket pedig a Katalisten [12], a NETWORKSHOP konferencián [13], valamint a LINKEDIN-en [14] népszerűsítettük.

Sokat dolgoztunk, de megérte: egyre több magyar könyvtár érdeklődik a BIBFRAME felől, meghívást kaptunk a European BIBFRAME Workshopra [15], és felkerültünk a Library of Congress honlapjára a BIBFRAME korai felhasználói közé [16], többek között olyan hírességek mellé, mint

  • Stanford University,
  • Deutsche Nationalbibliothek,
  • Library of Alexandria,
  • Music Library Association,
  • The National Library of Medicine,
  • ​Columbia University Libraries,
  • Princeton University Library,
  • Cornell University Library és maga a
  • Library of Congress.

Ezeket az eredményeket a Magyar Nemzeti Múzeum vezetőségének megértő elvi támogatása mellett nemzetközi összefogásban sikerült elérni teljesen ingyenesen, a meglévő szoftveres és emberi erőforrások megfelelő összekapcsolása révén.

[1]: https://archiv.magyarmuzeumok.hu/muhely/2337_potty_lesz_a_szepmuveszetibol. A cikk első része a szemantikus web ismertetése.
[2]: http://www.loc.gov/bibframe/
[3]: Horváth Ádám: Open Data a könyvtárban  https://archiv.magyarmuzeumok.hu/muhely/3687_open_data_a_konyvtarban
[4]: 5 ★ OPEN DATA (http://5stardata.info/en/)
[5]: http://data.bnf.fr/
[6]: http://isni.org/
[7]: http://id.loc.gov/authorities/names.html
[8]: http://viaf.org/
[9]: http://wikidata.org
[10] A linkfeloldó működésének részletes leírása: http://link.hnm.hu
[11]: Cool URIs for the Semantic Web (https://www.w3.org/TR/cooluris/)
[12]: https://listserv.niif.hu/pipermail/katalist/2017-May/036758.html
[13]: Horváth Ádám – Hubay Miklós: A BIBFRAME új keretei 2017-ben: http://niif.videotorium.hu/hu/recordings/17770
[14]: https://www.linkedin.com/pulse/bibframe-library-hungarian-national-museum-adam-horvath/
[15]: https://wiki.dnb.de/display/EBW/European+BIBFRAME+Workshop+2017
[16]: https://www.loc.gov/bibframe/implementation/register.html

(Horváth Ádám - Magyar Nemzeti Múzeum, Központi Könyvtár)