
Könyvtára révén a nyílt kapcsolt adatok felhőjén, az úgynevezett LOD Cloud-on |
A LOD Cloud a Datahub adatbázis taralmának grafikus megjelenítése. Az adatbázis a világ szemantikus adathalmazainak és azok kapcsolatainak leíró adatait tartalmazza. A hazai intézmények közül az Országos Széchényi Könyvtár, a Szépművészeti Múzeum és az MTA SZTAKI után Magyar Nemzeti Múzeum is felkerült a felhőbe „data-hnm-hu – Hungarian National Museum datasets” néven. Ezt azzal érdemelte ki, hogy a múzeum Központi Könyvtára a teljes online katalógusát publikálta a szemantikus weben [1] BIBFRAME-formátumban [2].
A híres LOD Cloud a legutolsó (2017-08-22-i) állapota szerint
A publikálás több célt szolgált. A könyvtár már régen elkötelezte magát a nyílt bibliográfiai adatok mozgalma mellett. [3]. Ezzel a mostani lépésével a legmagasabb szinten, nyílt kapcsolt adatok formájában tette közkinccsé bibliográfiai rekordjait. A szinteket Tim Berners-Lee, a web és a szemantikus web létrehozója alkotta meg [4]
Az egyes szintek az alábbi előnyöket jelentik a felhasználók számára: A felhasználók a bibliográfiai adatokat
★
megtekinthetik,
kinyomtathatják,
helyileg tárolhatják,
betölthetik a saját rendszerükbe,
módosíthatják a saját igényeik szerint,
megoszthatják másokkal,
★★
speciális szoftverekkel feldolgozhatják,
konvertálhatják más formátumba,
★★★
speciális szoftverek nélkül is feldolgozhatják,
★★★★
bárhonnan linkelhetik,
az azonosító linkeket elmenthetik,
részeiben is felhasználhatják,
más adatokkal egyesíthetik,
★★★★★
más adathalmazokból származó adatokkal együtt tekinthetik meg.
Publikálásunkkal szerettünk volna hozzájárulni a szemantikus web építéséhez. A szemantikus webnek adatokra van szüksége. A könyvtárak rendelkeznek ilyen adatokkal, ráadásul a több évtizedes gépesítésnek és szabványosításnak köszönhetően adataik jól szegmentáltak, ami lehetővé teszi, hogy viszonylag könnyen konvertálják azokat a szemantikus webre.
További célunk volt a BIBFRAME-formátum megismertetése a hazai könyvtárakkal hazai bibliográfiai rekordok konverziója révén. A BIBFRAME
- a leírást integrálja a hálózatba és a hálózatot bevonja a leírásba – azaz egy szemantikus web alapú formátum -, miközben továbbra is szolgálja a könyvtárak speciális igényeit;
- világosan különbséget tesz a fogalmi tartalom és a fizikai/digitális megvalósulás között;
- egyértelműen azonosítja az információs entitásokat,
- megmutatja és hasznosítja az entitások külső és belső kapcsolatait.
Ez nem kevesebbet jelent, mint hogy a jövőben már nem a könyvtárunk számára, hanem a web számára fogunk katalogizálni. Az egyes könyvtárak a bibliográfia rekordok átvétele helyett egymás leírásaira fognak mutatni, azaz a másolásos katalogizálás helyét a linkelés veszi át. A felhasználók pedig a könyvtárak által készített leírásokat egyetlen egységben fogják látni.
A BIBFRAME-formátumban való publikálásunk specialitása, hogy célunk elérése érdekében, hasonlóan a német nemzeti könyvtárhoz – sőt azon egy kicsit túlmutatva –, összekötöttük a hagyományos - ún. MARC alapú - leírást tartalmazó, online katalógusbeli rekordjainkat a BIBFRAME-leírásokkal. A hagyományos leírástól a BIBFRAME-formátumig a leírás állandó, „Link a rekordhoz” feliratú URL-jéhez illesztett „.rdf” kiterjesztéssel lehet eljutni. Egy példán szemléltetve:
Online katalógus leírásának URL-je: http://link.hnm.hu/lib/bib/MNMKVT19563
A BIBFRAME megfelelőjének az URL-je: http://link.hnm.hu/lib/bib/MNMKVT19563.rdf
És ez fordítva is igaz. A BIBFRAME-leírástól el lehet jutni az online katalógusig a BIBFRAME-leírás URL-jét kiegészítve az „.opac” kiterjesztéssel. Így:
BIBFRAME-leírás URL-je: http://data.hnm.hu/doc/colls/lib/bib/MNMKVT19563
Az online katalógusbeli megfelelőjének URL-je: http://data.hnm.hu/doc/colls/lib/bib/MNMKVT19563.opac
Az online katalógus leírásai és a BIBFRAME-leírások között a kapcsolatot a számítógépek számára is megteremtettük az online katalógus HTML oldalainak <HEAD> részében elhelyezett „LINK rel” elem segítségével:
<link rel="alternate" type="application/rdf+xml" title="Structured Descriptor Document (RDF/XML format)" href="http://data.hnm.hu/sparql?query=define%20sql%3Adescribe-mode%20%22LOD%22%20%20DESCRIBE%20%3Chttp%3A%2F%2Fdata.hnm.hu
%2Fid%2Fcolls%2Flib%2Fbib%2FMNMKVT19563%3E&output=application%2Frdf%2Bxml"
A fenti elem jelentése a számítógépek számára: a jelen oldal tartalmát alternatív formában RDF/XML szintaxissal meg lehet találni a href attributumban megadott URL-en.
Célunk eléréséhez több problémát is meg kellett oldani.
Először is kellett egy szerver. A szervert a Nemzeti Információs Infrastruktúra Fejlesztési program bocsájtotta a rendelkezésünkre virtuális szerver formájában. A szerver a
URL címet kapta a szemantikus weben kialakult szokásoknak megfelelően. Ezen a szerveren foglalnak helyet a webes megjelenéshez és a Java programok futtatásához szükséges szoftverek, valamint a BIBFRAME-adatok tárolására és visszakeresésére szolgáló adatbáziskezelő, a Virtuoso (annak is az ingyenes változata). A telepítéseket Idoia Murua Belacortu végezte a szabad idejében spanyolországi otthonából.
A BIBFRAME-adatok a HUNTÉKA adatbázisból exportált MARC rekordok konverziójával álltak elő. A konverziót az olasz @Cult cég végezte: mi kiküldtük a MARC rekordokat, ők pedig visszaküldték a BIBFRAME-formátumú leírásokat, amiket aztán betöltöttünk a Virtuoso adatbázisba. Az @Cult-féle konverzió specialitása, hogy a konverzió során képes megállapítani, milyen műveket tartalmaz a konvertálandó adathalmaz, és az egyes megjelenési formák leírását ezekhez a tényleges művekhez kapcsolja (szemben más konverterekkel, melyek minden megjelenési formához létrehoznak egy álművet). A konverzió további specialitása, hogy a konvertálandó adathalmaz néventitásait összeköti más, külső adathalmazok néventitásaival. A mi neveink az alábbi adathalmazok néventitásaival lettek összekötve:
- Bibliothèque nationale de France (BNF) [5]
- International Standard Name Identifier (ISNI) [6]
- Library of Congress Name Authority File (LC NAF) [7]
- Virtual International Authority File (VIAF) [8]
- Wikidata [9]
Ezen kapcsolatok révén váltak adataink igazi kapcsolt adatokká, ezáltal váltunk jogosulttá az 5 csillagos minősítésre.
Ahhoz, hogy a BIBFRAME-leírásoktól el lehessen jutni az online olvasói katalógus megfelelő oldalaihoz, újabb problémákat kellett megoldanunk.
A könyvtár online katalógusa a Mongúz kft szerverén fut, és egy adott könyv leírását ilyen címen lehetett elérni:
Ez az URL nagyon hosszú és ezért megjegyezhetetlen. Ráadásul nem is tartozik a hnm.hu tartományba, ami pedig egyéb céljaink megvalósítását akadályozta. Mindkét problémát a Mongúz kft. által fejlesztett linkfeloldó [10] oldotta meg. A linkfeloldó segítségével a Magyar Nemzeti Múzeum bármely online rekordjához, így a könyvtári rekordokhoz is hozzá lehet rendelni a World Wide Web Consortium ajánlásának [11] megfelelő kinézetű URL-t. A fenti leírás új URL-je ez:
http://link.hnm.hu/lib/bib/mnmkvt19563
Mint látható, ez az URL már bevonja a leírást a hnm.hu tartományba, rövid, kifejező és könnyen megjegyezhető, szintaxisa révén pedig lehetőséget ad egyéb, nemzeti múzeumi adatbázisok rövid URL-lel való ellátására is.
(Azoknak, akik ki is próbálták a fenti URL-eket, feltűnhet, hogy a linkfeloldó nem a hunteka.asp.hunteka.hu tartományba visz, hanem a catalog.library.hnm.hu tartományba. Ez azért van, mert egyéb terveink megvalósítása szükségessé tette, hogy a katalógusszervert is bevonjuk a hnm.hu tartományba. Ez azonban már a BIBFRAME fejlesztés után történt, a BIBFRAME fejlesztéshez erre a lépésre nem volt szükség.)
Munkánk befejező része a részletes dokumentáció elkészítése volt. A teljes dokumentáció elérhető a http://data.hnm.hu címről kiindulva.
Részletes leírást tettünk közzé a Datahub adatbázisban is. A Datahub-beli bejegyzésnek, valamint annak, hogy mind a dokumentáció, mind a szemantikus adatok közzétételének módja megfelel a legmagasabb követelményeknek, köszönhető, hogy az adathalmazunk végül megjelent a már említett LOD cloudon.
Eredményeinket pedig a Katalisten [12], a NETWORKSHOP konferencián [13], valamint a LINKEDIN-en [14] népszerűsítettük.
Sokat dolgoztunk, de megérte: egyre több magyar könyvtár érdeklődik a BIBFRAME felől, meghívást kaptunk a European BIBFRAME Workshopra [15], és felkerültünk a Library of Congress honlapjára a BIBFRAME korai felhasználói közé [16], többek között olyan hírességek mellé, mint
- Stanford University,
- Deutsche Nationalbibliothek,
- Library of Alexandria,
- Music Library Association,
- The National Library of Medicine,
- Columbia University Libraries,
- Princeton University Library,
- Cornell University Library és maga a
- Library of Congress.
Ezeket az eredményeket a Magyar Nemzeti Múzeum vezetőségének megértő elvi támogatása mellett nemzetközi összefogásban sikerült elérni teljesen ingyenesen, a meglévő szoftveres és emberi erőforrások megfelelő összekapcsolása révén.
[1]: https://archiv.magyarmuzeumok.hu/muhely/2337_potty_lesz_a_szepmuveszetibol. A cikk első része a szemantikus web ismertetése.
[2]: http://www.loc.gov/bibframe/
[3]: Horváth Ádám: Open Data a könyvtárban https://archiv.magyarmuzeumok.hu/muhely/3687_open_data_a_konyvtarban
[4]: 5 ★ OPEN DATA (http://5stardata.info/en/)
[5]: http://data.bnf.fr/
[6]: http://isni.org/
[7]: http://id.loc.gov/authorities/names.html
[8]: http://viaf.org/
[9]: http://wikidata.org
[10] A linkfeloldó működésének részletes leírása: http://link.hnm.hu
[11]: Cool URIs for the Semantic Web (https://www.w3.org/TR/cooluris/)
[12]: https://listserv.niif.hu/pipermail/katalist/2017-May/036758.html
[13]: Horváth Ádám – Hubay Miklós: A BIBFRAME új keretei 2017-ben: http://niif.videotorium.hu/hu/recordings/17770
[14]: https://www.linkedin.com/pulse/bibframe-library-hungarian-national-museum-adam-horvath/
[15]: https://wiki.dnb.de/display/EBW/European+BIBFRAME+Workshop+2017
[16]: https://www.loc.gov/bibframe/implementation/register.html
(Horváth Ádám - Magyar Nemzeti Múzeum, Központi Könyvtár)
