Szakmai munka

A hálózat fejlődése

Kevin Kelly: The next 5,000 days of the web (TEDX, 2007 december: http://www.ted.com/talks/kevin_kelly_on_the_next_5_000_days_of_the_web) című előadásának megállapításai ma is érvényesek. Kelly úgy gondolja, hogy a hálózat fejlődése – egy bizonyos szemszögből nézve – a következő fokozatokon ment keresztül: kezdetben a gépeket kapcsolták össze. Ez volt a Telnet és Gopher korszaka, amikor a Telnet program segítségével lehetett egy nagyszámítógép termináljáról bejelentkezni egy másik (távoli) nagyszámítógépre, és ott lehetett műveleteket végrehajtani. A Gopher pedig – leegyszerűsítve – a távoli számítógépen található információkhoz való hozzáférést könnyítette meg. Az egész technológia azon alapult, hogy a számítógépek csomagokat továbbítottak és osztottak meg. Minden számítógép részt vett ebben, függetlenül attól, hogy neki szólt-e a csomag vagy sem.

A fejlődés következő fázisában már az oldalakat kapcsolták össze. A számítógépet mint egységet felváltotta az oldal mint egység. Ez a World Wide Web korszaka. Ezt mindenki ismeri, hiszen nagyrészt ma, 2015-ben is ebben a korszakban élünk. Ebben a világban mindenkinek meg kellett, meg kell osztania a neten azt, amije van honlapok és webes szolgáltatások (például online olvasói katalógus) formájában azért, hogy mások is csatlakozhassanak hozzá, és linket helyezhessenek el az oldalára. Ezáltal válunk, váltunk igazán a World Wide Web részévé.

A következő korszak Kelly 2007-es előadása szerint az adatok összekapcsolásának a kora lesz. 2015-ben már azt mondhatjuk, hogy részben ebben a korban élünk. Ezt az időszakot szokás a szemantikus web korának is nevezni, melyben az adatokat RDF állítások formájában lehet közzétenni. Ebben a periódusban már adatokat kell közölnünk magunkról, hogy más adatokkal interakcióba léphessenek. Minél több adatot közlünk, annál többet vehetünk ki a rendszerből. Egy példával megvilágítva: minél több adatot közlünk magunkról, annál több és testre szabottabb szolgáltatásban lehet részünk a Google, a Facebook stb. közösségi portálok vagy újabban a Windows 10 által. Előfordulhat, hogy valakinek nem éri meg a szolgáltatásokért fizetendő ár, a személyes adatok megadása, de nyilvános közgyűjtemények esetén semmilyen tényező nem tarthatja vissza az intézményeket attól, hogy közzétegyék a gyűjteményük egyes darabjait leíró metaadatokat. Mit várhatnak a közgyűjtemények ettől az adatközléstől? A legkönnyebben ezt a BIBFRAME példáján tudom szemléltetni. A könyvtári csere (és egyben leírási) formátumot, a MARC-ot leváltani szándékozó (és nagy valószínűséggel le is váltó) BIBFRAME kezdeményezés és formátum már adatok (RDF állítások) formájában adja meg a leírást, mely adatokhoz bárki csatlakozhat, azaz újabb állításokat tehet hozzá. Az egyik könyvtár leír egy művet, a másik pedig közli, ha neki is megvan a mű. A következő könyvtár hozzáteszi, hogy ki és hol írt róla recenziót stb. Így a könyvtár leírása újabb és újabb adatokkal gazdagodik. Ezáltal az egész könyvtári rendszer is bővül, hiszen (elvben) létrejön egy világméretű közös katalógus anélkül, hogy ez külön munkát igényelne. Azért csak elvben – egyelőre -, mert a megvalósításhoz szükséges számítási kapacitás még nem áll korlátlanul rendelkezésre, és lehet, hogy átmenetileg különféle erőfeszítéseket kell tenni, hogy ez a katalógus létrejöjjön. (Az adatokat például be kell gyűjteni, le kell indexelni, kereshetővé kell tenni speciális szoftverekkel. A távolabbi jövőben remélhetőleg ezekre már nem lesz szükség véleményem szerint.) Az adatok összekapcsolása révén nemcsak a könyvtári rendszer lesz gazdagabb, hanem az egész internetes környezetünk is, hiszen az adatok közzétételére használt RDF szabvány nem könyvtárspecifikus, hanem világméretű szabvány, az ilyen nyelven közzétett adatok bárki számára hozzáférhetőek és kezelhetőek.

Fontos megjegyeznünk, hogy az adatok összekapcsolása továbbra is (mint lejjebb látni fogjuk az azonosítókkal kapcsolatban) internet-technológián alapul, tehát nincs szükség új infrastruktúra kialakítására sem.

Az adatszintű összekapcsolásnak (több más dologgal együtt) van egy általános, messzire mutató következménye. Ahhoz, hogy az adatokat össze tudjuk kapcsolni, azonosítókra van szükség. Ez evidencia már a relációs adatbázisok korától, sőt még korábbról is. Egy ügyes és valójában nagyon egyszerű technikai fogás, az internetcím megadása és/vagy egy, a feloldási mechanizmusába bevezetett új konvenció révén - melynek a részleteibe most nem megyek bele - megteremtődött a lehetősége annak, hogy ne csak az interneten létező dolgoknak, hanem a való világ dolgainak is internetes azonosítót adjunk. Azaz az URL-hez hasonló, azzal szinte teljesen megegyező valamivel, az URI-val azonosítsuk a weben valójában kívül eső dolgokat, például egy embert. Ez azzal a következménnyel jár, hogy a web ettől kezdve már nemcsak az információk hálózata, hanem a dolgok hálózata is, ez az az EGY valami, amiben minden feloldódik.

A folyamat kétirányú. Nemcsak a dolgok költöznek a webre, hanem a számítástechnika is beköltözik a dolgokba: például a cipőbe és az autóba is, különféle chipek és szenzorok formájában. Így már a cipőre gondolhatunk úgy is (újra Kevin Kellytől véve a hasonlatot), mint egy chipre, aminek talpa van, az autóra pedig úgy, mint egy chipre, aminek kereke van, és mindkettő rajta van a weben. Megint más szavakkal: a dolgok beköltöznek a webre, a web pedig beköltözik a dolgokba. A web ma már elválaszthatatlan része az életünknek. Még általánosabban fogalmazva, a digitális világ és a materiális világ egyesülni látszik EGY valamiben, és egyre inkább kézzelfoghatóvá válik, hogy világunk alapvető építőköve az információ.

Az előző bekezdésekben utaltam rá, de most külön is kiemelem, hogy Kelly szerint a hálózat fejlődésére az a jellemző, hogy egyre többet osztunk meg magunkról. Kezdetben a hálózatra kapcsolt számítógépeknek kellett csomagokat megosztaniuk más számítógépekkel, később már weblapokat osztottunk meg, ma pedig már adatokat. Kelly szerint minél többet osztunk meg magunkról, annál többet tudunk kivenni a rendszerből. Szerinte tehát ez egy jó folyamat, amelyből nyertesként jövünk ki a személyre szabott szolgáltatások révén. Ebből nem lehet kimaradni, mert egész egyszerűen a web lesz a világunk, már nem csupán egy különös valami, a fiatalok és a technika iránt érdeklődők „játszótere”, hanem a valóság mindenki számára megkerülhetetlen szelete.

A könyvtárak hálózati fejlődése

A közintézmények is végigmentek a fentebb vázolt fejlődési folyamatokon. Kezdetben voltak a Telnettel elérhető online (jellemzően kereső) szolgáltatások, majd következett a könyvtári honlapok és webes online katalógusok kora. Mára már egyre több könyvtár és múzeum teszi fel az adatait a szemantikus webre. Az Országos Széchényi Könyvtár ebből a szempontból úttörő szerepet játszott a világban azzal, hogy 2010-ben a svéd LIBRIS után másodikként tette közzé adatait a szemantikus weben. Az Országos Széchényi Könyvtár ezzel a lépésével közvetve jelentősen hozzájárult az új bibliográfiai leírási formátum, a BIBFRAME kialakulásához abban a tekintetben, hogy a BIBFRAME is szemantikus webes technológián alapul, és a BIBFRAME megalkotói maguk is számon tartják az elődeik között az Országos Széchényi Könyvtárat.

Az úttörők – a LIBIS és az Országos Széchényi Könyvtár - után egyre többen jelennek meg a szemantikus weben teljes katalógusokkal vagy azok részleteivel, besorolási adatokkal és más állományadatokkal. Teljes katalógussal jelent meg a szemantikus weben (példa értékűen) a Spanyol Nemzeti Könyvtár. Besorolási rekordokkal szerepelt a Library of Congress, a Német Nemzeti Könyvtár és még sokan mások. Nagy nemzetközi vállalkozások is megjelentek a szemantikus weben. Az OCLC a katalógus adatait schema.org jelöléssel teszi közzé a WorldCat-ben, a VIAF adatai pedig szintén elérhetőek szemantikus formában. Múzeumi leíró adatokat tett közzé a British Museum és a Yale Centre of British Arts, de a Getty is mind több adatállományát teszi elérhetővé szemantikus formában.

Olyan folyamat ez, amiből nem lehet kimaradni.

Horváth Ádám