2.2. Közös katalogizálási rendszerek és a helyi felhasználók |
(Koltay Klára) |
Ha a közös katalogizálási rendszerekben végzett munkafolyamatokról beszélünk, általában a közös adatbázis szempontjai szerint határozzuk meg a tennivalókat, amelyek a közös adatbázis mechanizmusaitól függően ugyan eltérhetnek egymástól, de alapjában véve négy csomópont körül mozognak. Ezek: milyenek legyenek a felküldött rekordok, a közös adatbázisban való hasonlítással kezdjük a munkát ezzel is csökkentve a duplumok beküldésének esélyét, a feldolgozás gyorsaságának és a bekerülő rekordok tökéletességének optimális aránya hogyan található el, mennyi és milyen példányspecifikus adatot kezel a közös adatbázis.
Érdemes most megfordítani a nézőpontot és a közös katalogizálási rendszereket felhasználó katalogizáló könyvtárosok és lelőhelyet kereső felhasználók szempontjai szerint tekinteni át ezeket a kérdéseket. Annak a magától értetődő gondolatnak a hangsúlyozásával kell indulnunk, hogy a könyvtárosok csak akkor fogják ténylegesen felhasználni a közös katalógust rekordforrásként, ha ezzel jelentősen egyszerűsödik az elvégzendő feltárási folyamat. A saját adatbázisát felelősen építő katalogizáló általában idegenkedik attól, hogy máshol készült rekordot használjon fel, félve attól, hogy ezzel a helyi adatbázisának koherenciáját megbonthatja. Különösen igaz ez a besorolási adatok esetében. Ezt az idegenkedést csak az törheti át, ha egyrészt a rekordok átvételének és az általa készített rekrodok "felküldésének" mechanizmusa szinte észrevétlenül beilleszkedik a megszokott munkafolyamatba, másrészt, ha a kapott rekord kevés átszerkesztéssel saját adatbázisához illeszthető, ha az átemelendő rekord keresésének és esetleges átigazításának ideje jelentősen kevesebb mint az újonnan való leírásé. Ugyanakkor tapasztalható az is, hogy ha egy katalogizáló közösség megszokta a rekordok más forrásból való átemelését, egy idő után kevésbe érzékeny a rekordok "másságára", még azokat a változtatásokat sem mindig végzi el, amelyek a helyi adatbázisban való kereshetőséget hivatottak kiküszöbölni. Elérkeztünk ezzel abba a fázisba, amikor megindul egy spontán egységesedési folyamat a közös rendszerben dolgozók körében; éppen ezért nagy felelősség hárul/hárulhat a központi adatbázisra abban, hogy milyen szinten megy végbe ez a folyamat.
Az alábbiakban néhány olyan gyakorlat megfogalmazta követelményt tekintünk át, amelyek feladatokat rónak mind a központi mechanizmusokra, mind a helyi rendszerekre, és amelyek teljesítése elengedhetetlen a színvonalas és hatékony közös katalogizálás szempontjából.
A magyar közös katalogizálási rendszerek természetesen szabványos megoldásokat alkalmaznak, betartva mind a magyar katalogizálási szabványokat, mind a besorolási adat képzésének szabályait. A rekordok csereformátumának a MARC-ot tekintik. Mivel a hazai rendszerek egy része HUNMARC-ot más része MARC21-et használ, a két formátum közötti konverzió is rendelkezésre áll. Az elfogadott szabványok deklarálásán túl a kívánalmakat pontosan részletező szabályzatok is elkészültek.[1] Első pillantásra úgy tűnik tehát, hogy minden előkészület megtörtént egy jól szabályozott rekordtartalommal bíró adatbázis létrehozására.
A gyakorlat azonban azt mutatja, hogy a fenti szabványok és szabályozások nem feltétlenül kényszerítenek ki olyan uniformitást, amely egymással szorosan együttműködni készülő rendszereknek elegendő. Szabványos MARC alapú rendszerek katalógusaiból nem feltétlenül lesz tökéletes közös katalógus.
Egy példa erre a jelenségre a MOKKA-ban együtt dolgozó könyvtárak bibliográfiai rekordjainak köréből.
A szerzői gyűjtemények feltárása akkor teljes, ha az kiterjed a gyűjtemény tagjainak kereshetőséget biztosító előszámlálására. Ezt megteszi mind a két példaként bemutatott leírás, pontosan azonos mértekben szegmentálva az adatokat. Mind a két MARC rekord szabványosnak tekinthető, és bár az egyik MARC21-ben a másik HUNMARC-ban készült a két formátum jó közelítéssel konvertálható. Ráadásul éppen a kérdéses mezőket (505, 740) mindkettő azonosan definiálja, így a formátum konverzió semmi tennivalót nem észlel ezeknek a mezőknek az esetében.
100 1 $aWilliam Shakespeare$d(1564-1616)
245 10 $aÖt dráma /$cWilliam Shakespeare ; [ford. Arany János et al.]
260 0 $aBudapest :$bEurópa,$c1996
300 $a515 p. ;$c20 cm
490 1 $a(Európa diákkönyvtár,$x0324-2528)
505 00 $g1.,$tRomeo és Júlia -$g2.,$tJulius Caesar -$g3.,$tHamlet, dán királyfi -
$4.,$tSzentivánéji álom -$5.,$tVízkereszt vagy Amit akartok
583 $xD1/KGY
700 1 $aArany János$d(1817-1882)
730 0 $aJulius Caesar$l(magyar)
730 0 $aRomeo and Juliet$l(magyar)
730 1 $aA midsummer-night's dream$l(magyar)
730 0 $aTwelfth-night or What you will$l(magyar)
730 0 $aHamlet, prince of Denmark$l(magyar)
830 0 $aEurópa diákkönyvtár
100 10 $aShakespeare,$jWilliam.
245 10 $aÖt dráma$cWilliam Shakespeare$e[ford. Arany János et al.].
260 0 $aBudapest$bEurópa$c1996$eSzombathely$fSylvester
300 $a515 p.$c20 cm
440 0 $aEurópa diákkönyvtár,$x1215-4989
700 11 $aArany$jJános,$d1817-1882.$4ford.
730 02 $aTwelfth-night or What you will$imagyar.
730 02 $aRomeo and Juliet$imagyar.
730 02 $aJulius Caesar$imagyar.
730 02 $aHamlet, prince of Denmark$imagyar.
730 22 $aA midsummer night's dream$imagyar.
740 02 $aRomeo és Júlia.
740 02 $aJulius Caesar.
740 02 $aHamlet, dán királyfi.
740 02 $aSzentivánéji álom.
Összegezve: mindkét rekord szabványosnak tekinthető, mind a leírási mind a formátumszabványoknak eleget tesz, csupán eltérő helyi szokások eredménye. Mindkettő saját környezetének keresési és megjelenítési szabályai közepette tökéletesen betölti funkcióját, de egymás mellé kerülve egy közös adatbázisban már működési zavarokat okozhatnak. Természetesen a közös katalogizálási szabályzat dönthet úgy, hogy az egyik vagy a másik megoldást preferálja, a másikról tudomást sem vesz, de ez nem oldja meg a problémát, hiszen a "leszavazott" megoldást alkalmazó adatbázisokban ugyanazokat a keresési anomáliákat okozhatja a másik típusú rekord átvétele; nem kompromisszum-képtelenségből, hanem saját koherenciájának védelmében kénytelen ragaszkodni saját korábbi, sok rekord által képviselt szokásaihoz. Sokkal reálisabb, célravezetőbb elfogadni a helyi rendszerek igényét az ilyen jellegű eltérések fenntartására és a közös adatbázis erőforrásait felhasználni a központban jelentkező egyenetlenségek áthidalására a közös adatbázis céljainak megfelelően. Ha a közös adatbázis lelőhely-adatbázisként működik, elegendő megoldás lehet mindkét típusú rekord befogadása az adatbázisba olyan indexelési és megjelenítési szabályok kialakításával párosítva, amelyek egyenrangúan kezelik a két típust. Ha az adatbázis közös katalogizálási célokat is szolgál, célszerű a központi adatbázisban az egyik megoldást preferálni, ugyanakkor a résztvevő feleknek olyan rekordokat szolgáltatni, amelyek közel állnak az általuk igényelthez. Nemcsak "formátumkonverziót" kell végrehajtani, hanem a résztvevők egyes szokásait is be kell építeni a konverzióba. Természetesen ilyen módon nem lehet és nem is érdemes minden eltérést elmosni, csak azokat kell figyelembe venni, amelyek mindkét fél esetében szabványos eljárásnak bizonyulnak, és amelyek a fenti esethez hasonlóan jelentős "értelmezési" problémákat okozhatnak.
Még egyértelműbben bizonyítja a helyi adatbázisok elemzésének fontosságát a Matriksz[2] adatbázisból vett példa. Az adatbázis több forrásból származó tárgyszó-rekordokat tartalmaz, és tervezésének első percétől figyelt arra, hogy ne legyenek formátum eltérések, ne legyen szükség konverzióra.
Az alábbi két rekord - az Országos Széchényi Könyvtárból, illetve a Debreceni Egyetemi Könyvtárból - szemlélteti a rekordok szinte teljesen azonos szerkezetét. Az egyetlen formátum különbségnek tekinthető eltérés az, hogy az OSZK tezaurusz adatbázisa számára a 450 és 550 mezők $w almezejében többféle kódot definiált, hogy az utalók különböző típusait pontosan megkülönböztethesse.
ZARÁNDOKLAT [OSZK]
000 00447nz 2200181n 4500
001 OSZKt0032447
005 20021009235905.0
008 021009 b an n a a d
040 $aOSZK$bhu
080 $a248.153.8 ETO megfeleltetés
150 $azarándoklat Deszkriptor
450 $wt$azarándokhely Lásd utalók
450 $wv$aperegrináció
550 $wf$avallás Lásd még utalók
550 $wp$aereklye
550 $wp$akultikus hely
550 $wp$aszent hely
680 $iZarándoklat, zarándokhely
ZARÁNDOKOK ÉS ZARÁNDOKLATOK [DEENK]
000 00384nz 2200145n 4504
001 autKLT00388776
005 20040608125257.0
008 020321nn acnnnbabn un aaa d
040 $aHuDeKLEK
080 $a248.153.8 ETO megfeleltetés
150 4 $aZarándokok és zarándoklatok Deszkriptor
450 4 $aZarándokutak Lásd utaló
450 4 $aKegyhelyek
550 4 $wg$aUtazók Lásd még utalók
550 4 $wh$aKeresztény zarándokok és zarándoklatok
750 0 $aPilgrims and pilgrimages.
Van azonban egy lényeges filozófiai, MARC rekordok szintjén meg sem fogható eltérés a két forrás tárgyszó-adatbázis között. "Lásd utalók" szerepének megítélése különböző. A DEENK adatbázisban a "lásd utaló" tiltott alak, a bibliográfiai rekordok tárgyszavazásánál nem használható, "nem létező" tárgyszóalak, nincs saját tárgyszórekordjuk, kizárólag más tárgyszavak rekordjainak 450 mezejében fordulhatnak elő. Az OSZK tárgyszó-adatbázisában ugyanakkor az egyik deszkriptor mellett 450 mezőben "lásd utalóként" szereplő alaknak saját rekordja is van, amelyben ő szerepel a 150 mezőben deszkriptorként.
Ha az OSZK szemléletéből kiindulva a közös adatbázis indexelésénél csak a 150 mezők tartalmát szerepeltetjük az indexekben, a DEENK tárgyszavainak "lásd utalói" "nem működnek". A tárgyszóként nem alkalmazható, de keresés segítése szempontjából megadott tiltott szinonimák láthatatlanná válnak a felhasználó számára.
Példáinknak talán sikerült azt szemléltetni, hogy a jól működő közös rendszerek kialakításakor nem elég csak a szabványokon alapuló ideális közös adatbázis elképzelése, hanem gondosan elemezni kell a résztvevő adatbázisokat, és tekintettel kell lenni azok szabványos, de az elképzelt közös szabályoktól eltérő szokásaira, szemléletére is.
A szabványos, de egymástól mégis eltérő megoldások konfliktusa még élesebben jelentkezik a besorolási adatok tekintetében. A korábban bemutatott Shakespeare rekordok például szolgálnak arra a lehetőségre is, hogy a szabványosan képzett besorolási adatok sem feltétlenül egyeznek meg. Az ajánlott, de nem kötelező kiegészítő adatok - ebben ez esetben az életrajzi kronológia - egyik adatbázisban nagyobb valószínűséggel fordulhatnak elő, mint a másikban. Ez a látszólag nem jelentős eltérés mégis nehezen megoldható konfliktushoz vezethet a besorolási adatrekordok sajátos szerepe miatt. A helyi adatbázisok egy része és a közös adatbázisok is "authority" kontrollal rendelkező adatbázisok abban az értelemben, hogy csak akkor kerülhet be egy bibliográfiai rekord az adatbázisba, ha ahhoz megfelelő besorolásiadat-rekord kapcsolódik, a különböző bibliográfiai rekordokban lévő azonos besorolási adatok egy velük azonos alakú besorolásiadat-rekordhoz kötődnek. Ha ez a besorolásiadat-rekord megváltozik, magával vonja az összes hozzátartozó bibliográfiai rekord megfelelő alakjainak változását. A helyi adatbázisoknak sok segítséget ad ez a rendszer ahhoz, hogy ott a besorolási adatok tekintetében rendet lehessen tartani.
A központi adatbázisok mind a bibliográfiai rekordokat, mind a besorolásiadat-rekordokat a helyi adatbázisoktól kapják - ha olyan adatbázisból érkezik a bibliográfiai rekord, amelyik nem tud besorolási rekordot adni, a központi adatbázis automatikusan generál egyet a bibliográfiai rekord alapján -, a fenti példa esetében két eltérő formát. Az ilyen típusú különbségek eltüntetését természetesen nem lehet automatikus folyamatokra bízni, így a központi rendszer csak annyit tehet, hogy az eltérő alakokat befogadja, és "nyersanyagnak" tekinti őket egy későbbi, emberi munkaerővel elvégzendő egységesítés számára. A MOKKA tervei között szerepel is, hogy jelentős ráfordítással egy országos besorolási adat adatbázist hozzon létre a rendelkezésekre álló különböző forrású besorolási adatokból. A MOKKA adatbázis mechanizmusai segíteni fogják a MOKKA-t abban, hogy a kijavított besorolási adatok maguk után vonják a MOKKA bibliográfiai rekordjaiban lévő besorolási adatok tisztulását is.
Az így kialakuló központi authority adatbázis azonban csak nehezen fog tudni hatást gyakorolni a helyi adatbázisokra. Ha a helyi katalogizáló átvesz egy bibliográfiai rekordot a központi adatbázisból, elvileg most is lehetősége van arra, hogy lekérje hozzá a MOKKA besorolási rekordjait is. Ez azonban nehézkes, külön műveletet igényel. Ráadásul, ha a szóban forgó névalak már más formában, más authority formát rögzítő rekordhoz kapcsolódva szerepel a saját adatbázisában, hosszadalmas művelet a saját korábbi "rossz" besorolási rekordját a "hivatalos" MOKKA-ból származóra cserélni. Sokkal egyszerűbb a sajátját javítani. A legkézenfekvőbb pedig az érkező bibliográfiai rekordot a saját adatbázisában használt formára hozni. Legtöbbször ez történik és ezzel bizonyos esetekben a MOKKA-ban is újratermelődik az ott már esetleg kijavított nem kielégítő alak. Különösen akkor nem kárhoztatható ez az eljárás, ha a MOKKA "hivatalos" formája kevesebb adatot tartalmaz, mint a már létező helyi név.
Az igazi megoldáshoz mind a központi adatbázis, mind a helyi adatbázisok oldalán kellenének változtatások. A közös adatbázisnak egyrészt a lekért bibliográfiai rekorddal le kellene töltenie a hozzátartozó besorolási rekordokat, felkínálva a helyi katalogizálónak, hogy szükség esetén felhasználja azokat, ugyanakkor ki kellene alakítania annak a mechanizmusát és jogosultsági rendszerét, hogy a helyi, teljesebb besorolási rekord adataival kiegészíthessék a központiakat. Ez természetesen a besorolási adatok esetében nem egy egyszerű felülírási folyamat. A helyi katalogizálási rendszereknek pedig meg kell oldania azt a feladatot, hogy egy már meglévő, de nem tökéletes helyi authority rekord könnyen lecserélhető legyen a közös adatbázisból leérkezett rekorddal.
A közös katalogizálási rendszerek által előírt munkafolyamat az, hogy mikor egy dokumentumot feldolgozunk először hasonlítanunk kell a saját adatbázisunkban, ha ott nincs előzménye a rekordnak, a közös katalógusban keressük meg a rekordot - ez a hasonlítás kötelező, hogy ne szaporítsuk a duplumrekordok számát a központi adatbázisban -, onnan töltjük le, egészítjük ki azt állományadatokkal, majd mentjük a saját katalógusunkba és a közös katalógusba egyaránt. A közös katalógus aztán a visszaérkező rekordnak bizonyos elemeivel a korábbi rekordot felülírja, kiegészíti. Természetesen, ha a közös adatbázisban sincs a rekordnak előzménye, a művet le kell írnunk, és a rekordot mind a helyi, mind a közös katalógusba mentjük. Ezek így szép egyértelmű instrukcióknak tűnnek, de a napi munkában sok dilemmával találkozunk.
A közös katalogizálási rendszert lelőhely-adatbázisként felhasználó könyvtárközi kölcsönzéssel foglalkozó könyvtárosokat és a dokumentumok feltalálási helyét kereső olvasókat a bibliográfiai rekordok tartalma csak áttételesen érdekli. "Csak" azt várják el tőlük, hogy sok szempont szerint megtalálhatóak legyenek és egyértelműen azonosítsák a dokumentumokat és lelőhelyeiket. Sokkal fontosabb lehet számukra, a rendszerek által adott példányspecifikus információ: hol talál olyan példányt, amely az adott pillanatban számára kölcsönözhető.
Az egyik lehetséges módja annak, hogy ezekre a kérdésekre választ kaphassunk az, ha a közös katalógus csak a lelőhelyeket tárolja és a további információért a helyi katalógusokhoz utalja a felhasználót. Előnye ennek a megoldásnak, hogy a közös katalógust nem terheli sok példányspecifikus információval, nem kell azok folyamatos aktualizálásával foglalkoznia.
Ugyanakkor azzal, hogy a példányinformációk nagy részét csak helyi szinten kapjuk meg, a rendszer több olyan szolgáltatást megvon a felhasználótól, amelyek a helyi szintről csak további keresésekkel kaphatóak meg. Példa erre a helyrajzi számok hiánya a központi adatbázisban. A könyvet kereső olvasó a központi adatbázis lelőhelyétől kiindulva könnyen eljuthat a helyi példányinformációkig, amelyek alapján eldöntheti, hogy kéri-e könyvet könyvtárközi kölcsönzésen. Ő természetesen látja a helyrajzi számot is. Hasonlóképpen a könyvtárközi kérést elindító könyvtárost is kielégíti a két különböző forrásból összeadódó tájékoztatás. A központi adatbázisból a tulajdonoshoz küldött kérés azonban már nem tartalmaz a helyi adatbázisból származó adatokat, így helyrajzi számot sem. A beérkezett kéréseket külön munkafolyamatként le kell hasonlítani a helyi adatbázisban kiszolgálás előtt. Ezen a helyzeten vagy úgy lehetne segíteni, hogy a könyvtárközi kérések indítása alkalmával információt kell kérni a helyi adatbázisoktól - ami több eltérő helyi könyvtári rendszerhez alkalmazkodva nem egyszerű folyamat -, vagy a helyrajzi szám tárolására is be kellene rendezkednie a központi adatbázisnak.
Érdemes lenne összegyűjteni azoknak a példányokhoz kötődő adatoknak a körét, amelyeknek tárolására a központban szükség lehet még és felkészíteni a közös adatbázist ezek tárolására. Természetesen csak akkor vállalkozhat a központi adatbázis ezek tárolására, ha kialakul aktualizálásuk mechanizmusa is.
Új kihívást jelentenek minden bibliográfiai keresőfelület számára azok a felismerések, amelyeket a „Bibliográfiai rekordok funkcionális követelményei”[3] c. ajánlás szerzői fogalmaznak meg. Az ajánlás abból indul ki, hogy a bibliográfiai adatbázisok használói számára nem a leginformatívabb az az általános elterjedt forma, amely a keresés eredményeit egyszerűen egy valamilyen szempont szerint rendezett rekordlistaként jeleníti meg. A rekordok a művek egyes megjelenési formáit, kiadásait rögzítik, míg a felhasználók az esetek nagy részében egyes művek iránt érdeklődnek, illetve a róluk szóló elemzések, vagy az azokat továbbgondoló feldolgozások iránt[4]. Az igazán felhasználóbarát keresőfelület a találati halmaz rekordjait megfelelően csoportosítva a művek, kifejezési formák, művekről szóló irodalom, megjelenési formák, példányok hierarchikus megjelenítésével segít az olvasónak eligazodni az adatbázis kínálta dokumentumok tömegében. Ez az első pillanatban egyszerűnek látszó kívánalom a jelenlegi megoldások gyökeres átgondolását jelenti, hiszen a MARC rekordban rejtett, eddig sok esetben fel sem használt információk összekapcsolása szükséges pl. annak megvalósításához, hogy a Hamlet különböző nyelvű fordítási és kiadási változatainak időrendbe rendezett hosszú listája helyett először az alábbi összefoglaló képernyőt kapjuk:
Shakespeare, William 1564-1616. Hamlet
Az első sor kiválasztása után meg mindig nem a rekordlista következik, hanem a különböző nyelvű fordítások, majd az egyes fordítók listája és csak ezek után kapjuk meg a most már könnyen áttekinthető méretű listát.
Természetesen e cél érdekében nem elég a keresőfelületek szállítóit megdolgoztatni, hanem az eddigi katalogizálási gyakorlat áttekintésével magunk számára is ki kell jelölni az eddig esetleg csak opcionálisan kezelt, ezután azonban elengedhetetlenül szükséges adatelemeket.
Az ilyen irányú fejlesztéseken minden adatbázis esetében előbb-utóbb el kell gondolkodni, de különösen fontos lehet ez a közös katalogizálással épülő adatbázisok esetében, hiszen azok rekordmennyisége, általában riasztóan hosszú találati listái még nyilvánvalóbba teszik a találatok fentiekhez hasonló csoportosításának szükségességét. A rendszerhez tartozó katalogizálók széles közössége pedig segíthet a katalogizálási gyakorlatban elvégzendő változtatások végiggondolásában és bevezetésében.
A fentiekben néhány olyan továbbfejlesztési szempontot számláltunk elő, amelyek a gyakorlati munka során merültek fel, és amelyek megoldása kényelmesebbé teheti a közös katalogizálási rendszerek használatát. Bár a problémákat igyekeztünk általánosságban végiggondolni, jelentkezésüket és az ajánlott megoldásokat bizonyára befolyásolta az, hogy elsősorban helyi rendszerként Corvinát használó könyvtárosok tapasztalatain alapulnak.