2.3. Régi nyomtatványok és könyvtári automatizálás

(Hegyi Ádám)

   Néhány éve az Országos Széchényi Könyvtár szervezésében indult el a MOKKA-R (Magyar Országos Közös Katalógus - Régi Nyomtatványok) projekt. Ez a rendszer a régi nyomtatványok könyvtári feldolgozását korszerű informatikai eszközökkel ötvözi. Könyvtáros szakmai körökben már több fórumon lehetett találkozni ezzel a tervvel[5]. A következőkben ismertetem az eddigi eredményeket.

   A MOKKA-R megvalósítása szorosan összekapcsolódik a MOKKA humán szakirodalmi adatbázissá történő fejlesztésével. Erre a munkára Monok István az OSZK főigazgatója adott megbízást a MOKKA Egyesületnek. A projekt közvetlen felelőse Hegyi Ádám. Bakonyi Géza felügyeli az elvégzett munkát. Az előbb említetteken kívül a nemzeti könyvtár erre a feladatra szerződéses jogviszonyban foglalkoztat egy programozót, Zawiasa Róbertet. Az egyes munkafolyamatokba - katalogizálási szabályzat kidolgozása, tesztelés, feldolgozás, stb. - igyekszünk minden olyan szakembert bevonni, aki valamilyen módon részt vesz vagy vehet a "régikönyves" adatbázis építésében.

A MOKKA-R célja

   A projekt alapvető célja, hogy országos régi nyomtatvány lelőhelyjegyzékként lehessen használni. Tudjuk, a könyvtörténet számára nagyon fontos az 1850 előtt nyomtatott könyvek bibliográfiai leírásán túl az egyedi jellemzők feltárása is. Ma Magyarországon nincs olyan közös katalógus, amely ezt megfelelő mértékben megvalósítaná, ezért szükséges egy olyan adatbázis létrehozása, amely kimondottan ezeknek a speciális igényeknek felel meg. Ez a rendszer gyakorlatilag a MOKKA speciális változata, működésében és funkciójában sokban fog hasonlítani a Hand Press Book Database-re[6].

   Mindezt úgy kell megvalósítani, hogy az azonos kiadású nyomtatványok mindegyike visszakereshető legyen, miközben a lelőhelyadatok mellett megjelennek az adott kötet egyedi jellemzői is.

   Művelődéstörténeti szempontból a Kárpát-medencében található 1850 előtt kiadott nyomtatványok egy egységet alkotnak. Indokolt ezért a projekt kiterjesztése határon túlra is. Lehetőség szerint ezért minden olyan gyűjtemény állományát elérhetővé kell tenni a Kárpát-medencéből, amely történetileg kapcsolódik az 1450-1850 közötti korszak könyvészetéhez. Ezáltal sokkal hatékonyabbá válhat a történetileg amúgy is összekapcsolódó gyűjtemények feldolgozása. Ez csak úgy valósulhat meg, ha az intézmények valamilyen jogi együttműködést alakítanak ki az eltérő informatikai és szakmai háttér összehangolására.

   Magyarországon és a Kárpát-medencében sok olyan muzeális gyűjtemény létezik, ahol minimális vagy semmilyen könyvtári feltárás nem történik, ezért a MOKKA-R-nek elő kell mozdítania ezeknek az állományoknak a feldolgozását. Ehhez internet és internet nélkül is elérhető katalogizáló modult kell biztosítani, amellyel az adatbázisba lehet rekordot feltölteni. Ez a modul jelentősen kisebb költségekkel beüzemelhető és fenntartható, mint egy integrált könyvtári rendszer, mert egy átlagos teljesítményű PC, modemesnél szélesebb Internet-elérés és egy böngésző program kell hozzá. Természetesen ez nem azt jelenti, hogy azoknak a gyűjteményeknek is ezt kell választani, ahol már van valamilyen működő könyvtári szoftver.

   A régi nyomtatványok feldolgozásának felgyorsításához speciális ismeretekkel rendelkező könyvtárosokra is szükség van. Az együttműködésnek meg kell teremtenie azt a lehetőséget, hogy humán erőforrást is tudjon biztosítani a tagok számára.

Az adatbázis gyűjtőköre

   A projekt szempontjából minden olyan nyomdatechnikai eljárással készült dokumentumot (könyv, folyóirat, röplap, térkép, stb.), amely 1450-1850 között látott napvilágot régi nyomtatványnak tekintünk.

   A gyűjtőkört két szempont közösen határozza meg. Az egyik az időszak, vagyis az 1450-1850 között nyomtatott dokumentumok, a másik a területi megközelítés, vagyis minden olyan nyomtatvány, amely a mai Magyarországon illetve a Kárpát-medencében található. Kivétel ez alól a facsimile kiadás, mert az időhatár ilyenkor nem tekinthető korlátozó tényezőnek. Ezekből következően a gyűjtőkör nemcsak régi könyvekre, hanem minden olyan 1450-1850 között készült nyomtatványra vonatkozik, amely ma a Kárpát-medencében van. Ezt egészíti még ki az az elv, hogy csak az a könyvtári egység kerülhet bele az adatbázisba, amely valamelyik tagkönyvtár állományában van.

Működési elv

   Az országos régi könyves számítógépes katalógus működtetéséhez feltétlen szükséges valamilyen jogi keret kidolgozása. A tervezés és tesztelés időszakára szóbeli megállapodás alapján a következő intézmények szolgáltatnak rekordokat az adatbázis számára:

   A MOKKA-R működtetése nem valamilyen integrált könyvtári rendszer által történik, hanem ennél sokkal könnyebben módosítható XML felhasználásával. Az adatbázis két fő részből áll: az OPAC modulból és a katalogizáló modulból. A rendszer online, vagyis mind az OPAC, mind a katalogizáló modul TCP/IP hálózaton keresztül érhető el. Ettől függetlenül lehetőség van offline katalogizálásra is. A keresőfelület mindenki számára teljesen nyilvános, míg a szerkesztő rész jelszóval védett. A jelszavak meghatározott hozzáférést engednek az adatbázis részeihez.

   Adatokat XML-ben tárolja a rendszer, de mind bemeneti mind kimeneti oldalról képes USMARC és HUNMARC formátumban készült adatok veszteségmentes fogadására és szolgáltatására.

   Az adatbázis OPAC felülete és szerkesztő része TCP/IP alapú hálózaton keresztül működik. Minden résztvevő számára akkor hozzáférhető, ha van modemes sávszélességnél gyorsabb internetkapcsolata.

   Néhány intézmény még mindig nem, vagy nem megfelelő internet összeköttetéssel rendelkezik, ezért a leendő együttműködési szervezetnek erre nagy gondot kel fordítania. Az esetek többségében ez azt jelenti, hogy az egyházi könyvtárak számára is meg kell teremteni az NIIF infrastruktúrában való részvételt.

   A rendszert úgy is lehet használni, ha nincs az adott könyvtárnak TCP/IP kapcsolata. Ilyenkor egy PC-n futó offline katalogizáló- és szerkesztő modult kell telepíteni, amelyből az adatokat át kell tölteni a ténylegesen működő online adatbázisba.

Az adatbázis feltöltése

   Adatok feltöltése kétféle módon történhet. Az egyik, amikor a katalogizáló modulon keresztül történik, a másik, amikor az adott könyvtár adja át a tulajdonában lévő adatokat, rekordokat. Ez utóbbi lehetséges egyszeri feltöltéssel, illetve folyamatos adatszolgáltatással. Mindkét típusú betöltés során problémát jelent az eltérő névalakok kezelése. Ez fokozottan jelentkezik olyan esetben, amikor az adott rekord még a közös katalógus szabályzatának elkészülte előtt készült, azaz konvertált.

   Abban az esetben ha egy könyvtár a számítógépes rendszeréből adja át a rekordokat, a konvertálás során a programozó semmikor sem módosíthatja a kapott rekordokat anélkül, hogy erre engedélyt vagy kifejezetten felkérését kapott volna.

   A nyomtatott anyagokból betöltött rekordok esetében semmiképpen sem lehetséges bármilyen jellemző alapján duplumszűrés, mert az túl nagy kézi munkaerőt igényelne. A rendszerben viszont szükség van arra, hogy a teljesen megegyező kiadású nyomtatványok egy találati tételben legyenek visszakereshetőek, ezért a bibliográfiai leírásnak lehetőleg valamilyen nagy és elterjedt katalógus egyedi azonosító számaira hivatkozva történnie (pl.: RMK, RMNY, VD 16, stb.)

   Ha az adott intézmény utólag módosít valamelyik bibliográfiai tételén, akkor az újabb feltöltés során annak felül kell írnia az adatbázisban már szereplő tételt.

   Olyan esetben amikor a feltöltés nem a szerkesztő felületen keresztül történik, szükséges olyan eszköz beiktatása, amellyel egy képzett könyvtáros az egyes tételeket szerkeszteni tudja. Ez gyakorlatilag egy XML szerkesztő felületet jelent. Használatára csak akkor van szükség, ha az adott rekord nem megfelelően tagolt. Az így módosított állományt ezután a programozó tölti fel az adatbázisba.

   Az esetek többségében szükséges egy-egy bibliográfiai tétel későbbi módosítása is. A felhasználói jogosultságok szintjén ezt úgy kell szabályozni, hogy a legalacsonyabb engedélyekkel rendelkező könyvtáros csak az általa gondozott gyűjtemény adatait módosíthassa, és csak magasabb felhasználói jogosultságokkal rendelkező személy változtathasson az adatbázis egészén.

   A kettős felülírás elkerülése érdekében minden résztvevő csak egy helyen módosíthatja állományának adatait, vagyis a nem az adatbázisban dolgozók csak saját rendszerükben végezhetnek javításokat. Az így elkészült rekordokat ezután ismételt feltöltéssel lehet a közös katalógusban ténylegesen átírni.

   Abban az esetben ha az adatbázisban már szerepel egy bibliográfiai tétel és az az egyedi jellemzőket kivéve teljesen megegyezik az újonnan feldolgozni kívánt kötettel, akkor lehetőség van a rekord áthúzására. Ennek során a leírásnak csak azt a részét kell elvégezni, amely az egyedi jellemzőket tárja fel. A tétel visszatöltésekor a rendszer külön fogja kezelni a bibliográfiai és a holding adatokat.

   A projektben részt vevő intézmények a közös adatbázisból tölthetnek le bibliográfiai tételeket. Ezeknek a tételeknek alkalmasnak kell lenniük arra, hogy importálhatóak legyenek bármilyen könyvtári rendszerbe. Jelenleg a rendszer képes USMARC és HUNMARC adatcsereformátumban és XML-ben adatok exportálására. Mivel az adatbázis ismeri a Z39.50 szabványt, azok a könyvtárak egyszerűen tölthetnek le rekordokat, amelyek szintén a Z szabványt használják.

   A hatékony működés érdekében szükséges a Z39.50-hez hasonló OAI alkalmazása is, ugyanis ez sokkal nyitottabb és egyszerűbb, mivel nem csak könyvtári lekérdezésekre tervezték.

Karakterkészlet

   A közös katalógus UNICODE karakterkészletet használ. A projekt leendő és majdani résztvevői viszont nagyon sokféle karakterkódolást használnak. Ez igen nagy problémát okozhat a megfelelő szövegmegjelenítésben. Állományfeltöltés esetén ez a hiba gyakran csak konverzióval lesz megoldható.

   Külön gondot okoz az, hogy egyes intézmények leírási gyakorlata transzliterálja a nem latin karaktereket, másoké nem. A már kész leírások esetében semmilyen esetben sem szükséges a transzliteráció megváltoztatása, viszont az egyes karakterek megjelenítését nagyon pontosan kell a közös katalógusnak megvalósítania. Ehhez emberi ellenőrzésre is szükség van.

Katalogizálás

   A dokumentumok egységes feldolgozásához közös katalogizálási szabályzat alkalmazása elengedhetetlen. Ehhez a következő szabályzatokat érdemes figyelembe venni: a szegedit[7], az OSZK gyakorlatát, az MSZ 3424 számú szabványcsomagot[8], az ISBD/A-t[9] és az OSZK-ban készülő régi nyomtatványokra vonatkozó KSZ előírásait[10]. A MOKKA-R katalogizálási szabályzat a következő részeket fogja alkalmazni:

   A katalogizálási szabályzat részletes kidolgozása és elfogadása után a tagkönyvtárak számára ez kötelező érvényű lesz.

   Hasonlóan az integrált könyvtári rendszerekhez az országos régi könyves katalógus rendelkezik katalogizáló modullal. Megjelenésében ez interneten keresztül elérhető szerkesztő űrlapot jelent, amely hagyományos "html" űrlap formájában jelenik meg. A futtatásához böngésző és java támogatás szükséges. Minden felhasználó egységesen ugyanazt a felületet látja, bármilyen műveletet is végezzen (új rekord létrehozása, módosítás, külső forrásokkal való kiegészítés). Használata csak azon könyvtárak számára szükséges, amelyek nem rendelkeznek könyvtári szoftverrel, illetve nem kívánnak a saját rendszerükben régi nyomtatványokat feltárni.

   A hozzáférés különböző jogosultságokat nyújtó jelszavakkal történik, amelyek szabályozzák, hogy ki melyik gyűjtemény rekordjait szerkesztheti, illetve milyen típusú feldolgozó munkát végezhet: új rekord létrehozása, módosítás, törlés, hozzáírás, stb. Legalább háromszintű jogosultságot érdemes bevezetni: az alap hozzáféréssel rendelkezők, csak adott állományrésszel (pl.: valamelyik könyvtár katalógusa) végezhetnek bizonyos műveleteket (pl.: bibliográfiai leírás, de kötésleírás már nem). A közepes jogosultságúak adott intézmény tételeit teljes jogkörrel szerkeszthetik. A legmagasabb fokozatú felhasználó rendszergazdai ill. rendszeradminisztrációs lehetőségekkel rendelkezik.

   A szerkesztő felületen MARC-ot lehet szerkeszteni.

   A projekt egyik célja a közös katalogizálás megvalósítása, ezért a szerkesztő modulba különböző adatbázisokból (pl.: Hand Press Book Database, Library of Congress, stb.) be kell tudni rekordokat tölteni. Ez Z39.50 szabvány segítségével valósul meg. Ugyanígy azok a könyvtárak, amelyek saját katalógust építenek, át tudnak emelni bibliográfiai tételeket a központi adatbázisból.

   A szerkesztő felület mind online mind offline összeköttetés esetén működik.

   Egy-egy rekord elkészítése során a besorolási adatok minden esetben authority controll alá esnek. Jelenleg nincs tényleges authority controll a rendszerben, helyette egy lista működik, amelyben minden eddig előfordult névalak megtalálható. Szükséges annak kialakítása, hogy besorolási adat mindig csak a már authority rekordként szereplő alakból készülhessen. Csak abban az esetben lehessen új egységes névalakot készíteni, ha a rendszer semmilyen formában nem tartalmazza azt. Magyar szerzők egységes neveinek elkészítéséhez az egyik legfontosabb forrás a Régi magyarországi szerzők[11] című kötet.

   Mivel a rendszerhez hozzá fog tartozni egy authority állomány, ezért a Nemzeti Digitális Adattár névállománya számára érdemes az 1850 előtti neveket szolgáltatni. Figyelembe kell venni azonban azt, hogy a könyvtáros elvárásoknak teljesen megfelelő egységes alakok elkészítése rendkívül problematikus.

   Az egyszerűbb kezelhetőség kedvéért a holding adatokat - példány és egyedi jellemzők - külön tároljuk a bibliográfiai adatoktól, méghozzá úgy, hogy mind a holding, mind a bibliográfiai rész tartalmazza az authorityket is. Abban az esetben, ha két teljesen megegyező kiadásról van szó, az adatbázis egy rekordban tartalmazza mindkét mű bibliográfiai jellemzőit, de külön kezeli a holding adatokat.

   Mindezen kívül az adatstruktúra mobilitása lehetővé teszi azt, hogy többek között az Eruditio adatbázis[12] teljes állománya összekapcsolható a katalógussal. A leíró katalóguson kívül egyéb internetes források beemelésére is lehetőség van. Ez gyakorlatilag egy virtuális link elkészítését jelenti.

Keresőfelület

   Az adatbázis legfontosabb része a kereshető katalógus. Ez interneten szabadon elérhető OPAC-ot jelent, amely különböző funkciókkal rendelkezik. Ez a felület elérhető[13], bár még csak tesztelés alatt van. A közös katalógusban jelenleg 7 katalógus kereshető le egyszerre:

   A keresőfelületbe beleágyazódik több más adatbázis is, mint pl. az Eruditio, a MOKKA, a Szegedi Egyetemi Könyvtár katalógusa. Programtechnikailag a szerkezet úgy van kialakítva, hogy rendkívül összetett összefüggéseket lehessen bármikor tovább beépíteni az OPAC-ba. Egy szerzőt keresve eljuthatunk ahhoz, hogy ma hol találhatók meg az ő tulajdonos jegyével ellátott könyvek és milyen személyek olvasták műveit például a 17. században, de magában rejti azt a lehetőséget is, hogy a MOKKA-R felületén belépve eljuthassunk akár cikkadatbázisokhoz, teljes szövegű találatokhoz.

   A keresőfelületnél alapkövetelmény, hogy egyszerű és összetett lekérdezés is lehetséges működjön benn. Használhatóak a Boole-operátorok és reguláris kifejezések.


   A MOKKA-R-ben a következő elemek visszakereshetőek:

   Az egyes találatok különböző formákban jeleníthetőek meg: nyomtatott, USMARC, címkézett, XML. Z39.50-en keresztül az adatbázis állománya elérhető, és lekérdezhető.

Szervezett együttműködés kialakítása

   A tervezés kezdete óta van egy laza együttműködés különböző könyvtárak között (Debreceni Egyetem Egyetemi és Nemzeti Könyvtár, ELTE Egyetemi Könyvtár, Dunamelléki Református Egyházkerület Ráday Gyűjteménye Könyvtár, Országos Széchényi Könyvtár, Szegedi Tudományegyetem Egyetemi Könyvtár, MTA Könyvtára, PTE Egyetemi Könyvtár). A legfontosabb cél, hogy minden olyan jelentős intézmény vegyen részt a katalógus építésében, ahol régi nyomtatvány nagy számban található. Az adatbázis részesei lehetnek a hazai nyilvános és korlátozottan nyilvános közgyűjtemények. Mindehhez tisztázni kell, hogy a MOKKA-R hogyan lesz része a MOKKA Egyesületnek.

   Régi nyomtatványok könyvtári feldolgozása esetében a Kárpát-medence egy művelődéstörténeti egységet képez. Ezért rendkívül fontos az, hogy a Magyarországgal szomszédos országok feltáró munkáját összehangoljuk. Ennek legjobb eszköze az, ha a közös katalógus ugyanazokat a szolgáltatásokat nyújtja a külföldi intézmények számára, mint a hazaiaknak. Ez kölcsönösen megkönnyítené mindkét fél munkáját. Szervezetileg ez alapját képezi a magyarországi együttműködési körnek.

Erőforrás-szükséglet

Összefoglalás

   Látható, hogy a MOKKA-R projekt igen bonyolult és összetett rendszer. Eddigi eredménye, hogy elkészült egy keresőfelülete, amely 7 könyvtári katalógusban történő keresést biztosít. Ezek nemcsak egymással, hanem más adatbázisokkal (pl.: Eruditio) is össze vannak kötve, amely lehetővé teszi kutatómunka végzését is.

   Lassan halad az egyes intézmények közötti együttműködés kialakítása és újabb rekordok konvertálása. Nagyon nagy probléma, hogy sok helyen hiányzik mind az informatikai mind a személyi háttér.

   A MOKKA-R előnye, hogy technikailag olyan fejlesztői környezetben készül, amely rugalmas, nyílt szabványokat használ, így a lehető legkevésbé van kitéve a szoftverfüggőségnek. A rendszer központi szervere hosszú távon biztosítva van, a kliens alkalmazásokat igyekszünk minél inkább egy átlagos PC teljesítményéhez igazítani.

   Remélhetőleg, hamarosan meg fog valósulni a hivatalos együttműködés itthon is és a határon túli könyvtárakkal is.