Hasznos halmazok – Adatbázis-szolgáltatás
Figyelő, 2002. október 31. p. 44-34
A cikk leadott változata:
Egy felsőoktatási intézmény kutatási projektje – különböző életkorú gyerekek együttnevelése – egyik első lépéseként fel kívánták térképezni a témakörrel kapcsolatban megjelent hazai szakirodalmat. A megfelelő hazai adatbázisban 9 db cikkre leltek. A szakma külföldi – esetünkben az amerikai ERIC (Educational Research Informational Center) – adatbázisában hasonló keresőprofillal a találatok száma 1200 körüli volt. Az, hogy a különböző szakterületek információi arányaiban egyre kevéssé magyarul jelennek meg, lehet, hogy szomorú számunkra, ugyanakkor a helyzethez való alkalmazkodás nem kerülhető ki.
A magyarországi jelentősebb (aktualizált, nyilvánosan elérhető, illetve megvásárolható, megbízható, stb.) szakmai adatbázisok számát a Magyar Tartalomipari Szövetség elnöke, Mlinarics József 100 körülire teszi. Ezek témakörei a teljesség igénye nélkül: tudományos (műszaki, kémiai, orvosi, mezőgazdasági, informatikai, oktatási, marketing, környezetvédelmi stb.) statisztikai, kulturális (irodalmi, sajtó, film, zenei stb.) üzleti, stb. Az idehaza is elérhető adatbázis-szolgáltató, a Dialog Corporation ugyanakkor több mint félezer db legkülönfélébb témájú adatbázist – a biotechnológiától a petrolkémiáig, az oktatástól a marketingig – szolgáltat szinte kizárólag angol nyelven, sokszor évtizedekre visszamenően. Az adatbázisok tartalmukat tekintve lehetnek folyóiratcikkek, bibliográfiai leírások, könyvek, piaci jelentések, konferenciaanyagok, disszertációk, szabadalmi leírások stb. Emellett több más hasonló nemzetközi szolgáltató – pl. STN International, Lexis-Nexis – is elérhető idehaza.
Főleg nyugati és angol
A hazai illetve nemzetközi információ mennyisége közötti arányok egyre kevésbé hagyhatók figyelmen kívül. A sokat emlegetett tudásalapú társadalomban a leszűrt és elemzett információból előállított tudás jelenti a legfőbb versenyelőnyt. Ez pedig elképzelhetetlen rendszerezett, ellenőrzött, nagy mennyiségű és pillanatok alatt elérhető adathalmazok nélkül. E kérdés kapcsán nem véletlenül kerül szóba az Internet, mely sokmilliárd oldalnyi információt tartalmaz. Azaz: információt, de nem tudást. Ez azt is jelenti, hogy az interneten elérhető kétségtelenül hasznos adatokat be kell cserkészni – amellett, hogy a keresőmotorok a web 30-40%-át látják csak – meg kell tisztítani, ugyanis az interenerte elvileg bárki szinte bármivel kapcsolatban tehet fel bármilyen szintű információt. E felkutatás pedig nem kevés munkaidőt vesz igénybe. S noha a mérvadó adatbázis-szolgáltatók is elérhetők a hálózaton, de a legérdekesebb, azaz legfrissebb, részletesebb és testreszabottabb információjukat általában csak térítésért biztosítják. Így megközelítőleg ott állunk, mintha térítéses adatbázisban keresnénk.
Információ; nem informatika
Sok hazai vállalat – köztük multinacionálisak is –, ha információs szolgáltatások kínálatával keresik fel őket – elbizonytalanodnak. Köszönjük, nekünk már van weblapunk; vagy már van vállalatirányítási szoftverünk – mondják többen. Az informatika és az információ különbsége tehát még nem feltétlenül vált világossá a fejekben, de a folyamat már gyorsulni látszik. Nem ritka például, hogy amikor meglátják a szakterületükkel foglalkozó adatbázisok, illetve elérhető folyóiratok mennyiségét és tartalmát, megváltozik véleményük. A Dialog például 44 farmakológiai, 15 olajiparral, 30 piackutatási, 12 oktatási témájú adatbázist kínál az adott szakterületek kereséséhez, ezek mellett 7000 szakfolyóirat elektronikus kiadását is elérhetővé teszi döntően teljes szöveges formátumban.
CD, DVD-ROM és online-kínálat
Az adatok elérése lényegében kétféle módon történik; CD-n, DVD-ROM-on illetve (kissé leegyszerűsítve) telefon-, X.25-ös- és internetes hálózaton, mint szolgáltatáson keresztül. Az előbbiek előnye, hogy költsége könnyen tervezhető előre, és korlátlan számban lehet benne keresni. Hátránya, hogy kiadása pillanatától kezdve folyamatosan avul, tehát a legfrissebb adatok egyre inkább hiányoznak belőle. Az online elérés esetén az adatbázisok készítése ütemében válnak elérhetővé az adatok, a híradatbázisok esetében akár a nyomtatott hírek megjelenése előtt is. Az adatbázis-gyűjtemények szolgáltatói azt is kínálják, hogy egyszerre több adatbázisban lehet futtatni ugyanazt a keresőprofilt. Így mérsékelhető a keresési idő, illetve az információ szóródásából eredő keresési veszteség. Az ilyen szolgáltatóval való szerződés megkíméli az ügyfeleket attól, hogy az érdeklődési körükbe tartozó adatbázisokkal egyenként kössön szerződést, illetve hogy a fontos, de csak ritkán keresett témakörök adatbázisait nem kell előfizetni. Gyakori ugyanis, hogy a megrendelő – példának okáért biotechnológiai vállalkozás – nem csak tevékenységi körével szorosan kapcsolható biotechnológiai K+F adatbázisokban keres, hanem érdeklődik a biotechnológiai piac más szereplőinek adatai (termékek, szabadalmak, piaci potenciál, vezetők adatai – beosztás, képességek, tulajdonlás stb. –, a labormunkához beszerzendő gépek, berendezések, nyersanyagok piaca, szállítói, stb. Joggal kíváncsi lehet megrendelőinek hitelképességére, illetve tágabb környezete történéseire. A Dunaferr Rt. Kutatóintézet vezető kutatója, Sáfár László a vállalat alaptevékenységével összefüggő anyagtudományi szakirodalom mellett céginformációs, marketing, pénzügyi, tender- és szabadalmi információt egyaránt keres.
Az adatbázisok tartalomra és az adatok részletezettsége szerint is tagozódnak. Az ELTE Könyvtártudományi-Informatikai tanszékének oktatója, céginformációs rendszerek kutatója, Kiszl Péter a vállalatokról szóló információt több szintre bontja: alap, jogi, minősített, marketing és „egyéb”. Ezek többé-kevésbé árkategóriákat is jelentenek: míg az alapadatok ingyenesek, a cégstruktúrát, hitelminősítést, esetleg a vezetők hobbiját tartalmazók jóval drágábbak.
Emellett mód van a témafigyelésre is; az előre megadott profilban a szolgáltató akár az információ megjelenésének pillanatában küldi elektronikusan a megfelelő tételeket a megrendelő postafiókjába. Az online keresés esetén nagyobb lehetőség nyílik a keresési stratégia rugalmas változtatására is. A vaskos (és méregdrága) piaci jelentések egészének megrendelése helyett van mód arra, hogy csak a szükséges egy-két táblázatot vagy összefoglalót töltsük le, fizessük ki, akár a ma közreadott felmérésből.
Piaci helyzet
A szolgáltatók kínálata többé-kevésbé kiegészíti egymást. Az egyik legszélesebb kínálattal a Dialog rendelkezik, de például a különféle molekulák grafikus keresésében az STN International jeleskedik. Az adatbázis-szolgáltatók szolgáltatásait főként azok a hazai vállalkozások veszik igénybe, amelyek erősen információ- és tudásigényes terméket, szolgáltatást állítanak elő, illetve amelyek döntően Nyugaton értékesítik termékeiket.
Keresés
A kereséseket korábban leginkább avatott közvetítők (intermediary), profilszerkeszők, kereséssel foglalkozó szakemberek, könyvtárosok végezték; a végfelhasználók tehát vele folytattak párbeszédet; adtak ún. referenszinterjút. A keresési felületek barátságosabbá válásával azonban a nagyobb vállalkozásoknál már nem ritka, hogy az adatbázis-szolgáltatók kínálatát az intranetbe ágyazottan használja a vállalati marketinges, a kutató, a beszerző vagy éppen a jogász, szabadalomkutató.
Az adatbázisok mennyisége és minősége sem garancia arra, hogy egy adat létezik. Van, hogy az adat hiánya maga az eredmény – mondja Sáfár László. Volt, hogy egy első látásra komolynak tűnő ügyfélről derült ki, hogy csupán egy kéttagú Észak-ausztrál kft. képviselője, akinek adatai a hitelképes vállalkozások adatbázisaiban nem voltak elérhetők.
Az adatbázisokból letöltött információ nem mindig ad választ a kereső konkrét kérdésére, sokszor további feldolgozásra van szükség. Amennyiben a vállalat képes erre, saját munkatársát bízza meg a feladat elvégzésére. Egyre gyakoribb azonban az ebbéli munka kiadása független információs tanácsadónak – információbrókernek – aki információkeresési képességeit kihasználva dolgozik a vállalati szakemberek keze alá. Feladata az is lehet, hogy a vállalattal kapcsolatban megjelenő információt folyamatosan figyeli, és visszajelzést ad az illetékeseknek.
EISZ a felsőoktatásnak
Az Oktatási Minisztérium által finanszírozott, a hazai felsőoktatási intézmények számára ezáltal térítésmentesen elérhető EISZ (Elektronikus Információs Szolgáltatás) több kisebb hazai adatbázis mellett három nemzetközi, a Web of Science, a Science Direct és a SwetsNet Navigator szolgáltatásaiból válogat. Lehetővé teszi, a különféle szakcikkekre való hivatkozások visszakeresését öt évre visszamenőleg, 7 és fél ezer folyóirat szövegének elektronikus változatához és 15.000 folyóirat bibliográfiai leírásához enged hozzáférést a természet és társadalomtudományok területén egyaránt.
30 éves a Dialog
A ma “dotkom”-nak nevezett szolgáltatók előfutára 30 éve, 1972-ben jelent meg, mikor Roger K. Summit, az amerikai Lockheed rendszertervezője (később elnök, vezérigazgató, ma tiszteletbeli elnök) megalkotta a világ első hálózati információ-visszakereső rendszerét. A szolgáltatás akkor is, ma is online működik (maga a kifejezés is tőlük származik), ami ma természetesen hangzik, de érdemes figyelembe venni, hogy az Internet alapját jelentő TCP/IP protokoll csak egy évvel később, 1973-ban született meg. A Dialog Corporation jelenleg több mint 13 terabájtnyi tartalmat szolgáltat, ami megközelítőleg 8 milliárd oldal szöveget és 4 millió képet tesz ki. A vállalkozás ma a kanadai Thomson Company tulajdona. A rendszerhez való hozzáférés névleges díjú előfizetéshez kötött, az egyes adatbázisok megnyitása illetve a rekordok letöltése változó összegű; a 7000 szakfolyóiratot és napilapot tartalmazó NewsRoom híradatbázis cikkenkénti díja például jól kalkulálhatóan, egységesen 2,95 USD, de a vaskos piackutatások ára sok ezer dollár is lehet. A rendszer a meglepetések elkerülése végett előre jelzi a várható összeget. A hozzáférés és letöltések költsége jelentősen mérsékelhető konzorciumi szerződések által, ahogy ezt a világ számos országában, Németországtól Iránig teszik.