info-kommunikációs technológiák
 
 

Keresés az Interneten

 
 

Az Internet kifejezés a XXI. századra a köznyelv részévé vált: Internet-kávéházakba ülhetünk be szinte bárhol a világon, ahonnan freemail segítségével elintézhetjük levelezésünket, majd betérünk az Internet-bankba, de akár árut is rendelhetünk a világ túlsó feléről; megnézzük, hogy mi volt a tananyag az utolsó előadáson – amiről hiányoztunk – és elküldjük házi feladatunkat egy e-learning rendszer segítségével. Szórakozásra is sokan használják az Internetet: játék, zene és film letöltésére, de tájékozódhatunk rádió-, tv- és moziműsorokról, és számos cég szakosodott internetes hírszolgáltatásra.

 
 

Az Internetnek a mindennapi életben betöltött szerepéről elmondhatjuk, hogy forradalmasította a számítógépek és a kommunikáció világát azzal, hogy korábban különálló kommunikációs területeket integrált, egyesítve a távíró, a telefon, a rádió előnyeit, ugyanakkor az információk terítésében is új lehetőségeket nyitott meg úgy, hogy a földrajzi korlátokat szinte figyelmen kívül hagyta.

 
 

Maga a kifejezés (internet) hálózatok összekapcsolását jelenti adatok továbbítása érdekében. Ha nagybetűvel írjuk, akkor az 1970-es években, az ARPANET-ből kialakult világméretű hálózatra gondolunk. Az Internet gyakorlatilag valamilyen módon összekapcsolt autonóm rendszerek összessége.

 
 

Az Internet technikai felépítését vázlatosan a következőképpen adhatjuk meg: adottak a földrészeken belül az egyes gerinchálózatok, ezekhez nagysebességű csomóponti gépek, routerek csatlakoznak. A csomóponti gépeket egymással olyan kábelek kötik össze, melyek nagysebességű adattovábbítást tesznek lehetővé. Az egyes földrészekhez tartozó gerinchálózatok egymáshoz transzatlanti kábelek segítségével csatlakoznak. Az üzeneteket csomagokra kell bontani, és az egyes csomagokat a routerek továbbítják különféle útvonalakon keresztül. A különféle útvonalak megkövetelik, hogy az üzenetet az átviteli közegnek megfelelően (továbbítás során esetleg többször is) átcsomagolják.

 
 

Talán az elektronikus levelezés megjelenése után az Internet legfontosabb alkalmazása a Világháló kialakítása lett. A fejlesztés lényege, hogy egységes nyelvezettel (ez a HTML) készített olyan hipertext dokumentumokat helyeznek el az Interneten, ahol a szövegben elhelyezett hivatkozások a szövegen kívülre, más helyen található dokumentumra is utalhatnak, valamint a szövegben szinte bármilyen más médium (kép, animáció, hang, video stb.) is elhelyezhető. Ezen dokumentumok olvasását speciális programok, ún. böngészők teszik lehetővé, amelyek egyrészt képesek követni a dokumentumban elhelyezett hivatkozásokat, másrészt megjeleníteni a dokumentumban elhelyezett médiát.

 
 

A Web megjelenése ugrásszerűen megváltoztatta a fejlődés irányát: ma több, eredetileg nem a Webre tervezett Internet-alkalmazás elérhető a Weben keresztül is, és nincs kizárva, hogy az elektronikus levelezés is egy idő után teljesen a Web-változatokra fog áttérni. A képes/grafikus Web-alkalmazások nyitották meg az Internet-használatot nem-számítástechnikusok számára is, és csak remélni lehet, hogy a továbbiakban a Világháló a műszaki és üzleti felhasználás mellett a humán szférában is lényeges szerephez tud jutni, és az információs társadalom létrejöttében, alakításában felbecsülhetetlen szerepet tölt be.

 
 

A Világhálónak nincs mindenek felett álló szervezeti sémája vagy struktúrája. Nem hasonlítható az elektronikus adatbázisokhoz sem, mivel nincs indexelve témakörök vagy kulcsszavak szerint. A Világhálón található információk nagy része szabad, de találhatók előfizetést igénylő információforrások is. A Világhálón megjelenő információt nem felügyeltnek és nem szerkesztettnek kell tekintenünk. Ezen jellemzők figyelembe vételével kell megvalósítanunk az információkeresést az Interneten.

 
 

Az Internet fejlődésében eltelt jó tíz év, mire az első kereső szoftver – az Archie – megszületett 1990-ben. Ez nem meglepő, mert erre az időre nőtt olyan méretűvé az Internet nemzetközi hálózata, hogy nem mindig volt nyilvánvaló, hogy egy bizonyos állományt, letölthető szoftvert hol találunk meg.

 
 

Az Archie egy FTP-hez hasonló felhasználói felületet kínált. A keresésre vonatkozó igény elküldése után a felhasználó egy fájl-listát kapott a valószínű találatokról. Ehhez arra volt szükség, hogy feloldják az addigi szigorú bejelentkezési kötelezettséget – azaz valaki csak akkor jelentkezhetett be egy szerverre, ha ott felhasználói azonosítója és jelszava volt – és megszületett az anonim bejelentkezés módszere, ami a nyilvánosság felé nyitást jelentette. (Az anonim bejelentkezés azt jelenti, hogy a felhasználói azonosítóként az „anonymous” szót adjuk meg, ezután a rendszer nem kér jelszót, és engedélyezi a belépést.) Ennek alapján minden szolgáltatónak el kellett döntenie, hogy mi az, amit a nyilvánosság elé tár, és mi az, amit „belső” használatra, azaz csak azoknak, akiknek erre jogosultságot ad. Ez a lehetőség alkalmat teremtett a szolgáltatások különböző szintű igénybevételére.

 
 

Az Archie után a Gopher volt a kereső rendszerek következő állomása, amely menürendszeren keresztül meghatározott témakörökben engedett keresést. A Gopher – bár még nem használta a HTML-t – példát teremtett arra, hogy kereszthivatkozott dokumentumok (hipertextek) hogyan működhetnek együtt.

 
 

A kereső rendszerek fejlődése során a legfontosabb kérdés arról szólt, hogy a keresést végrehajtó felhasználónak mekkora szabadság adható. Keresni először fájlnév alapján lehetett, majd megjelentek a témakörök. A témakörök használata nagyon komoly moderátori közreműködést igényelt, így hamarosan új keresési módszerek kidolgozása vált szükségessé.

 
 

A keresők fejlődésével a felhasználói felület kialakítása mellett egyre fontosabb kérdéssé vált, hogy hogyan gyűjtik össze azokat az információkat, amelyek alapján válaszolnak a felhasználók kérdéseire. Speciális programok – spider-nek (póknak) vagy crawler-nek (csúszómászónak) nevezik őket – gyűjtik össze az információt az Interneten, és a begyűjtött információt olyan adatbázisba szerkesztik, amely minél összetettebb lekérdezéseket tesz lehetővé. Az adatbázis kialakítása során fontos szemponttá vált a talált helyek rangsorolása.

 
 

Markáns változást hozott a természetes nyelvű keresők megjelenése, amikor a keresésre vonatkozóan semmiféle előzetes struktúra (témakörök, menü, tárgyszavak stb.) nincs megadva. A felhasználók felkészültségétől, rutinjától és leleményességétől függ, hogy melyik kereső rendszert – és vele együtt, melyik kereséséi stratégiát – választják.

 
 

A keresőeszközök szisztematikus áttekintéséhez három eszköztípust kell megkülönböztetnünk:

  • keresőrendszerek;
  • tárgyszó-katalógusok;
  • metakereső eszközök.
 
 

A keresőrendszerek az Interneten fellelhető kiterjedt forrásgyűjtemények – Web-dokumentumok, Usenet-ek stb. – keresésére használhatók. Különösen egyedi szavak vagy kifejezések keresésére hasznosak. Az Interneten számos keresőrendszer található, így az információkeresés első feladata a megfelelő keresőrendszer kiválasztása. A legismertebb keresőrendszerek: Alta Vista, Excite, Google, HotBot, InfoSeek, Lycos, Magellan, WebCrawler. Keresőrendszer kiválasztásakor figyelembe kell venni a felkeresett források számát és típusát. (Ezek az információk a keresőrendszerek honlapján legtöbbször fellelhetők.)

 
 

Egy addig nem használt keresőrendszer esetén először célszerű megnézni a rendszer Súgóját (Helpjét), ahol nagyon fontos keresési jellemzőket magyaráznak el. Sosem szabad elfelejtenünk, hogy a keresőrendszerek szabad szavas indexelést használnak, ami azt jelenti, hogy a keresett kifejezést a teljes dokumentumban keresik. Ebből következik, hogy a találatok száma igen magas lehet, közöttük azonban sok olyan van, amely a keresésünk szempontjából lényegtelen, sőt félreértésen alapszik (lásd azonos alakú, különböző jelentésű szavak).

Ez ellen úgy védekezhetünk,
ha speciális szakkifejezést keresünk; a keresést szakterületre korlátozzuk;
több speciális szót vagy kifejezést használunk, esetleg egyes kifejezéseket vagy szavakat kizárunk a keresésből.

 

A tárgyszó-katalógusok Webhelyek témakörök szerint rendezett listája, és különösen keresések indítására, általános keresésekre alkalmasak. A leggyakrabban hivatkozott tárgyszó-katalógus a Yahoo. A metakereső eszközök ugyanabban az időben több, különböző keresőrendszert használnak. Előnyük, hogy időtakarékosak, illetve széleskörű keresések esetén hasznosak, amikor nem csak találni szeretnénk valamit, hanem teljes körű felmérésre van szükségünk. Metakereső eszközök: Metacrawler, All in One, Savvy Search.

 
 

A továbbiakban áttekintjük a Webhelyek egy lehetséges osztályozását a rajtuk fellelhető információ jellemzői alapján.

 
 

Az első nagy csoportot azok a szabad Webhelyek képezik, jelentős mennyiségű értékes és aktuális információval. Ezek a következők lehetnek:

 

Aktuális események és témák

  • Talán ez az egyik legnagyobb vonzereje az Internetnek, hogy használatával hihetetlenül gyorsan lehet információkat megjeleníteni, közzétenni. Ezért ma már a jelentős napilapok on-line kiadásokat hoznak létre, ahol összességében több információ jelenik meg, mint másnap az újságban. Vannak kifejezetten az Interneten megjelenő „újságok” is.
FigyelőNet

Aktuális céginformációk

  • A legtöbb cég ma már az Interneten is megmutatja magát, ahol az előbb említett gyorsaságot kihasználva naprakész információkat jelenítenek meg magukról. Az ilyen honlapok előnye, hogy a híreket az adott cégre leválogatva találjuk meg, tehát nem kell széleskörű keresését folytatnunk. Az azonban figyelembe kell vennünk, hogy ezek a Weblapok a cég szempontjából közlik a híreket, ezért bizonyos esetekben szükség lehet az itt megjelenő hírek ellenőrzésére. Ezt a problémát részben megoldja, ha a cég az Interneten elérhető referenciákat is megadja. A nagyobb cégek honlapjának listáját még tárgyszó-katalógusokban is megtaláljuk.
MOL

Kormányzati információk

  • A legtöbb kormányzati szerv működtet olyan Webhelyet (portált), ahol részletes ismertetést találhatunk a szervezeti felépítésükről, politikájukról, ugyanakkor fontos jelentések, törvények, rendeletek és statisztikák is megjelennek itt. Az Internetes közlés annyira népszerűvé vált, hogy az információ sok esetben nyomtatott formában már meg sem jelenik.
Kormányzati Portál

Szövetségek, klubok és más szervezetek információi

  • Sok szakmai, kereskedelmi és egyéb szervezet tart fenn honlapot, ahonnan megtudhatjuk a szervezet elérhetőségét, fórumot találhatunk egyes kérdések megvitatására. Az ilyen Webhelyek segítségével hasonló érdekeltségű és érdeklődésű emberek oszthatják meg egymással elképzeléseiket és információikat.
MKIK

Egészségügyi információk és tünetleírások

  • Az egészségügyi információkat közlő Webhelyeken is találhatunk elérési információkat, amelyek adott esetben igen fontosak lehetnek, de szép számmal találhatunk „elsősegélynyújtó” Webhelyeket is, ahol tünetleírások és javasolt terápiák olvashatók.
    (Az Internet közvetítésével már műtétet is hajtottak végre.)
Házipatika

Szórakozásra és kikapcsolódásra vonatkozó információk

  • A kulturális Webhelyeken műsorinformációkat találhatunk (TV, mozi, színház stb.), esetleg kiegészítő információkkal az éppen folyó műsorról. Hasonló funkció megvalósítható sport, utazás és turizmus témakörökben. Ezen helyeken az aktualitás a legnagyobb érték, legyen szó akár egy sportmérkőzés pillanatnyi állásáról vagy az aktuális menetrendről – vagy éppen menetrendi késésről (például repülőtéren).
Port.hu
 

A következő nagy csoportba azok a szabad Webhelyek tartoznak, amelyekről származó információk fenntartásokkal kezelendők, valóságtartalmuk, hitelességük megkérdőjelezhető.

 

Reklámok

  • Céljuk valamilyen termék vagy szolgáltatás megvásárlására való ösztönzés, bátorítás.
 

Pártfogó, támogató, képviseleti szervezetek

  • Honlapjaik célja kettős: támogatások gyűjtése szponzorok révén, illetve a közvélemény befolyásolása.
 

Személyes Webhelyek

  • Egy személyt bemutató honlap a bemutatott személy szempontjai szerint. Ezek a honlapok valamelyik tartalomszolgáltatónál jelennek meg, és legtöbbször arról lehet felismerni őket, hogy ~ jel található a Webhely címében.
 

Hivatalos Webhelyek paródiái

  • Céljuk legtöbbször a szórakoztatás, de előfordul, hogy termékvásárlásra is ösztönöznek.
 
 

A harmadik csoportba tartoznak azok a Webhelyek, amelyek csak meghatározott (előfizetési) díj ellenében érhetők el. Több könyvtár működik ezen az elven, ahol elektronikus dokumentumok letöltéséért fizetni kell, illetve vannak olyan szervezetek, amelyek speciális tartalmú adatbázisokat tartanak fent, amelyből származó adatokat piaci áron értékesítik. Díjfizetéssel oldják meg azt is, hogy egy szervezet honlapját csak a szervezet tagjai érjék el. Az ilyen honlapok általában kívül esnek az Internetes információkeresés hatókörén.

 
 

Az on-line adatbázisok és a Webes keresőeszközök olyan jellemzőkkel rendelkezhetnek, amellyel keresésünket koncentrálni vagy finomítani tudjuk. A hatékony és hatásos keresés megvalósítása érdekében célszerű alaposabban megismerni ezeket a jellemzőket.

 

Súgó

Különböző módokon érhető el: a legtöbb esetben a nyitóképernyőn található utalás a Súgóra, amely elmagyarázza, hogy az adott eszköz hogyan működik, vagy tippeket, példákat ad tipikus kereséséi feladatokra. Gyakori az úgynevezett kontextusfüggő segítségnyújtás, amikor a keresési folyamat pillanatnyi állapotához illeszkedő tanácsokat kaphatunk.

 

Ellenőrzött és nem ellenőrzött szótárak

A legtöbb könyvtári adatbázis tartalmaz tárgyszó katalógust a keresés megkönnyítése érdekében. Ha ez a katalógus teljes körű és előre rögzített, akkor ellenőrzött szótárról beszélünk. Ennek a megközelítésnek számos előnye van. Mivel a tárgyszavak minden tételhez hozzá vannak rendelve, olyan könyv vagy cikk témáját is azonosítani tudjuk, amelynek címében nem szerepel a keresni kívánt fogalom. A tárgyszavak lehetnek hierarchikusan rendezve, amivel pontosítani tudjuk keresésünket. Egyetlen hátrányuk, hogy az új tárgyszavak késéssel jelennek meg a szótárban. Nem ellenőrzött szótárról akkor beszélünk, ha a tárgyszavak listáját a keresőrendszer állapítja meg és rendeli az egyes tételekhez. Ennek a megoldásnak az előnye, hogy a legújabb és gyakran előforduló tárgyszavak is megjelennek a szótárban, akár a zsargon szintjén. Hátránya az, hogy ugyanaz a fogalom különböző szóalakokban is megjelenhet, és akkor mindegyiket meg kell adni a kereséséhez, és gyakran fordulnak elő téves találatok a szavak többértelműsége miatt.

 

Logikai operátorok

Jelentőségüket a keresés terjedelmének befolyásolása adja. A logikai és, nem a keresését szűkíti, míg a logikai vagy a keresést tágítja. Használatukat nehezíti, hogy az egyes keresőeszközök különböző jelöléseket használnak rájuk, ezért célszerű az adott eszköz Súgójában utánanézni a logikai operátorok használatának.

 

Szótőkeresés

Ez a megoldás szélesíti a keresést, mivel a keresett szó ragozott, toldalékolt alakjait is megtalálja. Az ilyen keresés kijelöléséhez egy speciális karaktert kell a szótő után írni (legtöbbször a * karaktert), azonban ebben az esetben is célszerű a Súgó tanulmányozása ezen módszer használata előtt.

 

Mező-keresés

A keresés az adatbázis-tételeket leíró egyes mezőkre történik, illetve ezek a keresések kombinálhatók, amikor egyszerre több mező tartalmára keresünk.

 

Keresés korlátozása

Az adatbázis-tételek meghatározott jellemzői alapján korlátozhatjuk a keresést. Leggyakrabban használt jellemzők: a tétel keletkezési dátuma, formátuma, nyelve, illetve ezt a keresést kombinálni lehet valamilyen tárgyszavas kereséssel.

 

Kifejezés-
keresés

Több szóból álló kifejezések esetén szükség lehet a szavak sorrendjének meghatározására, mert az „és” logikai operátor nagy számban hozna be téves találatokat. Megoldásának különböző módjai léteznek – legtöbbször a kifejezést idézőjelek közé kell írni – ezért ebben az esetben is célszerű előbb a Súgó felkeresése.

 

Keresés hasonlóság/
közelség alapján

Ez a megoldás a logikai operátorokhoz hasonlóan működik, a keresett szavak egymáshoz való viszonyát határozza meg a szövegben való elhelyezkedésük alapján. Különösen a Világhálón vagy teljes szöveget tartalmazó adatbázisokban történő keresés esetén jelentenek előnyt.

 
 

A keresés után értékelni kell a kapott eredményeket, hogy mennyiben felelnek azoknak az információs igényeknek, amelyek alapján a keresését indítottuk.

 
 

Bibliografikus adatbázisokban történő keresés esetén ragaszkodnunk kell az adatbázis-tételek teljes leírásához (katalóguscédulájához). A tételhez rendelt tárgyszavak listája segíthet a tétel alkalmasságának megítélésében, ha a tétel rövid absztraktja vagy tartalomjegyzéke is rendelkezésre áll, még pontosabban tudjuk a kapott találatokat megítélni. Könyvtárak adatbázisai arról is információt adnak, hogy a könyv vagy cikk hol található, illetve kölcsönözhető-e.

 
 

A Webes keresőrendszerek változatos formákban közlik a keresések eredményeit, így nehéz általános leírást adni az eredmények értékelésére és interpretálására. Néhány közös szempont azonban megadható:

 

Tartomány

  • Minden keresőrendszer közli a talált információ címét a Világhálón. Ellenőrizzük az URL tartományát – ha ez lehetséges. Az .edu végződés oktatási intézményt jelöl, a .gov kormányzati szervet, társaságra/szövetségre az .org utal, míg az üzleti élet a .com tartománynevet használja.

 

Rangsor

  • A találatok nagy száma miatt minden keresőrendszer rangsorolja a találatokat, és ebben a sorrendben mutatja meg őket. A rangsorolás szempontjai nagyon különbözőek lehetnek: a keresett szó gyakorisága, előfordulása a címben vagy a dokumentum elején, a hivatkozások száma stb. Pontos értelmezéséhez szükség van a keresőrendszer keresési stratégiájának pontos ismeretére.

 

Dátum

  • A bibliográfiai adatbázisokhoz itt is nagy szerepe van a dokumentumhoz rendelt dátumnak, csak arra kell figyelni, hogy ez nem a dokumentum keletkezésének valódi idejét jelöli, hanem a létrehozás (Webre kerülés) vagy az utolsó módosítás időpontját adja meg.

 

Annotáció

  • A legtöbb keresőrendszer rövid „annotációt” ad a talált dokumentumról a dokumentum néhány sorának felidézésével. Az idézet vagy a dokumentum elejéről, vagy a kereset szó (szavak) környezetéből származik. Az annotáció annak megítélésében segít, hogy eldönthessük, a talált dokumentum abban az értelemben használja-e a keresett szót, ahogy mi azt elgondoltuk.

 
 

Az érdeklődésünkre számot tartó találatok esetén ellenőrizni kell, hogy a talált dokumentum valóban a Webhely előállítójától/fenntartójától származik-e. Ezt legkönnyebben úgy tehetjük meg, hogy megkeressük a talált dokumentum kiinduló honlapját, amire szerencsés esetben közvetlen utalást találunk. („About us”; „About this site”, „Home”; „Home page” és ennek megfelelői a különböző nyelveken.)

 
 

A keresés eredményeit különböző módokon rögzíthetjük: kinyomtathatjuk, bemásolhatjuk saját dokumentumunkba, lemezre menthetjük vagy továbbíthatjuk elektronikus levélben.

 
 

A megtalált információk nem egyformán értékesek a keresésünk valódi célja szempontjából, ezért további elemzésre van szükség. Különösen fontos ez Web-dokumentumok esetén, mert ezeket legtöbbször senki sem ellenőrzi.

 
     

Források

  • O’Connor, Lisa G. –Radcliff, Carolyn J. –Gedeon, Julie A.: Assessing Information Literacy Skills:Developing a Standardized Instrument for Institutional and Longitudinal Measurement. ACRL Tenth National Conference, Denver, March 15-18. 2001.

http://www.ala.org/Content/
NavigationMenu/ACRL/
Events_and_Conferences/
oconnor.pdf

 
  • Swanson, Judy: CSU Information Competence Tutorials. Cal Poly State University, San Luis Obispo, 1999.

http://multiweb.lib.calpoly.edu/
infocomp/modules/index.html
     

Kiegészítés

Szempontrendszer Web-dokumentumok értékeléséhez.

PDF