info-kommunikációs technológiák |
Keresés az Interneten |
||
Az Internet kifejezés a XXI. századra a köznyelv részévé vált: Internet-kávéházakba ülhetünk be szinte bárhol a világon, ahonnan freemail segítségével elintézhetjük levelezésünket, majd betérünk az Internet-bankba, de akár árut is rendelhetünk a világ túlsó feléről; megnézzük, hogy mi volt a tananyag az utolsó előadáson – amiről hiányoztunk – és elküldjük házi feladatunkat egy e-learning rendszer segítségével. Szórakozásra is sokan használják az Internetet: játék, zene és film letöltésére, de tájékozódhatunk rádió-, tv- és moziműsorokról, és számos cég szakosodott internetes hírszolgáltatásra. |
||
Az Internetnek a mindennapi életben betöltött szerepéről elmondhatjuk, hogy forradalmasította a számítógépek és a kommunikáció világát azzal, hogy korábban különálló kommunikációs területeket integrált, egyesítve a távíró, a telefon, a rádió előnyeit, ugyanakkor az információk terítésében is új lehetőségeket nyitott meg úgy, hogy a földrajzi korlátokat szinte figyelmen kívül hagyta. |
||
Maga a kifejezés (internet) hálózatok összekapcsolását jelenti adatok továbbítása érdekében. Ha nagybetűvel írjuk, akkor az 1970-es években, az ARPANET-ből kialakult világméretű hálózatra gondolunk. Az Internet gyakorlatilag valamilyen módon összekapcsolt autonóm rendszerek összessége. |
||
Az Internet technikai felépítését vázlatosan a következőképpen adhatjuk meg: adottak a földrészeken belül az egyes gerinchálózatok, ezekhez nagysebességű csomóponti gépek, routerek csatlakoznak. A csomóponti gépeket egymással olyan kábelek kötik össze, melyek nagysebességű adattovábbítást tesznek lehetővé. Az egyes földrészekhez tartozó gerinchálózatok egymáshoz transzatlanti kábelek segítségével csatlakoznak. Az üzeneteket csomagokra kell bontani, és az egyes csomagokat a routerek továbbítják különféle útvonalakon keresztül. A különféle útvonalak megkövetelik, hogy az üzenetet az átviteli közegnek megfelelően (továbbítás során esetleg többször is) átcsomagolják. |
||
Talán az elektronikus levelezés megjelenése után az Internet legfontosabb alkalmazása a Világháló kialakítása lett. A fejlesztés lényege, hogy egységes nyelvezettel (ez a HTML) készített olyan hipertext dokumentumokat helyeznek el az Interneten, ahol a szövegben elhelyezett hivatkozások a szövegen kívülre, más helyen található dokumentumra is utalhatnak, valamint a szövegben szinte bármilyen más médium (kép, animáció, hang, video stb.) is elhelyezhető. Ezen dokumentumok olvasását speciális programok, ún. böngészők teszik lehetővé, amelyek egyrészt képesek követni a dokumentumban elhelyezett hivatkozásokat, másrészt megjeleníteni a dokumentumban elhelyezett médiát. |
||
A Web megjelenése ugrásszerűen megváltoztatta a fejlődés irányát: ma több, eredetileg nem a Webre tervezett Internet-alkalmazás elérhető a Weben keresztül is, és nincs kizárva, hogy az elektronikus levelezés is egy idő után teljesen a Web-változatokra fog áttérni. A képes/grafikus Web-alkalmazások nyitották meg az Internet-használatot nem-számítástechnikusok számára is, és csak remélni lehet, hogy a továbbiakban a Világháló a műszaki és üzleti felhasználás mellett a humán szférában is lényeges szerephez tud jutni, és az információs társadalom létrejöttében, alakításában felbecsülhetetlen szerepet tölt be. |
||
A Világhálónak nincs mindenek felett álló szervezeti sémája vagy struktúrája. Nem hasonlítható az elektronikus adatbázisokhoz sem, mivel nincs indexelve témakörök vagy kulcsszavak szerint. A Világhálón található információk nagy része szabad, de találhatók előfizetést igénylő információforrások is. A Világhálón megjelenő információt nem felügyeltnek és nem szerkesztettnek kell tekintenünk. Ezen jellemzők figyelembe vételével kell megvalósítanunk az információkeresést az Interneten. |
||
Az Internet fejlődésében eltelt jó tíz év, mire az első kereső szoftver – az Archie – megszületett 1990-ben. Ez nem meglepő, mert erre az időre nőtt olyan méretűvé az Internet nemzetközi hálózata, hogy nem mindig volt nyilvánvaló, hogy egy bizonyos állományt, letölthető szoftvert hol találunk meg. |
||
Az Archie egy FTP-hez hasonló felhasználói felületet kínált. A keresésre vonatkozó igény elküldése után a felhasználó egy fájl-listát kapott a valószínű találatokról. Ehhez arra volt szükség, hogy feloldják az addigi szigorú bejelentkezési kötelezettséget – azaz valaki csak akkor jelentkezhetett be egy szerverre, ha ott felhasználói azonosítója és jelszava volt – és megszületett az anonim bejelentkezés módszere, ami a nyilvánosság felé nyitást jelentette. (Az anonim bejelentkezés azt jelenti, hogy a felhasználói azonosítóként az „anonymous” szót adjuk meg, ezután a rendszer nem kér jelszót, és engedélyezi a belépést.) Ennek alapján minden szolgáltatónak el kellett döntenie, hogy mi az, amit a nyilvánosság elé tár, és mi az, amit „belső” használatra, azaz csak azoknak, akiknek erre jogosultságot ad. Ez a lehetőség alkalmat teremtett a szolgáltatások különböző szintű igénybevételére. |
||
Az Archie után a Gopher volt a kereső rendszerek következő állomása, amely menürendszeren keresztül meghatározott témakörökben engedett keresést. A Gopher – bár még nem használta a HTML-t – példát teremtett arra, hogy kereszthivatkozott dokumentumok (hipertextek) hogyan működhetnek együtt. |
||
A kereső rendszerek fejlődése során a legfontosabb kérdés arról szólt, hogy a keresést végrehajtó felhasználónak mekkora szabadság adható. Keresni először fájlnév alapján lehetett, majd megjelentek a témakörök. A témakörök használata nagyon komoly moderátori közreműködést igényelt, így hamarosan új keresési módszerek kidolgozása vált szükségessé. |
||
A keresők fejlődésével a felhasználói felület kialakítása mellett egyre fontosabb kérdéssé vált, hogy hogyan gyűjtik össze azokat az információkat, amelyek alapján válaszolnak a felhasználók kérdéseire. Speciális programok – spider-nek (póknak) vagy crawler-nek (csúszómászónak) nevezik őket – gyűjtik össze az információt az Interneten, és a begyűjtött információt olyan adatbázisba szerkesztik, amely minél összetettebb lekérdezéseket tesz lehetővé. Az adatbázis kialakítása során fontos szemponttá vált a talált helyek rangsorolása. |
||
Markáns változást hozott a természetes nyelvű keresők megjelenése, amikor a keresésre vonatkozóan semmiféle előzetes struktúra (témakörök, menü, tárgyszavak stb.) nincs megadva. A felhasználók felkészültségétől, rutinjától és leleményességétől függ, hogy melyik kereső rendszert – és vele együtt, melyik kereséséi stratégiát – választják. |
||
A keresőeszközök szisztematikus áttekintéséhez három eszköztípust kell megkülönböztetnünk:
|
||
A keresőrendszerek az Interneten fellelhető kiterjedt forrásgyűjtemények – Web-dokumentumok, Usenet-ek stb. – keresésére használhatók. Különösen egyedi szavak vagy kifejezések keresésére hasznosak. Az Interneten számos keresőrendszer található, így az információkeresés első feladata a megfelelő keresőrendszer kiválasztása. A legismertebb keresőrendszerek: Alta Vista, Excite, Google, HotBot, InfoSeek, Lycos, Magellan, WebCrawler. Keresőrendszer kiválasztásakor figyelembe kell venni a felkeresett források számát és típusát. (Ezek az információk a keresőrendszerek honlapján legtöbbször fellelhetők.) |
||
Egy addig nem használt keresőrendszer esetén először célszerű megnézni a rendszer Súgóját (Helpjét), ahol nagyon fontos keresési jellemzőket magyaráznak el. Sosem szabad elfelejtenünk, hogy a keresőrendszerek szabad szavas indexelést használnak, ami azt jelenti, hogy a keresett kifejezést a teljes dokumentumban keresik. Ebből következik, hogy a találatok száma igen magas lehet, közöttük azonban sok olyan van, amely a keresésünk szempontjából lényegtelen, sőt félreértésen alapszik (lásd azonos alakú, különböző jelentésű szavak). |
Ez ellen úgy védekezhetünk, |
|
A tárgyszó-katalógusok Webhelyek témakörök szerint rendezett listája, és különösen keresések indítására, általános keresésekre alkalmasak. A leggyakrabban hivatkozott tárgyszó-katalógus a Yahoo. A metakereső eszközök ugyanabban az időben több, különböző keresőrendszert használnak. Előnyük, hogy időtakarékosak, illetve széleskörű keresések esetén hasznosak, amikor nem csak találni szeretnénk valamit, hanem teljes körű felmérésre van szükségünk. Metakereső eszközök: Metacrawler, All in One, Savvy Search. |
||
A továbbiakban áttekintjük a Webhelyek egy lehetséges osztályozását a rajtuk fellelhető információ jellemzői alapján. |
||
Az első nagy csoportot azok a szabad Webhelyek képezik, jelentős mennyiségű értékes és aktuális információval. Ezek a következők lehetnek: |
||
Aktuális események és témák |
|
|
Aktuális céginformációk |
|
|
Kormányzati információk |
|
|
Szövetségek, klubok és más szervezetek információi |
|
|
Egészségügyi információk és tünetleírások |
|
|
Szórakozásra és kikapcsolódásra vonatkozó információk |
|
|
A következő nagy csoportba azok a szabad Webhelyek tartoznak, amelyekről származó információk fenntartásokkal kezelendők, valóságtartalmuk, hitelességük megkérdőjelezhető. |
||
Reklámok |
|
|
Pártfogó, támogató, képviseleti szervezetek |
|
|
Személyes Webhelyek |
|
|
Hivatalos Webhelyek paródiái |
|
|
A harmadik csoportba tartoznak azok a Webhelyek, amelyek csak meghatározott (előfizetési) díj ellenében érhetők el. Több könyvtár működik ezen az elven, ahol elektronikus dokumentumok letöltéséért fizetni kell, illetve vannak olyan szervezetek, amelyek speciális tartalmú adatbázisokat tartanak fent, amelyből származó adatokat piaci áron értékesítik. Díjfizetéssel oldják meg azt is, hogy egy szervezet honlapját csak a szervezet tagjai érjék el. Az ilyen honlapok általában kívül esnek az Internetes információkeresés hatókörén. |
||
Az on-line adatbázisok és a Webes keresőeszközök olyan jellemzőkkel rendelkezhetnek, amellyel keresésünket koncentrálni vagy finomítani tudjuk. A hatékony és hatásos keresés megvalósítása érdekében célszerű alaposabban megismerni ezeket a jellemzőket. |
||
Súgó |
Különböző módokon érhető el: a legtöbb esetben a nyitóképernyőn található utalás a Súgóra, amely elmagyarázza, hogy az adott eszköz hogyan működik, vagy tippeket, példákat ad tipikus kereséséi feladatokra. Gyakori az úgynevezett kontextusfüggő segítségnyújtás, amikor a keresési folyamat pillanatnyi állapotához illeszkedő tanácsokat kaphatunk. |
|
Ellenőrzött és nem ellenőrzött szótárak |
A legtöbb könyvtári adatbázis tartalmaz tárgyszó katalógust a keresés megkönnyítése érdekében. Ha ez a katalógus teljes körű és előre rögzített, akkor ellenőrzött szótárról beszélünk. Ennek a megközelítésnek számos előnye van. Mivel a tárgyszavak minden tételhez hozzá vannak rendelve, olyan könyv vagy cikk témáját is azonosítani tudjuk, amelynek címében nem szerepel a keresni kívánt fogalom. A tárgyszavak lehetnek hierarchikusan rendezve, amivel pontosítani tudjuk keresésünket. Egyetlen hátrányuk, hogy az új tárgyszavak késéssel jelennek meg a szótárban. Nem ellenőrzött szótárról akkor beszélünk, ha a tárgyszavak listáját a keresőrendszer állapítja meg és rendeli az egyes tételekhez. Ennek a megoldásnak az előnye, hogy a legújabb és gyakran előforduló tárgyszavak is megjelennek a szótárban, akár a zsargon szintjén. Hátránya az, hogy ugyanaz a fogalom különböző szóalakokban is megjelenhet, és akkor mindegyiket meg kell adni a kereséséhez, és gyakran fordulnak elő téves találatok a szavak többértelműsége miatt. |
|
Logikai operátorok |
Jelentőségüket a keresés terjedelmének befolyásolása adja. A logikai és, nem a keresését szűkíti, míg a logikai vagy a keresést tágítja. Használatukat nehezíti, hogy az egyes keresőeszközök különböző jelöléseket használnak rájuk, ezért célszerű az adott eszköz Súgójában utánanézni a logikai operátorok használatának. |
|
Szótőkeresés |
Ez a megoldás szélesíti a keresést, mivel a keresett szó ragozott, toldalékolt alakjait is megtalálja. Az ilyen keresés kijelöléséhez egy speciális karaktert kell a szótő után írni (legtöbbször a * karaktert), azonban ebben az esetben is célszerű a Súgó tanulmányozása ezen módszer használata előtt. |
|
Mező-keresés |
A keresés az adatbázis-tételeket leíró egyes mezőkre történik, illetve ezek a keresések kombinálhatók, amikor egyszerre több mező tartalmára keresünk. |
|
Keresés korlátozása |
Az adatbázis-tételek meghatározott jellemzői alapján korlátozhatjuk a keresést. Leggyakrabban használt jellemzők: a tétel keletkezési dátuma, formátuma, nyelve, illetve ezt a keresést kombinálni lehet valamilyen tárgyszavas kereséssel. |
|
Kifejezés- |
Több szóból álló kifejezések esetén szükség lehet a szavak sorrendjének meghatározására, mert az „és” logikai operátor nagy számban hozna be téves találatokat. Megoldásának különböző módjai léteznek – legtöbbször a kifejezést idézőjelek közé kell írni – ezért ebben az esetben is célszerű előbb a Súgó felkeresése. |
|
Keresés hasonlóság/ |
Ez a megoldás a logikai operátorokhoz hasonlóan működik, a keresett szavak egymáshoz való viszonyát határozza meg a szövegben való elhelyezkedésük alapján. Különösen a Világhálón vagy teljes szöveget tartalmazó adatbázisokban történő keresés esetén jelentenek előnyt. |
|
A keresés után értékelni kell a kapott eredményeket, hogy mennyiben felelnek azoknak az információs igényeknek, amelyek alapján a keresését indítottuk. |
||
Bibliografikus adatbázisokban történő keresés esetén ragaszkodnunk kell az adatbázis-tételek teljes leírásához (katalóguscédulájához). A tételhez rendelt tárgyszavak listája segíthet a tétel alkalmasságának megítélésében, ha a tétel rövid absztraktja vagy tartalomjegyzéke is rendelkezésre áll, még pontosabban tudjuk a kapott találatokat megítélni. Könyvtárak adatbázisai arról is információt adnak, hogy a könyv vagy cikk hol található, illetve kölcsönözhető-e. |
||
A Webes keresőrendszerek változatos formákban közlik a keresések eredményeit, így nehéz általános leírást adni az eredmények értékelésére és interpretálására. Néhány közös szempont azonban megadható: |
||
Tartomány |
|
|
Rangsor |
|
|
Dátum |
|
|
Annotáció |
|
|
Az érdeklődésünkre számot tartó találatok esetén ellenőrizni kell, hogy a talált dokumentum valóban a Webhely előállítójától/fenntartójától származik-e. Ezt legkönnyebben úgy tehetjük meg, hogy megkeressük a talált dokumentum kiinduló honlapját, amire szerencsés esetben közvetlen utalást találunk. („About us”; „About this site”, „Home”; „Home page” és ennek megfelelői a különböző nyelveken.) |
||
A keresés eredményeit különböző módokon rögzíthetjük: kinyomtathatjuk, bemásolhatjuk saját dokumentumunkba, lemezre menthetjük vagy továbbíthatjuk elektronikus levélben. |
||
A megtalált információk nem egyformán értékesek a keresésünk valódi célja szempontjából, ezért további elemzésre van szükség. Különösen fontos ez Web-dokumentumok esetén, mert ezeket legtöbbször senki sem ellenőrzi. |
||
Források |
|
http://www.ala.org/Content/ |
|
http://multiweb.lib.calpoly.edu/ infocomp/modules/index.html |
|
Kiegészítés |
||