╚erven 1997   

   ROMAN V┴N╠   
Vyhledßvacφ slu₧by Internetu
Internet
Mo₧nß jste kouzlu Internetu propadli i vy. V Sφti lze toti₧ najφt informace tΘm∞° o vÜem, co vßs zajφmß. Je nep°ebernou studnicφ znalostφ, zkuÜenostφ, ale takΘ zbyteΦnostφ. Nejv∞tÜφm problΘmem ovÜem z∙stßvß, jak k²₧enΘ informace nalΘzt. Dφky obrovskΘ dynamice r∙stu Internetu a jeho decentralizovanosti dochßzφ k mnoha zm∞nßm ze dne na den, Φi dokonce z hodiny na hodinu. Navφc z principißlnφch d∙vod∙ neexistuje ₧ßdn² seznam nap°. p°ipojen²ch u₧ivatel∙ nebo WWW strßnek. Proto m∙₧e b²t Φlov∞k hledajφcφ na Sφti n∞co konkrΘtnφho Φasto frustrovßn z kvanta zbyteΦnΘho balastu, kter²m se musφ prokousat. NaÜt∞stφ existujφ v Internetu specializovanΘ slu₧by, kterΘ si kladou za cφl odpovφdat u₧ivatel∙m na jejich dotazy, co kde hledat. A prßv∞ o nich je tento Φlßnek.

Vyhledßvacφ stroje fungujφ bu∩ p°i univerzitßch coby nßstroj v∞dy a v²zkumu, nebo se jednß o servery komerΦnφch organizacφ. Financovßnφ komerΦnφch server∙ se provßdφ bu∩ platbou za vyhledßvacφ slu₧by, nebo komerΦnφ organizace zφskßvß finanΦnφ prost°edky za reklamu umφst∞nou na sv²ch strßnkßch. Vyhledßvacφ stroje jsou stßle dokonalejÜφ. P∙vodn∞ vyhledßvaly jen pomocφ jednoduch²ch booleovsk²ch funkcφ, dnes ji₧ mnohΘ disponujφ enginy s fuzzy logikou a m∞°enφm relevance vyhledan²ch informacφ. Slu₧by lze rozd∞lit do n∞kolika kategoriφ:

* katalogizaΦnφ slu₧by poskytujφ ucelen² strom tΘmat, kter²m lze prochßzet. Je to strukturovanß a podle subjektu organizovanß hierarchie kategoriφ informacφ. Subjekt jednotliv²ch p°φsp∞vk∙ stanovφ administrßtor slu₧by nebo autor strßnky. N∞kterΘ slu₧by disponujφ rovn∞₧ indexy klφΦov²ch slov -- pak lze tΘ₧ polo₧it dotaz. Slu₧by se dßle liÜφ n∞kolika charakteristikami:

-- velkΘ katalogy s minimßlnφmi restrikcemi za°azovßnφ zdroj∙ (nap°. Yahoo, Galaxy, WWW Virtual Library)

-- slu₧by se z°etelnou hodnotou nov²ch p°φsp∞vk∙ vΦetn∞ komentß°∙ a hodnocenφ odbornφk∙ (nap°. GNN's Whole Internet Catalogue, Magellan, Point)

-- specializovanΘ katalogy (nap°. ArchNet -- archeologie)

* search engines zpracovßvajφ u₧ivatelskΘ dotazy formou hledßnφ slova Φi frßze. Obsahujφ automaticky p°idßvanΘ informace do index∙ (pomocφ robot∙ a spider∙). JednotlivΘ slu₧by se liÜφ velikostφ index∙, periodicitou obnovy dat, rychlostφ dodßnφ odpov∞di na dotaz a jeho prezentacφ (anotace, velikosti nalezen²ch stran atd.), mo₧nostmi hledßnφ (search options), relevancφ v²sledk∙ a snadnostφ obsluhy.

* metasearch engines (p°ijφmajφ u₧ivatelsk² dotaz a rozesφlajφ jej na vφce vyhledßvacφch stroj∙). OznaΦujφ se taky jako Multi-threaded search engines.

* interface slu₧by (poskytujφ jednotn² interface mezi u₧ivatelem a n∞kter²mi vybran²mi vyhledßvacφmi stroji. Tyto servery samy nic nevyhledßvajφ; prost°ednictvφm jednotnΘho formulß°e u₧ivatel zadßvß dotaz a vybφrß si, na kter² server bude dotaz poslßn)

* seznamy obsahujφcφ listing tematick²ch oblastφ, jimi₧ se p°φsp∞vky zab²vajφ.

* vlastnφ vyhledßvacφ slu₧by organizacφ (vyhledßvßnφ zdroj∙ intern∞ v urΦitΘ organizaci).

* jinΘ vyhledßvacφ slu₧by (mapy apod.).

Vyhledßvacφ stroje pracujφ s databßzφ zdroj∙, kterou p°i dotazu prohledßvajφ. Tato databßze m∙₧e b²t tvo°ena ruΦn∞ sprßvou serveru (nap°. YAHOO), nebo m∙₧e b²t generovßna algoritmicky (nap°. LYCOS). Server∙ existuje velkΘ mno₧stvφ a jejich databßze b²vajφ specifickΘ pro ka₧d² server. Proto mohu v°ele doporuΦit: pokud na prvnφm serveru nenajdete po₧adovanΘ informace, obra¥te se na jin². Pro prvnφ "nßst°el" b²vß Φasto vhodnΘ pou₧φt n∞kter² metasearch engine nebo katalog (aby si hledajφcφ uv∞domil, co vlastn∞ hledß a jakΘ termφny k hledßnφ pou₧φt). Vzhledem k dynamickΘmu r∙stu a zm∞nßm v Internetu se taky m∙₧e stßt, ₧e odkaz nalezen² vyhledßvacφ slu₧bou ji₧ neexistuje. V nßsledujφcφch °ßdkßch mo₧nß naleznete inspiraci kam se podφvat, hledßte-li odpov∞di na svΘ vÜeteΦnΘ dotazy.


KatalogizaΦnφ slu₧by (prochßzenφ katalogu)

SEZNAM ΦeskΘho Internetu
http://www.seznam.cz

Prochßzenφ seznamu podle kategoriφ nebo vyhledßvßnφ: jednoduchΘ (slova spojena OR), nebo vyhledßvacφ centrßla (pokroΦilejÜφ funkce, volby OR, AND, citlivost na velkß/malß pφsmena).

╚esk² nßrodnφ navigßtor
http://www.uzdroje.cz

Umo₧≥uje prohledßvat strom tΘmat, nebo zadat dotaz k vyhledßnφ urΦitΘho termφnu. Termφn m∙₧e b²t hledßn na serveru U zdroje, slu₧bou Borec (odezvou je seznam URL adres bez dalÜφch popisk∙), slu₧bou Pavouk (seznam URL s popisky) nebo jej lze hledat v pra₧skΘ sφti. Strom tΘmat (katalog) obsahuje 10 zßkladnφch polo₧ek, kterΘ se dßle d∞lφ do subkategoriφ. Neobsahuje sice p°φliÜ mnoho odkaz∙, zato komunikuje s u₧ivatelem v ΦeÜtin∞ a spojenφ i vyhledßvßnφ je velmi rychlΘ.

Atlas
http://www.atlas.cz

NejmladÜφ katalogizaΦnφ (strom tΘmat) a vyhledßvacφ (jednoduchΘ i slo₧it∞jÜφ dotazy) slu₧ba, poskytujφcφ orientaci v domΘn∞ cz. Umφ tΘ₧ hledat osoby, podporuje diskuse a komunikaci v reßlnΘm Φase.

Yahoo
http://www.yahoo.com/

Databßze odkaz∙ na jinΘ WWW strßnky a servery, kterou lze prohlφ₧et (browse) nebo prohledßvat (search). Hlavnφ menu je rozd∞leno do n∞kolika oblastφ, za ka₧d²m nßzvem oblasti nßsleduje v zßvorce poΦet link∙, kterΘ se tΘto oblasti t²kajφ. Tyto linky jsou rozd∞leny do dalÜφch n∞kolika ·rovnφ a pod·rovnφ.

Internet Sleuth
http://www.isleuth.com

Prochßzenφ stromu kategoriφ + mo₧nost hledat klφΦovΘ slovo. Obsahuje na 750 prohledßvateln²ch databßzφ. Spojenφ nenφ nejrychlejÜφ, zato v²b∞r tΘmat a databßzφ stojφ za vyzkouÜenφ. M∙₧ete dokonce zadat dobu, jakou jste ochotni na v²sledky hledßnφ Φekat.

EINet Galaxy
http://galaxy.einet.net/galaxy.html

Jeden z v∙bec prvnφch a nejv∞tÜφch katalog∙ (strom∙). Dob°e organizovan² a snadno browsovateln² katalog tΘmat, kter² je sestavovßn ruΦn∞ administrßtory. Pohodln² interface umo₧≥uje hledat pomocφ jednoduchΘ i "advanced" vyhledßvacφ funkce.

Search engines (hledßnφ klφΦov²ch slov)

Alta Vista
http://altavista.digital.com/
http://www.altavista.com

Prohledßvßnφ WWW strßnek a skupin Usenetu (max. 14 dnφ starΘ p°φsp∞vky). Informace mo₧no dostat ve t°ech formulß°φch (standard, compact, detailed). V dotazu je mo₧nΘ pou₧φvat hv∞zdiΦkovΘ konvence (SUPER!), dotaz lze polo₧it jako jednoduch² (Simple query) -- hledß jeden termφn, nebo jako Advanced (AND, OR, NOT, NEAR, set°φd∞nφ dle vyhledan²ch termφn∙, aktußlnost). Slu₧bu mo₧no najφt tΘ₧ na jin²ch adresßch po celΘm sv∞t∞.

Lycos
http://www.lycos.com

Databßze link∙ se tvo°φ automaticky pomocφ sb∞raΦsk²ch program∙. Je mo₧nΘ prohledßvat Web, hledat zvuk, obrßzky, subjekt, Newsy, lidi, m∞sta a automapy. Je mo₧nΘ hledat jen jedno klφΦovΘ slovo, co₧ pova₧uji za nev²hodu (pak musφte prochßzet velkΘ mno₧stvφ vyhledan²ch p°φsp∞vk∙).

InfoSeek
http://www.infoseek.com/

InfoSeek vznikl n∞kdy v druhΘ polovin∞ roku 1994, a hned od zaΦßtku byl rozd∞len na dv∞ slu₧by: placenou (InfoSeek Professional) a bezplatnou (InfoSeek Guide). Prvnφ z nich je spφÜe slu₧bou reÜerÜnφ, vhodnou zejmΘna k vyhledßvßnφ odborn²ch Φlßnk∙. Bezplatnß Φßst InfoSeeku nabφzφ mo₧nost vyhledßvat v rßmci WWW strßnek, diskusnφch skupin Usenetu a v rßmci dokument∙ FAQ (Usenet). DostupnΘ informace lze prochßzet ve stromu tΘmat (katalogizovßno) nebo lze zadat dotaz.

WebCrawler
http://webcrawler.com/

Vyhledßvacφ stroj s v²born²m designem sv²ch strßnek a jeÜt∞ lepÜφm katalogem. Informace lze bu∩ vyhledßvat (jen jeden termφn), nebo prochßzet katalogem (browse). V²sledky dotazu mo₧no nechat zobrazit jen jako titulky nalezen²ch stran, nebo vΦetn∞ summaries. PoΦet vyhledan²ch p°φsp∞vk∙ lze omezit na 10/25/100.

excite
http://www.excite.com/

Disponuje browserem (20 zßkladnφch kategoriφ) a vyhledßvacφ funkcφ. Krom∞ WWW strßnek najde i mapy, shareware, slovnφky, e-mailovΘ adresy, lidi, zlatΘ strßnky (neboli organizace).

Open Text Index
http://www.opentext.com/omw/f-omw.html

Umφ hledat max. 3 klφΦovß slova, zato kombinovanß operßtory AND, OR, NOT (zde se zove BUT NOT), NEAR a dokonce FOLLOWED BY. Pro hledanß klφΦovß slova lze specifikovat oblast jejich v²skytu v dokumentech (anywhere, summary, title, first heading, URL...) -- co₧ m∙₧e (ale nemusφ!) b²t p°φnosem. Na serveru je taky sekce search tips, kterß poradφ, jak polo₧it dotaz, aby byly v²sledky co nejlepÜφ. V²sledky dotazu zobrazφ vΦetn∞ dalÜφch u₧iteΦn²ch informacφ (relevance score, file size, abstract, links to similar pages).

Inktomi
http://inktomi.berkeley.edu/

Sna₧φ se o co nejrychlejÜφ a nejobsa₧n∞jÜφ vyhledßnφ odpov∞di na dotaz. K tomuto nelehkΘmu cφli pou₧φvß metodu paralelnφho zpracovßnφ (paralel computing). Hledß a₧ deset klφΦov²ch slov. V²sledky ohodnotφ dle relevance a set°φdφ je. V dob∞ psanφ tohoto textu nebylo v lidsk²ch silßch se k serveru p°ipojit.

DejaNews
http://www.dejanews.com/

Slu₧ba usnad≥uje orientaci v Newsech. Umo₧≥uje dokonce Φφst a posφlat p°φsp∞vky do Usenetu, disponuje browserem (prochßzenφ katalogu informacφ). Udr₧uje informace i daleko zp∞t do historie.

Metasearch engines (hledßnφ klφΦov²ch slov na vφce strojφch)

SavvySearch
http://www.cs.colostate.edu/~dreiling/smartform.html

Umo₧≥uje polo₧it jedin² dotaz vφce stroj∙m souΦasn∞. SavvySearch od vßs p°ijme dotaz, rozeÜle jej na n∞kolik dalÜφch stroj∙, vyzvedne od nich odpov∞di, kterΘ sestavφ do jedinΘho celku a poÜle tazateli. Spolupracuje s celkem 23 stroji. Na zßklad∞ n∞kolika kritΘriφ sestavφ vyhledßvacφ plßn: rozd∞lφ obhospoda°ovanΘ slu₧by do n∞kolika skupin a polo₧φ dotaz prvnφ (tedy nejvhodn∞jÜφ) skupin∞ stroj∙. U₧ivatel pak m∙₧e zadat dotaz i dalÜφm jejich skupinßm. S u₧ivatelem komunikuje v n∞kolika jazycφch (i Φesky!).

MetaCrawler
http://metacrawler.cs.washington.edu:8080/index.html

Jednou polo₧en² dotaz MetaCrawleru je p°edlo₧en n∞kolika vyhledßvacφm stroj∙m, duplicity v odpov∞dφch jsou eliminovßny. Dobu hledßnφ lze omezit Φasov∞ (na 1--10 minut), geograficky Φi druhem server∙ (komerΦnφ, vojenskΘ, akademickΘ).

Interface slu₧by (jednotnΘ rozhranφ pro vφce vyhledßvacφch stroj∙)

CUSI
http://sunsite.mff.cuni.cz/search/cusi.html

Nenφ vlastn∞ vyhledßvacφ slu₧bou, jen jak²msi "deÜtnφkem" zast°eÜujφcφm n∞kolik vyhledßvacφch stroj∙. Sna₧φ se b²t jedin²m interfacem mezi u₧ivatelem a vyhledßvacφmi stroji. Je to inteligentnφ seznam vyhledßvacφch stroj∙, kter² dokß₧e zprost°edkovat polo₧enφ dotazu libovolnΘmu stroji, kter² si u₧ivatel vybere ze seznamu. CUSI nic nevyhledßvß, starß se jen o doruΦenφ dotazu vybranΘmu stroji. Odpov∞∩ na dotaz neprochßzφ, tßzan² stroj odpovφdß p°φmo tazateli.

All-in-One
http://www.albany.net/allinone/

Kompilace n∞kolika form-based (formulß°ov²ch) vyhledßvacφch stroj∙ (search engines).

Seznamy

Yanoff's List
http://www.spectracom.com/islist

Jeden z nejlepÜφch a nejstarÜφch seznam∙ (5 let). Poskytuje p°φstup k FTP archiv∙m, telnetovsk²m uzl∙m a samoz°ejm∞ WWW strßnkßm. Jeho obsah tvo°φ dlouhß strßnka tΘmat a jejich podtΘmat. Velice hezky graficky zpracovßno.

Seznamy CZ_list
http://www.dcit.cz/CZ_list/index.html

Na strßnce firmy DCIT najdete Φty°i seznamy: ₧lut² CZ list obsahuje tematicky °azen² (tedy jak jsme zvyklφ ze zlat²ch strßnek) seznam internetovsk²ch slu₧eb v ╚R, bφl² CZ list obsahuje adresß° firem a organizacφ, modr² CZ list poskytne seznam vÜech poskytovatel∙ Internetu v ╚R. Duhov² CZ list zast°eÜuje vÜechny v²Üe zmφn∞nΘ seznamy, a navφc obsahuje odkazy na dalÜφ seznamy, kterΘ vznikly mimo firmu DCIT.

Zdroje CESNETu
http://www.cesnet.cz/html/cesnet/cesnet-resources.html

P°ehled v∞tÜiny WWW server∙, FTP server∙ a Gopher Server∙, Mirrory, e-maily, Newsy, vyhledßvßnφ u₧ivatel∙ v CESNETu vΦetn∞ dopl≥kov²ch informacφ (nap°. anonymnφ loginy a hesla na FTP servery)

Vlastnφ vyhledßvacφ slu₧by organizacφ

Hledßnφ osob na Karlov∞ univerzit∞
http://www.cuni.cz/cucc/whois/whoisdotazCS.html

Hledßnφ e-mailov²ch adres na VèE
http://www.vse.cz/hledej.html

Hledßnφ lidφ na VUT v Brn∞
http://www.fee.vutbr.cz/info/CSO/cso.html.cz.Windows-1250

JinΘ vyhledßvacφ slu₧by

Veronica
gopher://veronica.vslib.cz:2347/7

Prohledßvß menu gopherovsk²ch server∙.

CityNet
http://city.net/regions/

Informace o stßtech, fotografie pamßtek, m∞st, v²znamn²ch mφst, historie...

Nosey Parker
gopher://parker.vslib.cz:1996/1

Prohledßvßnφ obsah∙ anonymnφch FTP server∙ v ╚R.

Netfind
gopher://netfind.vslib.cz:4320/1netfind

Vyhledßvßnφ e-mailov²ch adres.

DalÜφ slu₧by
gopher://gopher.vslib.cz:70/11/.gopherinfo/gateways

Na tΘto adrese najdete p°φstupovΘ body k dalÜφm u₧iteΦn²m slu₧bßm, jako nap°. X-500, Wais, WhoIs a n∞kter²m dalÜφm.


PC WORLD 06/97