Cizφ vyhledßvaΦ pro moje strßnky - Google - Jyxo - Atomz - A dal╣φ - Vlastnφ °e╣enφ vyhledßvßnφ
Mo╛nosti, jak prohledßvat vlastnφ strßnky:
Jak to funguje:
Mo╛nß to vysv∞tluju moc slo╛it∞. Lep╣φ budou p°φklady. Ukß╛u, jak pro prohledßvßnφ vlastnφch strßnek nasadit Google, Jyxo nebo Atomz, co╛ jsou varianty, kterΘ se b∞╛n∞ vφdajφ. Pravd∞podobn∞ by se daly vyu╛φt i jinΘ vyhledßvaΦe, ale je╣t∞ nikde jsem to nevid∞l, tak╛e to asi nebude tak v²hodnΘ.
Prohledßvat vlastnφ strßnky pomocφ Google se dß v tom p°φpad∞, ╛e strßnky zapl≥ujφ celou domΘnu. Mßm-li nap°φklad adresu strßnek www.sweb.cz/yuhu/, tak ty Googlem prohledßvat nem∙╛u, proto╛e by mi prohledßval cel² www.sweb.cz a ne jenom to /yuhu/. (Sice na Google pφ╣ou, ╛e °e╣enφ tohohle problΘmu se mß hledat ve FAQ, ale nic tam nenφ. V takovΘm p°φpad∞ je nutno nasadit Atomz.) Aby Google n∞co na m²ch strßnkßch na╣el, musejφ ty strßnky b²t takΘ tro╣ku star╣φ a musejφ na n∞ vΘst odkazy z n∞jak²ch d∙le╛it²ch strßnek, aby je Google v∙bec znal.
┌pln∞ nejjednodu╣╣φ je ud∞lat prost∞ parazitnφ formulß° googlovskΘho pokroΦilΘho hledßnφ, nap°φklad z tohoto dotazu:
http://www.google.com/search?as_q=pokus&as_sitesearch=jakpsatweb.cz&num=10
HTML k≤d formulß°e:
<form action="http://www.google.com/search" target="_blank">
<input type="text" name="as_q" size=20>
<input type="hidden" name="as_sitesearch" value="jakpsatweb.cz">
<input type="hidden" name="num" value="10">
<input type="submit" value="Vyhledat">
</form>
Bude se hledat na serveru jakpsatweb.cz. Vyhledßvßnφ na tomto serveru Googlem:
Kdy╛ si zm∞nφte adresu, bude to prohledßvat jin² server.
P°edchozφ p°φklad vracel v²sledky v normßlnφm designu Google, modro-bφlΘ. Dß se za°φdit, aby to Google vracel v barvßch, kterΘ si navolφte. D∞lß se to na strßnce V╣e o Google > Search solutions > Free search > Sign me up for free search. Je pot°eba zadat svojφ domΘnu a navolit barvy (jdou p°φpadn∞ zm∞nit pozd∞ji). Do v²sledk∙ se dß p°idat i vlastnφ logo. Google vzßp∞tφ poskytne k≤d formulß°e (hodn∞ prasßckej), kter² se po prost∞ vlo╛φ do strßnky, ale je lep╣φ ho vyΦistit na n∞co takovΘho:
<form action="http://www.google.com/custom">
<input type="text" name="q" size="31">
<input type="submit" value="Vyhledat Googlem na tomto webu">
<input type="hidden" name="cof" value="GIMP:#666666;T:black;LW:131;ALC:red;
<input type="hidden" name="domains" value="jakpsatweb.cz">
<input type="hidden" name="sitesearch" value="jakpsatweb.cz">
</form>
Ten ╣φlen² °ßdek name="cof" s tφm mo°em parametr∙ je pravd∞podobn∞ nastavenφ
barev v²sledku. Nehrßl jsem si s tφm, tak╛e si nejsem jist². Kdesi jsem se
doΦetl, ╛e lze uvΘst k≤dovßnφ strßnky s fomulß°em, aby to memrvilo Φe╣tinu
v²sledk∙: <input type="hidden" name="ie" value="ISO-8859-2">
V²hodou hledßnφ pomocφ Google je zejmΘna to, ╛e °adφ v²sledky podle velmi propracovan²ch algoritm∙ (narozdφl od Atomz). TakΘ Φast∞ji indexuje strßnky, kterΘ se Φasto m∞nφ. Vφce o Google.
Jyxo je asi nejlep╣φ Φesk² vyhledßvaΦ (psßno 2003). Stejn∞ jako Google umo╛≥uje omezit hledßnφ na domΘnu. D∞lß to pomocφ parametru d, kter² p°idßvß do svΘho dotazu. Nap°φklad pro jakpsatweb.cz je dotaz pro hledßnφ slova "pokus":
http://jyxo.cz/search.php?s=pokus&stem=on&d=cz@jakpsatweb.cz
Z toho se dß uplßcat jednoduch² formulß°:
<form action="http://jyxo.cz/search.php" target="_blank">
Zadej dotaz: <input type="text" name="s">
<input type="hidden" name="stem" value="on"><!-- diakritika zapnuta -->
<input type="hidden" name="d" value="cz@jakpsatweb.cz">
<input type="submit" value="Jyxo hledß na tomto serveru">
</form>
Tak╛e kdy╛ p°epφ╣ete tu domΘnu na svojφ, tak by to m∞lo fungovat. Na adrese http://jyxo.cz/doc.php?d=free se dß najφt trochu hezΦφ verze formulß°e. Nevφm, zda se pomocφ Jyxo dß prohledßvat i strßnka, kterß mß v cest∞ lomφtko a adresß°, to jsem nezkou╣el. Vlastnφ barvy a vzhled zatφm do Jyxa zapracovat nejde, ale v╣iml jsem si, ╛e kdy╛ se napφ╣e parametr look=sova, tak se v zßhlavφ hledßnφ objevφ logo Sovy v sφti. Asi se tak Marek Prokop domluvil s autorem Jyxa Michalem Illichem.
Jyxo p°i hledßnφ bere ohled na tvar Φesk²ch slov. To je zejmΘna u v∞t╣φch strßnek s mnoha texty rozhodujφcφ v²hoda. Jyxo mß podle m²ch pozorovßnφ v Φesk²ch strßnkßch v∞t╣φ index ne╛ Google, tak╛e je dobr² pro ty strßnky, kterΘ Google zatφm ignoruje.
Na serveru Atomz.com se lze zaregistrovat do trial programu, co╛ je zdarma. Atomz potom prohledßvß moje strßnky. Mß to spoustu v²hod:
A nev²hody:
P°φklad formulß°e, kter² hledß na t∞chto strßnkßch:
<form action="http://search.atomz.com/search" target="_blank">
<input type="hidden" value="00062d0d-sp00000000"
name="sp-a">
<input type="hidden" value="0" name="sp-advanced">
<input type="hidden" value="1" name="sp-w-control">
<input type="hidden" name="sp-k">
<p>Hledßnφ:<br>
<input class="text" name="sp-q" size="20">
<input class="submit" type="submit" value="hledej Atomzem"> </p>
</form>
Ten °et∞zec 00062d0d-sp00000000 je unikßtnφ pro mou registraci (Atomz vφ, ╛e pat°φ k m²m strßnkßm). P°i registraci dostanete sv∙j.
Existujφ i jinΘ servery podobnΘ Atomzu. Moc jich neznßm. Napi╣te mi prosφm svoje zku╣enosti s dal╣φmi podobn²mi slu╛bami.
Karol Bohm-Klein mi doporuΦil slu╛bu freefind.com:
Pro fulltextovΘ prohledßvßnφ sv²ch strßnek pou╛φvßm slu╛bu freefind (www.freefind.com) - je takΘ pln∞ p°izp∙sobitelnß, fulltextovß, indexuje strßnky ka╛d² den (pokud si to nastavφ╣). TakΘ nabφzφ funkΦnφ mapu strßnek (site map), kterß se dß takΘ zcela upravit podle chuti. (DoporuΦil KBK, bylo to slovensky, p°epsal jsem to.)
P°φklad hledßnφ slu╛bou FreeFind.com na tomto webu.
O centrumßckΘ slu╛b∞ www.websearch.cz mi napsal Marek a p°ipojil pßr heslovit²ch vlastnostφ:
Nev²hoda: kdo mß vφce jak 500 strßnek, musφ platit, ale to mß mßlo kdo. V p°φpad∞ slu╛by zdarma cht∞jφ asi formulß° se sv²m designem (lze zredukovat).
Pozn. Yuh∙: Websearch jsem netestoval. S v²jimkou ΦeskΘho rozhranφ mi p°ijde stejn² jako Atomz (leΦ vlastn∞ dra╛╣φ).
Na vlastnφm serveru m∙╛ete nainstalovat n∞jakΘ ji╛ existujφcφ vyhledßvacφ °e╣enφ, n∞jak² hledacφ program. «ßdn² po°ßdn² neznßm, ale jsem si jist, ╛e existujφ a fungujφ. Ka╛d² takov² program mß specifickΘ omezenφ, tak╛e na urΦit² server se dajφ nainstalovat jenom n∞kterß °e╣enφ. Je to dost komplikovanΘ a vφm o tom mßlo.
Vlastnφ hledacφ °e╣enφ doporuΦuji volit jen na uzav°enΘm intranetu. V╣ude jinde se dß nasadit Atomz nebo Google. Jsou firmy, kterΘ se zab²vajφ prohledßvßnφm intranetu.
P°φkladem existujφcφho vyhledßvacφho °e╣enφ (kterΘ uvßdφm, proto╛e jsem to narozdφl od jin²ch vid∞l fungovat), je hledacφ FrontPage komponenta. Kdysi jsem se v tom hrabal. Hodn∞ sprßvc∙ server∙ se to ale bojφ instalovat, proto╛e FrontPage komponenty jsou dost pochybnΘ a potencißln∞ nebezpeΦnΘ. Pak takΘ existujφ komerΦnφ °e╣enφ server∙ se zabudovan²m hledßnφm, je to v∞t╣inou drah² jak svin∞. Nevφm, zda existujφ solidnφ lacinß nebo freewarovß °e╣enφ. Napi╣te mi, prosφm.
Zdatnφ programßto°i si mohou napsat vlastnφ vyhledßvaΦ, t°eba napojen² na databßzi. Ten by m∞l mφt 3 moduly:
Nejjednodu╣╣φ p°edstavitelnß databßze mß t°i tabulky: tabulku slov, tabulku strßnek a tabulku propojenφ, kterß °φkß, zda se slovo ve strßnce vyskytuje. V praxi b²vajφ databßze °ßdov∞ mnohem slo╛it∞j╣φ.
Jin² p°φpad nastßvß, pokud je ve╣ker² obsah serveru generovan² z databßze. Potom nenφ pot°eba psßt crawlera a indexovaΦ, staΦφ trochu lΘpe indexovat data a prohledat databßzi obsah∙. Takhle to b∞╛n∞ d∞lajφ internetovΘ obchody, zpravodajskΘ servery a samoz°ejm∞ portßly.
o tvorb∞, ·dr╛b∞ a zlep╣ovßnφ internetov²ch strßnek