TOPlist Counter
TitulPage


Nový osobní rozcestník PeKo WEB Centrum 2000 IkonaWWW IkonaRoboti IkonaCCE
Poslední aktualizace: 16. ledna 2004
IkonaXenu
Tvoříte vlastní WWW stránky ? a hledáte, podobně jako i já, různé způsoby jak dát o sobě vědět? Víte jak fungují vyhledávače - roboti, seznamy a indexy na Webu? Na této stránce Vám nabízím své zkušenosti s mnoha světovými i českými, fulltextovými vyhledávači, dozvíte se jak vytvořit vlastní index své stránky a jak a kam své stránky nabídnout k zařazení.

Jak a kam stránky zaregistrovat?
Přehled více než 210 serverů převážně českého internetu, servery, kde lze své stránky zaregistrovat, Vám nabízí stránka Kam umístít stránky na WWW s uvedením vlastních zkušeností a odezvy správců při registraci WWW stránek.

Sova v síti
E-zine pro webmastery informuje o aktuálních změnách této WWW stránky Bezplatné zasílání tohoto E-zine si můžete zaregistrovat zde:
Vaše emailová adresa:
Hledáte pomoc, jak HTML nebo DHTML dokumenty vytvářet, jak zdokonalit svoji grafiku, jak stránky validizovat, kde získat prostor pro umístění stránek a konečně kam je můžete nabídnout? Následující odkazy Vám pomohou.

Na stránce HTML a DHTML Help Vám nabízím více než 110 odkazů na WWW zdroje, které sám při tvorbě WWW stránek používám, HTML manuály, příručky, zdroje grafiky pro WEB, animované GIFy, a pod. Mezi odkazy je i přehledná tabulka barev s RGB kódem pro použití v HTML dokumentech, kterou velmi často používám. Na Webu lze rovněž nalézt dokumentaci a software pro kontrolu správnosti HTML dokumentů - validizaci.

A konečně několik příkladů - přehled WWW stránek, které jsem vytvořil - Vám nabízí můj osobní rozcestník PeKoWeb centrum 2000.


Roboti a pavouci na WEBu
Co jsou WWW roboti? Roboti jsou programy, které automaticky procházejí hypertextovou strukturu WEBu, vyhledávají a načítají dokumenty, a všechny další dokumenty, na které existují hypertextové odkazy - linky. Označení Spiders - pavouci mají tito roboti proto, že prolézají WWW pavučinu - web (World Wide Web), některé z těchto automatů, robotů označujeme termínem WebCrawlers, což lze přeložit jako specifický, plazivý robot. Pro podrobnější informace týkající se WEB robotů nabízím následující (anglicky) internetový zdroj: How Search Engines Work

Web se však stále rozrůstá, informací přibývá a pavouci to nestíhají. Dovoluji si zde odcitovat závěry, které byly zveřejněny na stránce 800 milionů stránek - nyní dokument nedostupný.

Dnešní Web představuje na 15 terrabajtů informací - na 800 milionů stránek, 180 milionů obrázků. Den co den se objevuje na 3 miliony nových stránek. Některé části Webu se indexují dobře, většina špatně a mnohé vůbec.
Výsledkem je, že indexovací vyhledávací stroje dosahují odhadem na stěží 16% světového WWW ! V roce 1998 přitom šlo o 34%.
Nejlépe na tom je vyhledavač Northern Light dosahující na 16% Webu, Altavista těsně následuje s 15.5% (0.5% rozdíl je ovšem spíš statistická chyba). Následuje Microsoft (8.5%), Yahoo (7.4%), Excite (5.6%) a Lycos (2.5%) - pokud tedy něco hledáte, máte k dispozici kompletní sadu nejlépe vybavených indexačních strojů.
Nakolik se indexy jednotlivých indexátorů překrývají či nikoliv zůstává ovšem otázkou - v extrémně příznivém případě mohou výše zmíněné indexátory dohromady obsáhnout maximálně polovinu Webu - druhá polovina zůstává neviděna a nenalezitelná.
Ani v českém prostředí na tom nejsme nijak dobře - indexátor Seznamu má omezenu databázi na 2GB a indexuje několikaprocentní zlomek českého Internetu - pokud indexuje vůbec (zpravidla se k indexování dostane stěží jednou za rok). Indexátor Atlasu je na tom sice o trochu lépe, ale ani tady to není tak dobré, jak by uživatelé potřebovali.
pozn.citovaná stránka z Webu nemá uvedené žádné datum, údaje, které autor uvádí, a které já pouze cituji, je nutno považovat za ilustrativní, orientační informace, platné ke dni, kdy byl tento text zveřejněn - toto datum známo neni.



Následující tabulka sumarizuje mé osobní zkušenosti se 17 světovými vyhledávači - indexy. Jako příklad je použito vyhledání mého jména. Uvedené počty jsou získány dne 23.dubna / 13.července / 14. října 2000 / 27.března / 13. srpna / 15.prosince 2001 / 17.března / 13. června / 7. října / 9. prosince 2002 / 24. května / 16. října 2003 a datum aktualizace, resp. nejnovějšího záznamu - pokud služba tato data poskytuje, mají relativní, ilustrativní význam, nikoliv absolutní. Počet nalezených záznamů se liší i podle aktuálního nastavení hledací služby, např. omezením počtu zobrazených stránek apod. Velmi dobré výsledky nabízel Northern Light, který navíc vytvářel k nalezenému souboru index klíčových slov a stromovou strukturu odkazů podle jednotlivých lokalizací - sitů, bohužel index již WWW stránky nezahrnuje. Novinkou je vyhledávací stroj MonkeySweat a z tzv. metasearch vyhledávačů je velmi výkonným MultiMeta, který kombinuje vyhledávání v indexech Acoon, Altavista, Voila, Excite, HotBot, Lycos, MSN, Infoseek a Yahoo.
pozn. Slovenský fulltextový index Zoznam.sk je uveden mezi českými, pro srovnání s českým Seznam.cz.

Indexy generované roboty ve světě
serverpříklad hledánípočet stránekpoznámky
MonkeySweat hledej button940/1055/731/714/1093/1525/1234/1853/208/286 využíval službyAllTheWeb, nyní index jiný, nefungují nastavení
Fast Search
AllTheWeb
hledej button555/553/931/1055/731/714/1125/2975/1829/2679 /2642/2937
Lycos Searchhledej button555/553/572/1055/863/714/1116/3191/1821/2679/2642/7692 jeden z mála má datum aktualizace, 26/9/2003, zobrazí jen 1000 záznamů
Googlehledej button265/313/567/1100/932/1310/1560/1260/1900/2360/2240/1980
HotBothledej button43/95/85/125/148/156/120/155/700/224/515/748 zobrazuje META TAGy, jeden z mála má datum aktualizace, 11/9/2003
Northern Lighthledej button225/337/535/579/545/589/xindex WWW stránek zmizel
AltaVista Searchhledej button204/359/297/423/371/442/996/1074/984/2484 /2909/2626 zobrazuje META TAGy
Web Zonehledej button65/40/79/245/246/xpozději WebTop, již zrušen
MSN Searchhledej button106/145/157/181/259/246/240/259/937/1090/938/691 zobrazuje META TAGy
Netscape Searchhledej button265/314/140/96/65/76/75/1230/1500/1660/2150/410 změna search.engine
WebCheckhledej button121/134/xzobrazuje META TAGy zrušen
AOL Searchhledej button46/50/51/58/61/176/186/205/1500/1660/417/77 zobrazuje META TAGy
Yahoohledej button44/18/49/99/198/224/757/352/1740 /2370/2200/1440 NEzobrazuje META TAGy
PositionTechhledej button553/576 zobrazuje META TAGy, datum aktualizace 11/9/2003
InfoSeek Gohledej button34/31/36/17/45/50/47/51/183/47/70/240 služba Overture
Excitehledej button24/3 angl./18/21/14/16/58/40/50 /51/56/49 zobrazuje META TAGy
GoTo Searchhledej button19/25/34/16/45/50/47/51/183/47/70/x služba Overture, zobrazuje META TAGy, zmizel
Teoma/Direct Hithledej button11/13/13/10/0/0/8/46/46/55 /69/203 změna search.engine

Jak o sobě dát vědět.
Existují dva základní principy, jak zviditelnit své stránky na internetu. Jednodušší je počkat, až některý z fulltextových vyhledávačů stránky objeví a do svého indexu zařadí. Roboti, spiders a webcrawlers stránky publikované na WWW navštěvují, indexují a jejich nalezení usnadňují. Mají však omezené kapacity, interval aktualizace je také různý a liší se především v tom, jak nalezené stránky prezentují. Druhou variantou je aktivně své stránky nabídnout do českých i světových adresářových služeb - seznamů. Osobní zkušenosti s téměř 100 takových serverů naleznete na stránce Kam umístít stránky na WWW .

Vyhledávací servery mnohdy kombinují obě varianty, mají svůj vlastní index a také adresářovou službu, kam je možno aktivně stránky nabídnout. V každém případě Vám doporučuji používat tzv. META TAGy - popisné údaje v hlavičce každého, jednotlivého HTML dokumentu. V těchto popisných položkách a v názvu - titulu dokumentu nepoužívat češtinu, resp. psát alespoň bez diakritiky. Některé indexy zobrazí nalezené stránky jako TITUL + META deskriptory (pokud je naleznou), pokud ne tak zobrazí např. prvních 250 znaků HTML dokumentu. Jak to může dopadnout je vidět na následujících příkladech:

Ukázky zobrazení česky definovaných stránek
HTML dokument v češtině, Titulek + META TAG anglicky
 
HTML dokument i Titulek stránky v češtině bez META TAGu
 
HTML dokument i Titulek stránky v češtině, server nezobrazuje META TAGy



Fulltextové vyhledávání v českém internetu.
Indexovací - fulltextové vyhledávací služby mají servery Seznam, Atlas, Kompas, Centrum CZ, Katedrála, Megatext a Najdi To. I zde uvádím své osobní zkušenosti s vyhledáním svého jména pomocí fultextových hledačů na českých serverech - údaje platné ke dni 23.dubna / 13.července / 14. října 2000 / 27.března / 13.srpna / 15.prosince 2001 / 17.března / 13. června / 7. října / 9. prosince 2002 / 24. května / 16. října 2003, mají rovněž - jak je uvedeno u světových vyhledávačů - pouze relativní, ilustrativní význam, nikoliv absolutní. Z českých indexových vyhledávačů doporučuji jako nejlepší službu - server Centrum CZ a MSN Atlas , velmi zajímavou službou byl metasearch Archon (již neexistuje), který kombinoval výsledky fulltextových hledačů Centrum, AltaVista CZ, AllTheWeb a Google pro české stránky, a hledání v českých seznamech - Quick, NajdiTo, Centrum, Seznam a RedBox, hledání v seznamech lidí a další varianty, ze světových indexů prohledával Infoseek, AllTheWeb, AltaVista, Google, Excite, HotbotText a Inktomi. Velmi výkonný hledací nástroj je integrován také do portálu WorldOnLine, nejnovější a velmi výkonným fultextem je Empyreum, který je používán jako fulltext v portálu iDnes, mezi nové české indexy patří i Morfeo (dříve webFast) - služba Centrum.Cz a WebSeek. Pro srovnání fulltextového indexu Seznam.cz, je zde uveden i jeden zahraniční, mnohem výkonnější - slovenský fulltextový index Zoznam.sk.

Indexy generované roboty českého internetu
serverpříklad hledánípočet stránekpoznámky
Jyxohledej button1450/1551/1342 zařazen nově 8.ledna 2003, kategorizace zdrojů
WebSeekhledej button2418/1567/1230/1117/1161/1161/1161 počet výskytů slova, na 441 stránkách, ve 114 zdrojích, 158 dokumentů
Empyreumhledej button1160/898/x zobrazuje META tagy, fulltextová služba zrušena
WorldOnLine, Tiscalihledej button695/730/714/702/2027/1821/1890/2643/7693 Janas search engine, nezobrazuje META TAGy, zobraziletné /1935
Centrum - Morfeohledej button117/103/289/515/836/1266/1595/1151/938/957/945/797 nezobrazuje META TAGy, změna fulltextu na Morfeo - dříve WebFast
MSN Atlas - Jyxo hledej button434/297/300/300/300/875/1482/201/201/201/1664/1413 NEzobrazuje již META TAGy, fulltext - Jyxo
Megatext CZhledej button117/114/173/242/211/191/166/x nezobrazuje META TAGy, zrušen
Archon hledej button582/259/1457/316/1579/464/342/x kombinuje Centrum, Atlas, AltaVista a další, zrušen
Seznam - Googlehledej button62/175/221/120/148/148/1127/1033/1231/1620/2230/1180 nezobrazuje META TAGy, engine Google
Zoznam.skhledej button702/1127/2983/1848/2683/2230/1190 na rozdíl od Seznamu zobrazoval META TAGy, nyní také Google
Kompashledej button62/175/221/120/148/xshodné výsledky jako Seznam, zrušen
Katedrálahledej button43/43/43/9/90/90/90/-/80/88/88/88 další odkazy zanořené dle URL, nezobrazuje META TAGy
Sherlockhledej button43/43/43/xnezobrazuje META TAGy, zrušen
NajdiTohledej button17/17/17/17/211/xnezobrazuje META TAGy, MegaText, fulltext zrušen

Fulltextové vyhledávání na Vašich vlastních stránkách.
Umožněte vyhledávání i na vlastní WWW stránce. Toto fulltextové hledání je založeno na detailním indexu, který zdarma nabízí server Atomz.com.. Jak takový index funguje si můžete ověřit na dvou příkladech, které mám pomocí této služby registrovány.




Pokud máte zkušenosti jiné, znáte další zajímavý zdroj k výše uvedené problematice, který neuvádím, budu Vám za Vaše komentáře vděčen. Můžete použít formuláře na konci této stránky.


Vaše připomínky, komentář či polemiku můžete napsat přímo ZDE:



Váš e-mail nebo adresa:



Tato stránka je zařazena na následující české WWW servery:

Ikona Seznam Ikona Top Ikona Navrcholu IkonaPrima IkonaZacatek IkonaSister IkonaCentrum IkonaOpenDir IkonaWebCz IkonaShaana IkonaZdroj IkonaWWWCentrala IkonaKomplikator IkonaKatedrála IkonaHappyWeb IkonaNajdiTo Ikona Vokno Ikona Atlas IkonaMabelia IkonaBirdzSk IkonaSurfSK Ikona Woko hlídá za Vás

a je umístěna na serveru 1.Lékařské fakulty UK, připojení prostřednictvím - IkonaCesnet IkonaICRA


IkonaMail Počet přístupů na tuto stránku od 23. dubna 2000: Counter, statistika přístupů, služba TOP:TOPlist - statistiky resp. NaVrcholu Statistiky těchto stránek.
IkonaGastoLab
WebMaster: Petr Kocna - kocna@mbox.cesnet.cz
HomePage: orientovaná lékařsky na 1.LF UK nebo orientovaná církevně a teologicky