![]() |
![]() |
![]() |
![]() |
![]() ![]() ![]() ![]() |
|
Tvoříte vlastní WWW stránky ?
a hledáte, podobně jako i já, různé způsoby jak dát o sobě vědět? Víte jak fungují vyhledávače - roboti, seznamy a indexy na Webu?
Na této stránce Vám nabízím své zkušenosti s mnoha světovými i českými, fulltextovými vyhledávači, dozvíte se jak vytvořit vlastní index své stránky a jak a kam své stránky nabídnout k zařazení.
Jak a kam stránky zaregistrovat?
|
|
Na stránce HTML a DHTML Help Vám nabízím více než 110 odkazů na WWW zdroje, které sám při tvorbě WWW stránek používám, HTML manuály, příručky, zdroje grafiky pro WEB, animované GIFy, a pod. Mezi odkazy je i přehledná tabulka barev s RGB kódem pro použití v HTML dokumentech, kterou velmi často používám. Na Webu lze rovněž nalézt dokumentaci a software pro kontrolu správnosti HTML dokumentů - validizaci.
A konečně několik příkladů - přehled WWW stránek, které jsem vytvořil - Vám nabízí můj osobní rozcestník PeKoWeb centrum 2000.
Web se však stále rozrůstá, informací přibývá a pavouci to nestíhají. Dovoluji si zde odcitovat závěry, které byly zveřejněny na stránce 800 milionů stránek - nyní dokument nedostupný.
Dnešní Web představuje na 15 terrabajtů informací - na 800 milionů stránek, 180 milionů obrázků. Den co den se objevuje na 3 miliony nových stránek. Některé části Webu se indexují dobře, většina špatně a mnohé vůbec. |
Výsledkem je, že indexovací vyhledávací stroje dosahují odhadem na stěží 16% světového WWW ! V roce 1998 přitom šlo o 34%. |
Nejlépe na tom je vyhledavač Northern Light dosahující na 16% Webu, Altavista těsně následuje s 15.5% (0.5% rozdíl je ovšem spíš statistická chyba). Následuje Microsoft (8.5%), Yahoo (7.4%), Excite (5.6%) a Lycos (2.5%) - pokud tedy něco hledáte, máte k dispozici kompletní sadu nejlépe vybavených indexačních strojů. |
Nakolik se indexy jednotlivých indexátorů překrývají či nikoliv zůstává ovšem otázkou - v extrémně příznivém případě mohou výše zmíněné indexátory dohromady obsáhnout maximálně polovinu Webu - druhá polovina zůstává neviděna a nenalezitelná. |
Ani v českém prostředí na tom nejsme nijak dobře - indexátor Seznamu má omezenu databázi na 2GB a indexuje několikaprocentní zlomek českého Internetu - pokud indexuje vůbec (zpravidla se k indexování dostane stěží jednou za rok). Indexátor Atlasu je na tom sice o trochu lépe, ale ani tady to není tak dobré, jak by uživatelé potřebovali. |
pozn.citovaná stránka z Webu nemá uvedené žádné datum, údaje, které autor uvádí, a které já pouze cituji, je nutno považovat za ilustrativní, orientační informace, platné ke dni, kdy byl tento text zveřejněn - toto datum známo neni. |
Následující tabulka sumarizuje mé osobní zkušenosti se 17 světovými vyhledávači - indexy. Jako příklad je použito vyhledání mého jména. Uvedené počty jsou získány dne 23.dubna / 13.července / 14. října 2000 / 27.března / 13. srpna / 15.prosince 2001 / 17.března / 13. června / 7. října / 9. prosince 2002 / 24. května / 16. října 2003 a datum aktualizace, resp. nejnovějšího záznamu - pokud služba tato data poskytuje, mají relativní, ilustrativní význam, nikoliv absolutní. Počet nalezených záznamů se liší i podle aktuálního nastavení hledací služby, např. omezením počtu zobrazených stránek apod. Velmi dobré výsledky nabízel Northern Light, který navíc vytvářel k nalezenému souboru index klíčových slov a stromovou strukturu odkazů podle jednotlivých lokalizací - sitů, bohužel index již WWW stránky nezahrnuje. Novinkou je vyhledávací stroj MonkeySweat a z tzv. metasearch vyhledávačů je velmi výkonným MultiMeta, který kombinuje vyhledávání v indexech Acoon, Altavista, Voila, Excite, HotBot, Lycos, MSN, Infoseek a Yahoo.
pozn. Slovenský fulltextový index
Zoznam.sk je uveden mezi českými, pro srovnání s českým
Seznam.cz.
server | příklad hledání | počet stránek | poznámky |
MonkeySweat | ![]() | 940/1055/731/714/1093/1525/1234/1853/208/286 | využíval službyAllTheWeb, nyní index jiný, nefungují nastavení |
Fast Search AllTheWeb | ![]() | 555/553/931/1055/731/714/1125/2975/1829/2679 /2642/2937 | |
Lycos Search | ![]() | 555/553/572/1055/863/714/1116/3191/1821/2679/2642/7692 | jeden z mála má datum aktualizace, 26/9/2003, zobrazí jen 1000 záznamů |
![]() | 265/313/567/1100/932/1310/1560/1260/1900/2360/2240/1980 | ||
HotBot | ![]() | 43/95/85/125/148/156/120/155/700/224/515/748 | zobrazuje META TAGy, jeden z mála má datum aktualizace, 11/9/2003 |
Northern Light | ![]() | 225/337/535/579/545/589/x | index WWW stránek zmizel |
AltaVista Search | ![]() | 204/359/297/423/371/442/996/1074/984/2484 /2909/2626 | zobrazuje META TAGy |
Web Zone | ![]() | 65/40/79/245/246/x | později WebTop, již zrušen |
MSN Search | ![]() | 106/145/157/181/259/246/240/259/937/1090/938/691 | zobrazuje META TAGy |
Netscape Search | ![]() | 265/314/140/96/65/76/75/1230/1500/1660/2150/410 | změna search.engine |
WebCheck | ![]() | 121/134/x | zobrazuje META TAGy zrušen |
AOL Search | ![]() | 46/50/51/58/61/176/186/205/1500/1660/417/77 | zobrazuje META TAGy |
Yahoo | ![]() | 44/18/49/99/198/224/757/352/1740 /2370/2200/1440 | NEzobrazuje META TAGy |
PositionTech | ![]() | 553/576 | zobrazuje META TAGy, datum aktualizace 11/9/2003 |
InfoSeek Go | ![]() | 34/31/36/17/45/50/47/51/183/47/70/240 | služba Overture |
Excite | ![]() | 24/3 angl./18/21/14/16/58/40/50 /51/56/49 | zobrazuje META TAGy |
GoTo Search | ![]() | 19/25/34/16/45/50/47/51/183/47/70/x | služba Overture, zobrazuje META TAGy, zmizel |
Teoma/Direct Hit | ![]() | 11/13/13/10/0/0/8/46/46/55 /69/203 | změna search.engine |
Jak o sobě dát vědět.
Existují dva základní principy, jak zviditelnit své stránky na internetu. Jednodušší je počkat, až některý z fulltextových vyhledávačů stránky objeví a do svého indexu zařadí. Roboti, spiders a webcrawlers stránky publikované na WWW navštěvují, indexují a jejich nalezení usnadňují. Mají však omezené kapacity, interval aktualizace je také různý a liší se především v tom, jak nalezené stránky prezentují.
Druhou variantou je aktivně své stránky nabídnout do českých i světových adresářových služeb - seznamů. Osobní zkušenosti s téměř 100 takových serverů naleznete na stránce Kam umístít stránky na WWW .
Vyhledávací servery mnohdy kombinují obě varianty, mají svůj vlastní index a také adresářovou službu, kam je možno aktivně stránky nabídnout. V každém případě Vám doporučuji používat tzv. META TAGy - popisné údaje v hlavičce každého, jednotlivého HTML dokumentu. V těchto popisných položkách a v názvu - titulu dokumentu nepoužívat češtinu, resp. psát alespoň bez diakritiky. Některé indexy zobrazí nalezené stránky jako TITUL + META deskriptory (pokud je naleznou), pokud ne tak zobrazí např. prvních 250 znaků HTML dokumentu. Jak to může dopadnout je vidět na následujících příkladech:
HTML dokument v češtině, Titulek + META TAG anglicky |
![]() |
HTML dokument i Titulek stránky v češtině bez META TAGu |
![]() |
HTML dokument i Titulek stránky v češtině, server nezobrazuje META TAGy |
![]() |
Fulltextové vyhledávání v českém internetu.
Indexovací - fulltextové vyhledávací služby mají servery Seznam, Atlas, Kompas, Centrum CZ, Katedrála, Megatext a Najdi To. I zde uvádím své osobní zkušenosti s vyhledáním svého jména pomocí fultextových hledačů na českých serverech - údaje platné ke dni 23.dubna / 13.července / 14. října 2000 / 27.března / 13.srpna / 15.prosince 2001 / 17.března / 13. června / 7. října / 9. prosince 2002 / 24. května / 16. října 2003, mají rovněž - jak je uvedeno u světových vyhledávačů - pouze relativní, ilustrativní význam, nikoliv absolutní. Z českých indexových vyhledávačů doporučuji jako nejlepší službu - server Centrum CZ a MSN Atlas , velmi zajímavou službou byl metasearch Archon (již neexistuje), který kombinoval výsledky fulltextových hledačů Centrum, AltaVista CZ, AllTheWeb a Google pro české stránky, a hledání v českých seznamech - Quick, NajdiTo, Centrum, Seznam a RedBox, hledání v seznamech lidí a další varianty, ze světových indexů prohledával Infoseek, AllTheWeb, AltaVista, Google, Excite, HotbotText a Inktomi. Velmi výkonný hledací nástroj je integrován také do portálu WorldOnLine, nejnovější a velmi výkonným fultextem je Empyreum, který je používán jako fulltext v portálu iDnes, mezi nové české indexy patří i Morfeo (dříve webFast) - služba Centrum.Cz a WebSeek. Pro srovnání fulltextového indexu
Seznam.cz, je zde uveden i jeden zahraniční, mnohem výkonnější - slovenský fulltextový index Zoznam.sk.
server | příklad hledání | počet stránek | poznámky |
Jyxo | ![]() | 1450/1551/1342 | zařazen nově 8.ledna 2003, kategorizace zdrojů |
WebSeek | ![]() | 2418/1567/1230/1117/1161/1161/1161 | počet výskytů slova, na 441 stránkách, ve 114 zdrojích, 158 dokumentů |
Empyreum | ![]() | 1160/898/x | zobrazuje META tagy, fulltextová služba zrušena |
WorldOnLine, Tiscali | ![]() | 695/730/714/702/2027/1821/1890/2643/7693 | Janas search engine, nezobrazuje META TAGy, zobraziletné /1935 |
Centrum - Morfeo | ![]() | 117/103/289/515/836/1266/1595/1151/938/957/945/797 | nezobrazuje META TAGy, změna fulltextu na Morfeo - dříve WebFast |
MSN Atlas - Jyxo | ![]() | 434/297/300/300/300/875/1482/201/201/201/1664/1413 | NEzobrazuje již META TAGy, fulltext - Jyxo |
Megatext CZ | ![]() | 117/114/173/242/211/191/166/x | nezobrazuje META TAGy, zrušen |
Archon | ![]() | 582/259/1457/316/1579/464/342/x | kombinuje Centrum, Atlas, AltaVista a další, zrušen |
Seznam - Google | ![]() | 62/175/221/120/148/148/1127/1033/1231/1620/2230/1180 | nezobrazuje META TAGy, engine Google |
Zoznam.sk | ![]() | 702/1127/2983/1848/2683/2230/1190 | na rozdíl od Seznamu zobrazoval META TAGy, nyní také Google |
Kompas | ![]() | 62/175/221/120/148/x | shodné výsledky jako Seznam, zrušen |
Katedrála | ![]() | 43/43/43/9/90/90/90/-/80/88/88/88 | další odkazy zanořené dle URL, nezobrazuje META TAGy |
Sherlock | ![]() | 43/43/43/x | nezobrazuje META TAGy, zrušen |
NajdiTo | ![]() | 17/17/17/17/211/x | nezobrazuje META TAGy, MegaText, fulltext zrušen |
Fulltextové vyhledávání na Vašich vlastních stránkách.
Umožněte vyhledávání i na vlastní WWW stránce. Toto fulltextové hledání je založeno na detailním indexu, který zdarma nabízí server Atomz.com.. Jak takový index funguje si můžete ověřit na dvou příkladech, které mám pomocí této služby registrovány.
Vaše připomínky, komentář či polemiku můžete napsat přímo ZDE:
Tato stránka je zařazena na následující české WWW servery:
a je umístěna na serveru 1.Lékařské fakulty UK, připojení prostřednictvím -