|
Tvo°φte vlastnφ WWW strßnky ?
a hledßte, podobn∞ jako i jß, r∙znΘ zp∙soby jak dßt o sob∞ v∞d∞t? Vφte jak fungujφ vyhledßvaΦe - roboti, seznamy a indexy na Webu?
Na tΘto strßnce Vßm nabφzφm svΘ zkuÜenosti s mnoha sv∞tov²mi i Φesk²mi, fulltextov²mi vyhledßvaΦi, dozvφte se jak vytvo°it vlastnφ index svΘ strßnky a jak a kam svΘ strßnky nabφdnout k za°azenφ.
Jak a kam strßnky zaregistrovat?
|
|
Na strßnce HTML a DHTML Help Vßm nabφzφm vφce ne₧ 110 odkaz∙ na WWW zdroje, kterΘ sßm p°i tvorb∞ WWW strßnek pou₧φvßm, HTML manußly, p°φruΦky, zdroje grafiky pro WEB, animovanΘ GIFy, a pod. Mezi odkazy je i p°ehlednß tabulka barev s RGB k≤dem pro pou₧itφ v HTML dokumentech, kterou velmi Φasto pou₧φvßm. Na Webu lze rovn∞₧ nalΘzt dokumentaci a software pro kontrolu sprßvnosti HTML dokument∙ - validizaci.
A koneΦn∞ n∞kolik p°φklad∙ - p°ehled WWW strßnek, kterΘ jsem vytvo°il - Vßm nabφzφ m∙j osobnφ rozcestnφk PeKoWeb centrum 2000.
Web se vÜak stßle rozr∙stß, informacφ p°ib²vß a pavouci to nestφhajφ. Dovoluji si zde odcitovat zßv∞ry, kterΘ byly zve°ejn∞ny na strßnce 800 milion∙ strßnek - nynφ dokument nedostupn².
DneÜnφ Web p°edstavuje na 15 terrabajt∙ informacφ - na 800 milion∙ strßnek, 180 milion∙ obrßzk∙. Den co den se objevuje na 3 miliony nov²ch strßnek. N∞kterΘ Φßsti Webu se indexujφ dob°e, v∞tÜina Üpatn∞ a mnohΘ v∙bec. |
V²sledkem je, ₧e indexovacφ vyhledßvacφ stroje dosahujφ odhadem na st∞₧φ 16% sv∞tovΘho WWW ! V roce 1998 p°itom Ülo o 34%. |
NejlΘpe na tom je vyhledavaΦ Northern Light dosahujφcφ na 16% Webu, Altavista t∞sn∞ nßsleduje s 15.5% (0.5% rozdφl je ovÜem spφÜ statistickß chyba). Nßsleduje Microsoft (8.5%), Yahoo (7.4%), Excite (5.6%) a Lycos (2.5%) - pokud tedy n∞co hledßte, mßte k dispozici kompletnφ sadu nejlΘpe vybaven²ch indexaΦnφch stroj∙. |
Nakolik se indexy jednotliv²ch indexßtor∙ p°ekr²vajφ Φi nikoliv z∙stßvß ovÜem otßzkou - v extrΘmn∞ p°φznivΘm p°φpad∞ mohou v²Üe zmφn∞nΘ indexßtory dohromady obsßhnout maximßln∞ polovinu Webu - druhß polovina z∙stßvß nevid∞na a nenalezitelnß. |
Ani v ΦeskΘm prost°edφ na tom nejsme nijak dob°e - indexßtor Seznamu mß omezenu databßzi na 2GB a indexuje n∞kolikaprocentnφ zlomek ΦeskΘho Internetu - pokud indexuje v∙bec (zpravidla se k indexovßnφ dostane st∞₧φ jednou za rok). Indexßtor Atlasu je na tom sice o trochu lΘpe, ale ani tady to nenφ tak dobrΘ, jak by u₧ivatelΘ pot°ebovali. |
pozn.citovanß strßnka z Webu nemß uvedenΘ ₧ßdnΘ datum, ·daje, kterΘ autor uvßdφ, a kterΘ jß pouze cituji, je nutno pova₧ovat za ilustrativnφ, orientaΦnφ informace, platnΘ ke dni, kdy byl tento text zve°ejn∞n - toto datum znßmo neni. |
Nßsledujφcφ tabulka sumarizuje mΘ osobnφ zkuÜenosti se 17 sv∞tov²mi vyhledßvaΦi - indexy. Jako p°φklad je pou₧ito vyhledßnφ mΘho jmΘna. UvedenΘ poΦty jsou zφskßny dne 23.dubna / 13.Φervence / 14. °φjna 2000 / 27.b°ezna / 13. srpna / 15.prosince 2001 / 17.b°ezna / 13. Φervna / 7. °φjna / 9. prosince 2002 / 24. kv∞tna / 16. °φjna 2003 a datum aktualizace, resp. nejnov∞jÜφho zßznamu - pokud slu₧ba tato data poskytuje, majφ relativnφ, ilustrativnφ v²znam, nikoliv absolutnφ. PoΦet nalezen²ch zßznam∙ se liÜφ i podle aktußlnφho nastavenφ hledacφ slu₧by, nap°. omezenφm poΦtu zobrazen²ch strßnek apod. Velmi dobrΘ v²sledky nabφzel Northern Light, kter² navφc vytvß°el k nalezenΘmu souboru index klφΦov²ch slov a stromovou strukturu odkaz∙ podle jednotliv²ch lokalizacφ - sit∙, bohu₧el index ji₧ WWW strßnky nezahrnuje. Novinkou je vyhledßvacφ stroj MonkeySweat a z tzv. metasearch vyhledßvaΦ∙ je velmi v²konn²m MultiMeta, kter² kombinuje vyhledßvßnφ v indexech Acoon, Altavista, Voila, Excite, HotBot, Lycos, MSN, Infoseek a Yahoo.
pozn. Slovensk² fulltextov² index
Zoznam.sk je uveden mezi Φesk²mi, pro srovnßnφ s Φesk²m
Seznam.cz.
server | p°φklad hledßnφ | poΦet strßnek | poznßmky |
MonkeySweat | 940/1055/731/714/1093/1525/1234/1853/208/286 | vyu₧φval slu₧byAllTheWeb, nynφ index jin², nefungujφ nastavenφ | |
Fast Search AllTheWeb | 555/553/931/1055/731/714/1125/2975/1829/2679 /2642/2937 | ||
Lycos Search | 555/553/572/1055/863/714/1116/3191/1821/2679/2642/7692 | jeden z mßla mß datum aktualizace, 26/9/2003, zobrazφ jen 1000 zßznam∙ | |
265/313/567/1100/932/1310/1560/1260/1900/2360/2240/1980 | |||
HotBot | 43/95/85/125/148/156/120/155/700/224/515/748 | zobrazuje META TAGy, jeden z mßla mß datum aktualizace, 11/9/2003 | |
Northern Light | 225/337/535/579/545/589/x | index WWW strßnek zmizel | |
AltaVista Search | 204/359/297/423/371/442/996/1074/984/2484 /2909/2626 | zobrazuje META TAGy | |
Web Zone | 65/40/79/245/246/x | pozd∞ji WebTop, ji₧ zruÜen | |
MSN Search | 106/145/157/181/259/246/240/259/937/1090/938/691 | zobrazuje META TAGy | |
Netscape Search | 265/314/140/96/65/76/75/1230/1500/1660/2150/410 | zm∞na search.engine | |
WebCheck | 121/134/x | zobrazuje META TAGy zruÜen | |
AOL Search | 46/50/51/58/61/176/186/205/1500/1660/417/77 | zobrazuje META TAGy | |
Yahoo | 44/18/49/99/198/224/757/352/1740 /2370/2200/1440 | NEzobrazuje META TAGy | |
PositionTech | 553/576 | zobrazuje META TAGy, datum aktualizace 11/9/2003 | |
InfoSeek Go | 34/31/36/17/45/50/47/51/183/47/70/240 | slu₧ba Overture | |
Excite | 24/3 angl./18/21/14/16/58/40/50 /51/56/49 | zobrazuje META TAGy | |
GoTo Search | 19/25/34/16/45/50/47/51/183/47/70/x | slu₧ba Overture, zobrazuje META TAGy, zmizel | |
Teoma/Direct Hit | 11/13/13/10/0/0/8/46/46/55 /69/203 | zm∞na search.engine |
Jak o sob∞ dßt v∞d∞t.
Existujφ dva zßkladnφ principy, jak zviditelnit svΘ strßnky na internetu. JednoduÜÜφ je poΦkat, a₧ n∞kter² z fulltextov²ch vyhledßvaΦ∙ strßnky objevφ a do svΘho indexu za°adφ. Roboti, spiders a webcrawlers strßnky publikovanΘ na WWW navÜt∞vujφ, indexujφ a jejich nalezenφ usnad≥ujφ. Majφ vÜak omezenΘ kapacity, interval aktualizace je takΘ r∙zn² a liÜφ se p°edevÜφm v tom, jak nalezenΘ strßnky prezentujφ.
Druhou variantou je aktivn∞ svΘ strßnky nabφdnout do Φesk²ch i sv∞tov²ch adresß°ov²ch slu₧eb - seznam∙. Osobnφ zkuÜenosti s tΘm∞° 100 takov²ch server∙ naleznete na strßnce Kam umφstφt strßnky na WWW .
Vyhledßvacφ servery mnohdy kombinujφ ob∞ varianty, majφ sv∙j vlastnφ index a takΘ adresß°ovou slu₧bu, kam je mo₧no aktivn∞ strßnky nabφdnout. V ka₧dΘm p°φpad∞ Vßm doporuΦuji pou₧φvat tzv. META TAGy - popisnΘ ·daje v hlaviΦce ka₧dΘho, jednotlivΘho HTML dokumentu. V t∞chto popisn²ch polo₧kßch a v nßzvu - titulu dokumentu nepou₧φvat ΦeÜtinu, resp. psßt alespo≥ bez diakritiky. N∞kterΘ indexy zobrazφ nalezenΘ strßnky jako TITUL + META deskriptory (pokud je naleznou), pokud ne tak zobrazφ nap°. prvnφch 250 znak∙ HTML dokumentu. Jak to m∙₧e dopadnout je vid∞t na nßsledujφcφch p°φkladech:
HTML dokument v ΦeÜtin∞, Titulek + META TAG anglicky |
HTML dokument i Titulek strßnky v ΦeÜtin∞ bez META TAGu |
HTML dokument i Titulek strßnky v ΦeÜtin∞, server nezobrazuje META TAGy |
FulltextovΘ vyhledßvßnφ v ΦeskΘm internetu.
Indexovacφ - fulltextovΘ vyhledßvacφ slu₧by majφ servery Seznam, Atlas, Kompas, Centrum CZ, Katedrßla, Megatext a Najdi To. I zde uvßdφm svΘ osobnφ zkuÜenosti s vyhledßnφm svΘho jmΘna pomocφ fultextov²ch hledaΦ∙ na Φesk²ch serverech - ·daje platnΘ ke dni 23.dubna / 13.Φervence / 14. °φjna 2000 / 27.b°ezna / 13.srpna / 15.prosince 2001 / 17.b°ezna / 13. Φervna / 7. °φjna / 9. prosince 2002 / 24. kv∞tna / 16. °φjna 2003, majφ rovn∞₧ - jak je uvedeno u sv∞tov²ch vyhledßvaΦ∙ - pouze relativnφ, ilustrativnφ v²znam, nikoliv absolutnφ. Z Φesk²ch indexov²ch vyhledßvaΦ∙ doporuΦuji jako nejlepÜφ slu₧bu - server Centrum CZ a MSN Atlas , velmi zajφmavou slu₧bou byl metasearch Archon (ji₧ neexistuje), kter² kombinoval v²sledky fulltextov²ch hledaΦ∙ Centrum, AltaVista CZ, AllTheWeb a Google pro ΦeskΘ strßnky, a hledßnφ v Φesk²ch seznamech - Quick, NajdiTo, Centrum, Seznam a RedBox, hledßnφ v seznamech lidφ a dalÜφ varianty, ze sv∞tov²ch index∙ prohledßval Infoseek, AllTheWeb, AltaVista, Google, Excite, HotbotText a Inktomi. Velmi v²konn² hledacφ nßstroj je integrovßn takΘ do portßlu WorldOnLine, nejnov∞jÜφ a velmi v²konn²m fultextem je Empyreum, kter² je pou₧φvßn jako fulltext v portßlu iDnes, mezi novΘ ΦeskΘ indexy pat°φ i Morfeo (d°φve webFast) - slu₧ba Centrum.Cz a WebSeek. Pro srovnßnφ fulltextovΘho indexu
Seznam.cz, je zde uveden i jeden zahraniΦnφ, mnohem v²konn∞jÜφ - slovensk² fulltextov² index Zoznam.sk.
server | p°φklad hledßnφ | poΦet strßnek | poznßmky |
Jyxo | 1450/1551/1342 | za°azen nov∞ 8.ledna 2003, kategorizace zdroj∙ | |
WebSeek | 2418/1567/1230/1117/1161/1161/1161 | poΦet v²skyt∙ slova, na 441 strßnkßch, ve 114 zdrojφch, 158 dokument∙ | |
Empyreum | 1160/898/x | zobrazuje META tagy, fulltextovß slu₧ba zruÜena | |
WorldOnLine, Tiscali | 695/730/714/702/2027/1821/1890/2643/7693 | Janas search engine, nezobrazuje META TAGy, zobraziletnΘ /1935 | |
Centrum - Morfeo | 117/103/289/515/836/1266/1595/1151/938/957/945/797 | nezobrazuje META TAGy, zm∞na fulltextu na Morfeo - d°φve WebFast | |
MSN Atlas - Jyxo | 434/297/300/300/300/875/1482/201/201/201/1664/1413 | NEzobrazuje ji₧ META TAGy, fulltext - Jyxo | |
Megatext CZ | 117/114/173/242/211/191/166/x | nezobrazuje META TAGy, zruÜen | |
Archon | 582/259/1457/316/1579/464/342/x | kombinuje Centrum, Atlas, AltaVista a dalÜφ, zruÜen | |
Seznam - Google | 62/175/221/120/148/148/1127/1033/1231/1620/2230/1180 | nezobrazuje META TAGy, engine Google | |
Zoznam.sk | 702/1127/2983/1848/2683/2230/1190 | na rozdφl od Seznamu zobrazoval META TAGy, nynφ takΘ Google | |
Kompas | 62/175/221/120/148/x | shodnΘ v²sledky jako Seznam, zruÜen | |
Katedrßla | 43/43/43/9/90/90/90/-/80/88/88/88 | dalÜφ odkazy zano°enΘ dle URL, nezobrazuje META TAGy | |
Sherlock | 43/43/43/x | nezobrazuje META TAGy, zruÜen | |
NajdiTo | 17/17/17/17/211/x | nezobrazuje META TAGy, MegaText, fulltext zruÜen |
FulltextovΘ vyhledßvßnφ na VaÜich vlastnφch strßnkßch.
Umo₧n∞te vyhledßvßnφ i na vlastnφ WWW strßnce. Toto fulltextovΘ hledßnφ je zalo₧eno na detailnφm indexu, kter² zdarma nabφzφ server Atomz.com.. Jak takov² index funguje si m∙₧ete ov∞°it na dvou p°φkladech, kterΘ mßm pomocφ tΘto slu₧by registrovßny.
VaÜe p°ipomφnky, komentß° Φi polemiku m∙₧ete napsat p°φmo ZDE:
Tato strßnka je za°azena na nßsledujφcφ ΦeskΘ WWW servery:
a je umφst∞na na serveru 1.LΘka°skΘ fakulty UK, p°ipojenφ prost°ednictvφm -