VyhledßvaΦ Megatext pat°φ mezi technologicky nejpokroΦilejÜφ fultextovΘ vyhledßvaΦe
na ΦeskΘ internetovΘ scΘn∞. Tuto pozici zaujφmß p°edevÜφm dφky skuteΦnosti, ₧e se jako
jedin² z velk²ch Φesk²ch vyhledßvaΦ∙ dokß₧e pln∞ vypo°ßdat s klφΦov²mi problΘmy
slo₧itΘ ΦeskΘ gramatiky. U fulltextovΘho vyhledßvaΦe to znamenß p°edevÜφm to, aby dokßzal
vyhledßvat Φeskß oh²banß slova ve vÜech jejich morfologick²ch tvarech. Megatext mß pro
°eÜenφ tohoto problΘmu k dispozici rozsßhl² slovnφk 50-ti tisφc nejfrekventovan∞jÜφch
Φesk²ch slov, s jeho₧ pomocφ dokß₧e hledanΘ v²razy spolehliv∞ identifikovat bez ohledu na
to, v jakΘm pßd∞, Φφsle nebo slovesnΘm Φase se dan² termφn na strßnce vyskytuje.
Druh² rys, kter² Φinφ Megatext vyjφmeΦn²m, bude pro mnohΘ u₧ivatele mo₧nß jeÜt∞ zajφmav∞jÜφ.
Hledßme-li pomocφ b∞₧nΘho fulltextovΘho vyhledßvaΦe n∞jak² frekventovan² v²raz, jsme Φasto
zavaleni v²sledky, kterΘ obsahujφ odkazy na desφtky nebo stovky r∙zn²ch strßnek, p°iΦem₧
v∞tÜina z nich pro nßs nenφ nijak zajφmavß a najφt tu pravou je velmi zdlouhavΘ. Orientovat se
sna₧φme pomocφ krßtk²ch vzork∙ textu, kterΘ vyhledßvaΦe u ka₧dΘho odkazu vypisujφ. ProblΘm je
ale v tom, ₧e u v∞tÜiny vyhledßvaΦ∙ tento vzorek obsahuje pouze prvnφch pßr v∞t ze zaΦßtku strßnky.
P°itom o v∞ci, kterou hledßme, se v t∞chto prvnφch n∞kolika v∞tßch nemusφ v∙bec mluvit a nßm
pak nezb²vß ne₧ strßnku otev°φt, poΦkat si na jejφ naΦtenφ a text zb∞₧n∞ prohlΘdnout.
Megatext °eÜφ tento problΘm mnohem elegantn∞ji: Vzorky textu, kterΘ jsou u ka₧dΘho nalezenΘho
odkazu uvßd∞ny, jsou vybφrßny tak, aby v₧dy obsahovaly prßv∞ tu pasß₧ strßnky, ve kterΘ se
hledan² v²raz vyskytuje. Ihned tak zjistφme, zda se na danΘ strßnce pφÜe o naÜφ v∞ci v po₧adovan²ch
souvislostech a nebo se tam zadanΘ slovo vyskytuje jen nßhodou.
Poslednφm rysem, kter² je t°eba u Megatextu vyzdvihnout, je jeho snadnß pou₧itelnost i pro
internetovΘ zaΦßteΦnφky. Prßv∞ ti se toti₧ b∞₧n²m fulltext∙m Φasto vyh²bajφ kv∙li nutnosti
pou₧φvat p°i formulaci slo₧it∞jÜφch dotaz∙ logickΘ operßtory jako je AND, OR, NEAR apod.
Nic z toho nenφ u Megatextu nutnΘ (ani mo₧nΘ). Pot°ebujete-li zadat slo₧it∞jÜφ dotaz,
zadejte do vstupnφho pole n∞kolik slov vhodn∞ vystihujφcφch hledanΘ tΘma a Megatext se pokusφ
sßm urΦit mφru relevance jednotliv²ch v²raz∙ a vyhledat optimßlnφ odpov∞∩.
Jednφm z nejd∙le₧it∞jÜφch parametr∙, kter² u₧ivatelΘ u fulltextovΘho vyhledßvaΦe sledujφ, je
velikost jeho databßze. Databßze Megatextu obsahuje nynφ p°ibli₧n∞ 1.3 mili≤nu Φesky
psan²ch internetov²ch strßnek, p°iΦem₧ jejich text obsahuje dohromady vφce ne₧ 700 mili≤n∙
slov. CelΘ toto kvantum informacφ dokß₧e Megatext p°i zpracovßvßnφ vaÜeho dotazu prohledat
za pouh²ch n∞kolik desφtek milisekund. Databßze se kompletn∞ obnovuje nejmΘn∞ jednou za m∞sφc,
aby nalezenΘ v²sledky byly v₧dy dostateΦn∞ aktußlnφ.
Mßte-li vlastnφ p°ipomφnky nebo nßvrhy, jak tento vyhledßvaΦ dßle rozvφjet, nevßhejte nßm je
sd∞lit. Megatext d∞lßme pro vßs. NaÜe e-mailovß adresa je
megatext@microton.cz.
T∞Üφme se na vaÜe podn∞ty.
|