Alta Vista "na doma"

      Kdysi jsem bydlel v Santiago de Cuba, v  haciendě nazvané Buena Vista. Od té doby vím, že to znamená dobrá vyhlídka. AltaVista pak znamená logicky stará, anebo možná i staromodní. To, s čím však přišla AltaVista nyní, znamená spíše pohled nový: a hlavně - už nejen na Internet, ale i na váš hard disk

     
Roli Internetu v dnešní éře společenské informační exploze lze srovnat s úlohou vynálezu parního stroje v době průmyslové revoluce v osmnáctém století, řekl jednou kdosi od společnosti Digital, a pravdou je, že s tímto trefným srovnáním lze jen souhlasit. Je to o to oprávněnější, že její jméno je s historií Internetu svázáno již od sedmdesátých let, kdy se právě Digital stal první počítačovou společností připojenou do sítě ARPAnet, předchůdce dnešního Internetu. Právě Digital na ní také vytvořil vlastní www server, nejen jako první z žebříčku Fortune 500 obsahujícího nejúspěšnější společnosti roku, ale i jako první registrovanou internetovou doménu počítačové firmy vůbec.

      Hledáte-li v podstatě jakoukoli, nicméně konkrétní informaci, nepochybujte o tom, že o ní na Internetu existuje alespoň zmínka, ne-li rovnou celá informace samotná. Otázkou bylo jen, jak ji najít, zvláště tvořilo-li Internet záhy k desítkám milionů www stránek.

      Od 15. prosince 1995, kdy byla uvedena vyhledávací služba AltaVista Search, se způsob, jak toho lidé do té doby dosahovali, navždy změnil. Jejím prostřednictvím jako veřejné a bezplatné služby lze prohledávat index obsahující odkaz na každé slovo z každé www stránky na Internetu. Pokud se slovo na Internetu vůbec vyskytuje, AltaVista je najde během několika sekund. Jedinou "brzdou" je okolnost, že je-li jich tam více (a to je skoro vždycky), najde je všechny. Tu první najde ihned. Tu poslední - úměrně jejich počtu.

      Neuvěřitelně výkonný produkt dnes indexuje patnáct miliard slov z více než třiceti milionů stránek na takřka 275 600 počítačových serverech po celém světě a ze čtyř milionů článků z čtrnácti tisíc diskusních skupin USENETu. Denně vyřídí desítky milionů požadavků a tento počet denně roste.

      Celé soustrojí veřejné vyhledávací služby AltaVista se skládá z tzv. super-spideru zvaného Scooter (nebo také Webcrawler), stejně jako důmyslného Net indexeru, systému zadávání dotazů. Scooter je ve své branži vůbec nejrychlejší na světě, neboť prohledává a sbírá data z šesti milionů stran denně. Je "dobře vychovaným" prohledávačem, jenž se nepokouší procházet ochrannou bariérou firewallu, ani nepořizuje indexy stránek, u nichž je to z nějakého důvodu zakázáno. Při prohledávání speciálním algoritmem také automaticky testuje, zda svou činností neohrožuje výkonnost serveru. Indexer vyhledávací služby AltaVista, Net indexer 2 (Ni2), indexuje ohromující množství jednoho gigabytu textu za hodinu, přičemž hledá a odstraňuje duplicity a u každého odkazu zaznamenává stupeň významu, takže v odpovědi pak umisťuje ty nejdůležitější na začátek.

      Přeplněn informacemi však už dnes není zdaleka jenom Internet. Každý den narážíme i v současné, zdálo by se, že informacím víc nežli stranící, době na drobný problém: informací je příliš mnoho. Je stále těžší a těžší hledat jehly, protože kupky sena se stále zvětšují. Dokonce už i na disku vašeho vlastního počítače je tolik informací, že dostat se k té pravé, dá neuvěřitelnou práci. Víte určitě, že někde máte zaznamenáno určité objednací číslo faktury od firmy XY, datum důležité schůzky s jejím zástupcem, dobře naformulovaný odstavec z jeho dopisu, který byste chtěli použít. Jen kdybyste věděli, kde všechny ty nejrůznější soubory, přesně jsou! Víte určitě, že na disku nebo na podnikové síti, ale v nejrůznějších souvislostech a hlavně v souborech, jež se jmenují zcela jinak, takže klasické hledání podle názvu postrádá smysl.

      Po obrovském úspěchu Alty Visty Public Search netrvalo dlouho a došlo k uplatnění její filosofie OnSite Knowledge i tady. AltaVista Search eXtensions představila užití téže technologie i k stejně rychlému vyhledávání informace napříč obsahem článků a dokumentů ne už jenom na Internetu či intranetu, ale přímo na hard disku jednotlivého počítače. Znamená to, že zadáte-li klíčové slovo či frázi, o nichž víte, že s požadovanou informací souvisejí -- například jméno osoby, o níž se v hledaném dopise píše -- doslova za několik okamžiků se vám objeví výpis všech dopisů, které je obsahují. A kliknete-li dvakrát na jejich název, otevře se vám rovnou i s odpovídajícím programem, třeba textovým editorem, v němž byl pořízen.

      I tato, dejme tomu "osobní" nebo "individuální" verze AltaVista Public Search, totiž neustále indexuje obsah pevného disku a sdílených síťových disků a s takto pořízeným indexem pak srovná i váš požadavek. Indexování samo je nastavitelné: provádí se buď automaticky, v určitých intervalech, nebo jednorázově, na přímý pokyn uživatele.

      Funkce indexování a vyhledávání přitom podporuje kromě hypertextových a textových souborů více než dvě stě formátů souborů z všemožných aplikací (Microsoft Office, Lotus SmartSuite, WordPerfect Office apod), které jsou uloženy na pevném disku PC nebo sdílených síťových discích. Indexovány jsou i e-mailové zprávy včetně k nim připojených souborů a nově také HTML stránky uložené v diskové cache www prohlížeče. I ty se zobrazí rovnou v příslušném programu pouhým kliknutím na položku v seznamu.

      Poslední verze AltaVista Search Personal eXtension 97 podporuje devět jazyků, mezi nimiž je nyní i čeština, a instalaci pod Windows 95 zvládne i běžný uživatel. Co se na češtinu ještě nevztahuje, je nejnovější služba, která umožňuje překládat automaticky texty z Alta Vistou nalezené www stránky z angličtiny do pěti jazyků (španělština, němčina, francouzština, italština a portugalština). Nicméně -- co není, může být.

     

ajn