Chcete-li získat několik nejnovějších informací ze zvolené oblasti nebo zdroje, přečtete si noviny nebo nějaký časopis. Chcete-li získat všechny informace a doufat, že jednou najdete tu pravou, která vás zajímá, použijete Internet.
Potřebujete-li však jen vybrané informace a nemůžete ztrácet čas hledáním a probíráním, použijte systém Blizzard. Předchozí řádky sice znějí poněkud nadneseně, ale část pravdy v nich je. Začněme ale od počátku, a to od doby ještě před Adamem.
Na začátku byla prostá Myšlenka. Internet se bude dále šířit, o tom není sporu. Internet spolu se svým šířením distribuuje informace. Ty bývají dostupné nejčastěji ve formě textových dokumentů. Výhodou přitom je, že tyto informace mohou být jak superaktuální, tak archivní.
Vezměme však informační médium dnes nejrozšířenější, kterým je Tisk, tedy noviny a časopisy. Toto médium je sice levné, rychlé, ale už ne tak superaktuální a už vůbec ne archivní, tedy pokud si někdo nebuduje svůj vlastní archiv, na to však v dnešních bytech nejsou povětšinou podmínky.
Myšlenka výše naznačená však zněla: převést všechny noviny a časopisy do elektronické formy a distribuovat je pomocí Internetu. To by umožňovalo funkci, kterou tisková média nikdy nedisponovala. Touto možností je elektronické fulltextové vyhledávání informací, a to nejen z jednoho titulu, ale pokud možno z co nejširší nabídky, a zahrnující co možná nejstarší vydání jednotlivých titulů.
Myšlenka to sice byla jednoduchá, ale řešení už tak prosté není. Především to představuje mohutnou a stále dostupnou databázi, která se nadále denně rozšiřuje, výkonný vyhledávací systém a konečně dostupné a neustále funkční zdroje informací. Nutnou samozřejmostí je také snadno dostupné, a to i ekonomicky, připojení k síti Internet.
Protože se ukázalo, že zpracovat úplně všechna periodika by bylo velmi náročné, neboť některé tituly jsou značně specifické a obtížně použitelné na elektronické zpracování, spektrum se zúžilo a zaměřilo na politicko-ekonomickou oblast, která je dnes přece jen nejžádanější. Výsledným produktem je systém Blizzard společnosti Credittex, a. s.
Technické a programové zázemí
Jádrem systému je file-server, na němž jsou uložena všechna data. Ten je představován počítačem PC osazeným dvěma procesory Pentium. Diskové pole RAID 5 má kapacitu 21 GB, ze kterých je v současné době využito asi 12 GB. Momentálně je použit operační systém Windows NT, na který firma přešla z předchozí sítě Novell. Z náznaků jsem však dospěl k pocitu, že nejsou se změnou systému spokojeni, protože dochází k problémům, které se dříve neobjevovaly.
Jádro informačního systému představuje Topic, fulltextový vyhledávací systém, původně vytvořený v USA pro zpravodajské agentury. Celý informační systém je dále doplněn dalšími počítači a přes program Major, který pracuje jako gateway BBS, je dále dostupný pro uživatele pracující s uzly BBS. Toto připojení však představuje zcela samostatnou kapitolu.
My se však dnes soustředíme na Internet, kam je systém Blizzard připojen přes pevnou linku 64 kb/sec přes poskytovatele Nextel. Zde bych měl malou poznámku: znovu a znovu jsem narážel na problém neexistence peeringového spojení s ostatními poskytovateli a odezvy programu byly mnohdy opravdu pomalé. Záleží samozřejmě na tom, kde je uživatel připojen, v případě mého připojení (IDG je na EUnetu) to byla klasická komunikace přes USA.
Ve firmě Credittex si uvědomují tuto skutečnost a uvažují o dalších možnostech připojení.
Informační zdroje
Informační systém je "krmen" z asi stovky tiskových zdrojů.
Jedná se o média s celostátní
působností, regionální zdroje a agenturní zpravodajství. Data jsou zčásti dodávána elektronicky, ale významnou část tvoří data naskenovaná pomocí rychlého čtecího programu z kategorie OCR, který pracuje vektorovou metodou, s názvem Prolector. Překvapilo mě, že i nyní tvoří významný podíl "doma" připravená data, ta dosahují téměř 50 %.
Práce s programem
Po zadání svého jména a správného hesla si může uživatel vybrat z několika zdrojů. K dispozici jsou tiskové, regionální, a agenturní zdroje, dále monitor televize a rozhlasu, registr firem, emitenti CP atd.
V následujícím okně pak uživatel zadá dotaz, vybere téma, období, může zvolit možnost okamžitého zobrazení zvoleného počtu nalezených článků, případně nastaví další parametry a odešle dotaz.
Zadání správně formulovaného dotazu je klíčový okamžik celé práce. Topik sice najde vše, co mu tazatel (správně) zadá, ale nenajde to, co si uživatel pouze přeje, avšak nezadá.
Formulovat správný dotaz vyžaduje určitou praxi a znalosti. Nebudu se zde o této problematice mnoho šířit, neboť nejlepší je vyzkoušet si zadávání dotazů v praxi proto snad jen několik vět. Dotazy jsou rozděleny na "Prosté" a "Tematické". V prvním případě je lze kombinovat se známými logickými operátory AND, ACCURE, OR, NOT, či použít jejich zkratkové symboly. V druhém případě je k dispozici řada témat. Oba způsoby lze také kombinovat a po vytvoření kvalitního dotazu je pak možné minimalizovat čas nutný pro vyhledání a také množství celkově získaných informací.
Dojmy
Měl bych ještě dodat, že recenzovaný systém Blizzard je asi měsíc stará novinka (psáno na přelomu prosince), a proto je ještě v "záběhu", přesto už má stálé zákazníky. Získané výsledky jsou totiž pozoruhodné a jsem přesvědčen, že systém si najde mnoho uživatelů, kterým usnadní nalezení potřebných informací.
Zdali bude mít tento "výstřižkový" systém úspěch (či podobné další) hodně záleží na rostoucí popularizaci a dostupnosti Internetu, a zejména na cenové politice poskytovatelů Internetu a telefonních služeb (SPT Telecom).
Závěrem
Využitím recenzovaného systému můžeme získat nejen mnoho zajímavých informací, ale udělat si i celkovou představu o situaci v různých oblastech získáním komplexních znalostí v širších souvislostech.
Je například až legrační pro někoho však (včetně mne) spíše smutné kolik zejména regionálních časopisů a celých vydavatelství už není v rukou českého kapitálu, ale v rukou kapitálu mocného souseda.
Opravdu to není a ani v budoucnu jednou nebude na závadu?
Petr Kefurt @