index

Začátečník na Internetu
Lekce 6: Elementy WWW - prvá část


Je pomalu načase, abychom si řekli základní věci, které souvisejí s nejpopulárnějším prezentačním systémem dokumentů v soudobém Internetu, s WWW (World Wide Web).

WWW není samozřejmě jediný prezentační systém, dalším prezentačním systémem, který donedávna ovládal Internet je Gopher. I když oba systémy jsou zhruba stejně staré, (jejich prvé realizace můžeme spatřit na počátku devadesátých let), tak vývoj jejich popularity je značně odlišný. Do roku 1993 vládl naprosto bezkonkurenčně Gopher a WWW živořil v jeho stínu. Situace se obrátila v roce 1993, kdy se objevil program Mosaic, prvý WWW klient - prohlížeč, který pracoval s grafickým rozhraním. Doposud vládnoucí Gopher používal pouze textová rozhraní. Mosaic tedy odstartoval éru multimediálních internetovských dokumentů. V současné době WWW prezentuje dokumenty nejen s textovou a obrazovou informací, ale i dokumenty se zvukovou a videovou informací. Po roce 1993 začal WWW pomalu vytlačovat Gopher a v současné době bezkonkurenčně ovládá Internet.

1. Klienti a servery ve WWW

WWW dokumenty, někdy můžeme slyšet pojem webovské dokumenty nebo dokumenty v pavučině, jsou ukládány na tzv. WWW serverech. Těch je dnes (začátek roku 1997) v Internetu několik set tisíc a jejich počet se velmi rychle zvyšuje. Tyto dokumenty se obvykle označují jako WWW stránky (WWW pages) a jejich význačnou vlastností je to, že mohou obsahovat na jiné WWW stránky, umístěné třeba na serverech na druhém konci světa. Výchozí stránka nějakého tematu se často označuje jako domácí stránka (home page) nebo jako hlavní stránka (main page). Odhaduje se, že v sočasné době existují v Internetu desítky možná i stovky milionů stránek obsahujících nejrůznější informace. Stránky na serverech jsou pro uživatele dostupné speciálními klientskými programy - prohlížeči, browsery. Ty zprostředkovávají styk WWW s uživatelem, který jim zadá požadavek na prezentaci WWW stránky. Klient dle specifikace stránky vyhledá WWW server, na kterém je stránka umístěna a požáda o ni. Server ji klientovi zašle a ten ji zpřístupní uživateli ve vhodném tvaru. Klient a server se domlouvají dle určitých zvyklostí, které označujeme jako protokol. V našem případě jde o protokol HTTP (HyperText Transfer Protokol). Textovým stránkám obsahujícím odkazy na další stránky se říká hypertext. Tyto stránky jsou psány ve speciálním jazyce HTML (HyperText Markup Language). Jako soubory obvykle mají v identifikaci dle typu operačního systému příponu html nebo htm.

2. Adresace WWW dokumentů

V lekci 2 jsme se zmínili, že WWW dokumenty lze jednoznačně specifikovat prostřednictvím URL (Uniform Resource Locator). Zopakujme, že pro pro WWW dokumenty, tj. pro dokumenty, které jsou přístupné protokolem HTTP, příslušná URL mají tvar:

http://domain­name[:port][/[path/[object­name]]]

Domain­name je identifikace WWW serveru, implicitní port má hodnotu 80. Object­name je specifikace WWW dokumentu, která může mít složitější tvar. Path je cesta k tomuto dokumentu na serveru. Příkladem nám může být URL domovské stránky Softwarových novin:

http://www.softnov.cz

Přemýšlivý čtenář se nás ihned zeptá, kde je část path/object­name. Dodejme, že příslušný server je tak nastaven, že při neuvedení této části, předpokládá cestu prázdnou a objekt soubor index.html. Dalším příkladem nám může být URL internetovské rubriky Softwarových novin:

http://omicron.felk.cvut.cz/html/softnov/

Podobně jako v předchozím případě objektem je implicitní soubor index.html. Pokud by na serveru neexistoval, béře se za objekt adresář html/softnov/.

3. WWW klienti

Již jsme si řekli, že WWW klineti mohou pracovat s uživatelem prostřednictvím rozhraní, která mohou být buď textová nebo multimediální. Příkladem WWW klienta, který pracuje s textovým rozhraním je např. program LYNX, vytvořený na počátku devadesátých let na kansaské univerzitě. V současné době u nás rozšířenými multimediálními klienty jsou o přízeň uživatele soupeřící Netscape Navigator (NN)Microsoft Internet Explorer (MIE). MIE je nyní freeware, tj. uživatel si je může z Internetu stáhnout a používat volně. NN je v této podobě k dispozici také, ale bezplatně jej mohou používat jen akademické organizace. Běžné verze NN a MIE jsou 3.0. NN je k dispozici pro většinu operačních systémů včetně Unixu. MIE jen pro všechny verze Windows a Macintosh.

Informaci doplňme zprávou, že česká firma Software602 vyvinula v licenci svůj vlastní prohlížeč, jenž je součástí balíku 602proINTERNET. Firmy Netscape a Microsoft pravděpodobně nabídnou v brzké době novější verze svých WWW klientů.

4. Další dokumenty dosažitelné WWW klienty

Popularitu WWW zvyšují nejen jeho hypertextové a multimediální vlastnosti, ale i skutečnost, že prostřednictvím jeho klientů lze prezentovat i dokumenty přístupné jinými protokoly než je HTTP. My se v této souvislosti zmíníme nyní pouze o dalších dvou typech dokumentů. Jsou to dokumenty již zmíněného prezentačního systému Gopher a dokumenty přístupné na archivních serverech protokolem FTP (File Transfer Protocol). Gopher má tuto strukturu URL:

gopher://domain­name[:port][/TypSelektor

Vidíme, že používaný protokol je gopher. Dodejme, že gopherský server je specifikován v domain­name. Implicitní port je 70, Typ je jednoznakové označení druhu gopherského dokumentu a Selektor je identifikace dokumentu na serveru. Jako příklad uvedeme URL s NetNews, umístěné na gopherském serveru:

gopher://gopher.eunet.cz:4327/1nntp

Vidíme, že port není implicitní, ale 4327, Typ je roven 1 (adresář) a Selektor má hodnotu nntp. FTP dokument má takovouto strukturu URL:

ftp://[user[:password]@]domain­name[:port][/[path/[object[/type=x]]]

User a password jsou uživatelský účet a heslo na FTP serveru domain­name. Implicitní port je 21, path je cesta k objektu (soubor, adresář). Lze také udat nepovinně typ objektu:

x s hodnotou d znamená adresář
x s hodnotou a znamené textový soubor
x s hodnotou i znamená binární soubor

Pokud se typ neuvede, ponechává se úkol zjistit typ přenášeného souboru ze serveru k uživateli na FTP protokolu. To v běžných případech postačí. Jako příklad si uvedeme URL adresáře na jednom z českých archivních serverů, kde jsou uloženy oficiální internetovské materiály označované zkratkou RFC (Request For Comments):

ftp://ftp.eunet.cz/pub/nic/internic/rfc/

Vidíme, že v URL schází userpassword. To proto, protože server ftp.eunet.cz je tzv. serverem pro anonymní FTP, tj. pro standardního veřejného uživatele anonymous. Vynecháme­li tyto údaje v URL, předpokládá se, že jde o tento případ. Navíc vidíme, že pro cestu /pub/nic/internic/rfc/ schází object. To znamená, že se požaduje přenést ze serveru ke klientovi výpis adresáře definovaného touto cestou.

5. Práce s WWW klientem

Víme, že jsou k dispozici WWW klienti - prohlížeče, že hypertextové dokumenty jsou propojeny odkazy a že objekty, o jejichž prezentaci máme zájem, jsou jednoznačně identifikovatelné pomocí URL. Zbývá se naučit, jak s prohlížeči pracovat. V této lekci se soustředíme na prohlížeče NN a MIE.

U NN je třeba prověřit některé prvky nastavení v menu Options. U MIE prověřujeme prvky nastavení Zobrazit/Možnosti. Zásadní význam pro rychlost práce prohlížeče NN je nastavení menu CacheNetwork Preferences. Do vyrovnávací pamětí Memory CacheDisk Cache prohlížeč ukládá prezentované dokumenty. Činnost prohlížeče při požadavku na dokument se řídí nastaveními Verify Documents Once Per Session, Every Time, Never. Prohlížeč se nejdříve podívá, zda požadovaný dokument má v cache. Pokud ho tam nemá, tak ho ze serveru přenese. Je­li dokument v cache, tak při nastavení Never ho ihned bez kontroly s originálem dokumentu prezentuje. Při nastavení Once Per Session kontrolu, zda se uložený dokument neliší od originálu, provede v průběhu uživatelovy relace pouze jednou, kdežto při nastavení Every Time, vždy. Tím je samozřejmě ovlivněna rychlost prezentace. Pro běžnou práci je vhodné nastavení Once Per Session, při ladění vlastního hypertextového dokumentu nastavení Every Time a pokud nás nezajímá soudobý stav originálu, tak nastavení Never.

Analogické prověření cache lze provést i u MIE v podmenu Zobrazit/Možnosti/Upřesnit/Nastavení. Cache lze nastavit vyhrazením procentuální částí diskové jednotky a zvolit analogické režimy kontroly uloženého dokumentu s originálen jako u NN.

Dále je třeba u NN prověřit, že v  Network Preferences, v menu Languages, je povolena Java a Javascript. Používání těchto prostředků při tvorbě WWW stránek se stává dnes běžným. Pokud bychom jejich užití v prohlížeči zakázali, mohli bychom se ochudit o řadu zajímavých prezentací. Podobně u MIE je třeba prověřit povolení Javy v podmenu Zobrazit/Možnosti/Zabezpečení.

Soudobá verze NN je značně nestabilní pro kodování dokumentu. Prověřme proto v  Document Encoding, že je v závislosti na WWW dokumentech, s kterými budeme pracovat, vhodně nastaveno, že není třeba nastaveno na řečtinu. Připomeňme jeho význam pro kodování češtiny, jak v dokumentech, tak i v elektronické poště a NetNews. O něm i o specifikaci fontů jsme mluvili v lekci o elektronické poště. U MIE překontrolujme nastavení v podmenu Zobrazit/Možnosti/Zabezpečení/Nastavení-písem. Jednak výchozí jazyk a znakové sady musí být středoevropské, fonty pro proporcionální písmo Times New Roman, fonty pro neproporcionální písmo Courier­New a kodování MIME 8859-2.

Když spustíme prohlížeč, tak nám NN prezentuje jako prvý dokument dokument ze serveru home.netscape.com. MIE pak prezetuje dokument z home.microsoft.com. Tato situace nám nemusí vyhovovat. Změnit ji můžeme jak u NN, tak i u MIE. U NN zvolíme v General Preferences menu Appearance a v něm můžeme upravit Start With. Buď zvolíme Blank Page nebo Home Page Location a specifikujeme URL nové startovací stránky, což může být také stránka na lokálním disku. V případě MIE stačí vyplnit příslušné udaje v podmenu Zobrazit/Možnosti/Navigace.

Ať už natáhneme lokální stránku, nebo stránku někde na Internetu, bude obsahovat hypertextové odkazy, které poznáme podle barvy a podtržení. Aktivací jednoho a těchto odkazů, např. kliknutím levého tlačítka myši, požádáme klienta, aby nám prezentoval zvolený WWW dokument. V prezentovaném dokumentu můžeme zvolit opět nejaký odkaz a postup opakovat. Popsaná činnost charakterizuje základní pohyb v pavučině webovských stránkek.

V příští lekci budeme pokračovat v seznamování se s elementy WWW .