Specializovan² t²denφk o v²poΦetnφ technice o Internetu (CW 39/97) Hypertext v novΘm kabßt∞: HTML 4.0
Ji°φ Kosek ml.
Na poli Internetu se neustßle d∞je n∞co novΘho a technologie se lφhnou jak houby po deÜti. Do tohoto kvasu p°isp∞la na zaΦßtku Φervence i instituce nav²sost povolanß -- konsorcium W3C. Uvolnila nßvrh specifikace novΘ verze jazyka HTML. Verze je oznaΦena jako 4.0. My si povφme o myÜlenkßch, z kter²ch verze 4.0 vychßzφ, o zp∞tnΘ kompatibilit∞ s verzφ 3.2 a podrobn∞ji si rozebereme n∞kterΘ zajφmavΘ rysy novΘ verze. Hned zkraje vÜak musφme upozornit na to, ₧e HTML 4.0 je "Working Draft". Z toho vypl²vß, ₧e specifikace m∙₧e b²t kdykoliv zm∞n∞na Φi dokonce zruÜena. HTML 4.0 tedy dosud nenφ zßvazn² standard, kter² bychom m∞li dodr₧ovat p°i vytvß°enφ naÜich strßnek. Pokud se vÜak novß verze HTML ukß₧e jako ₧ivataschopnß (tj. budou ji podporovat prohlφ₧eΦe), jejφ statut se zm∞nφ na "W3C Recommendation" a bude ji₧ zßvazn²m standardem Internetu.
Zßkladnφ principy novΘ verze HTML HTML 4.0 nevzniklo na ΦistΘ louce. Ji₧ v dob∞ uvoln∞nφ specifikace HTML 3.2 (k≤dovΘ jmΘno Wilbur) se pracovalo na novΘ verzi HTML pod oznaΦenφm Cougar. Cougar m∞l sjednotit zejmΘna elementy pro rßmy, vlo₧enΘ objekty (element OBJECT), skriptovßnφ a pro podporu vφcejazyΦn²ch dokument∙. Cougar se sklßdal ze samostatn²ch dokument∙, kterΘ popisovaly jednotlivß rozÜφ°enφ oproti stßvajφcφ praxi. HTML 4.0 p°inßÜφ popis vÜech star²ch i nov²ch element∙ v jednom dokumentu. Podφvejme se na zßkladnφ principy, kterΘ byly p°i nßvrhu novΘ verze HTML brßny v potaz. P°enositelnost pat°φ mezi zßkladnφ myÜlenky, na kter²ch vznikal Web. Jeden dokument by m∞l b²t pomocφ Webu p°φstupn² pro poΦφtaΦe s r∙zn²m grafick²m rozliÜenφm, pro digitßlnφ diß°e, za°φzenφ pro syntΘzu zvuku, pro poΦφtaΦe p°ipojenΘ pomocφ rychlΘ i pomalΘ linky. Tohoto cφle m∙₧eme dosßhnout tφm, ₧e HTML bude vyu₧φvßno jako znaΦkovacφ jazyk k vyznaΦenφ struktury a nikoli jen grafickΘho vzhledu dokumentu. Z tohoto d∙vodu novß specifikace nedoporuΦuje pou₧φvßnφ atribut∙ a element∙ k °φzenφ grafickΘho vzhledu dokument∙. Po₧adavky na grafick² vzhled jednotliv²ch ·sek∙ dokumentu by m∞ly b²t specifikovßny pouze pomocφ styl∙. Jednotn² a p°enositeln² formßt HTML ve v²sledku p°inese ·spory jak u₧ivatel∙m, tak i producent∙m informacφ, kte°φ se soust°edφ pouze na jeden formßt poskytovan²ch informacφ. Podpora vφcejazyΦnosti: HTML 3.2 m∞lo dostateΦnou podporu pouze pro anglicky psanΘ texty. Podpora jin²ch jazyk∙, zvlßÜt∞ pokud pou₧φvaly jinΘ znaky ne₧ z anglickΘ abecedy, v₧dy pokulhßvala. HTML 4.0 p°ejφmß podporu vφcejazyΦnosti z RFC dokumentu 2070. U valnΘ v∞tÜiny element∙ lze pou₧φt dva novΘ atributy LANG a DIR. Prvnφ z nich slou₧φ k urΦenφ jazyka, kter²m je obsah elementu zapsßn. Jako hodnota se uvßd∞jφ standardizovanΘ k≤dy. Nap°φklad pro angliΦtinu existuje k≤d en, pro americkou angliΦtinu pak subk≤d en-US. Atribut DIR slou₧φ k urΦenφ sm∞ru textu. Implicitnφ hodnota je ltr pro text psan² zleva doprava. Druhou p°φpustnou hodnotou je rtl pro text psan² zprava doleva, jak je to b∞₧nΘ zejmΘna v n∞kter²ch arabsk²ch jazycφch. Sm∞r textu lze mφchat i uvnit° odstavce pomocφ specißlnφho elementu BDO. Podpora vφcejazyΦnosti samoz°ejm∞ vy₧aduje znakovou sadu, kterß obsßhne vÜechny pou₧φvanΘ znaky. P°edchozφ verze stav∞la na 8bitovΘm k≤dovßnφ ISO 8859-1, kterΘ vyhovovalo angliΦtin∞ a v∞tÜin∞ zßpadoevropsk²ch jazyk∙. V HTML 4.0 je jako znakovß sada podporovßno 32bitovΘ k≤dovßnφ ISO 10646 (je kompatibilnφ s Unicode 2.0), kterΘ pojme vÜechny na planet∞ pou₧φvanΘ znaky. Aby nebyly vÜechny dokumenty Φty°ikrßt v∞tÜφ, mohou se pou₧φvat r∙znΘ zp∙soby k≤dovßnφ tΘto znakovΘ sady. Mezi nejoblφben∞jÜφ pat°φ asi UTF-8, kterΘ jednotlivΘ znaky p°evßdφ do r∙znΘho poΦtu oktet∙. Znaky z dolnφ poloviny ASCII tabulky jsou p°itom v UTF-8 k≤dovßny stejn∞, co₧ je velice p°φjemnΘ. Podpora vφcejazyΦnosti m∙₧e p°enesen∞ vylepÜit i dalÜφ fßze prßce s HTML dokumenty -- nap°. indexovßnφ prohledßvacφmi stroji, lepÜφ typografii p°izp∙sobenou jazykov²m zvyklostem, lepÜφ p°evod textu na °eΦ, sprßvnΘ d∞lenφ slov a mnoho dalÜφho. Dosa₧itelnost strßnek i pro lidi s r∙zn²mi posti₧enφmi. HTML 4.0 v tΘto oblasti nabφzφ zejmΘna mo₧nosti vytvo°enφ textov²ch popis∙ obrßzk∙ a i n∞kter²ch dalÜφch HTML element∙. V novΘ verzi je rovn∞₧ mo₧no ve formulß°φch p°i°azovat jednotliv²m vstupnφm polφm nßv∞stφ, kterß usnadnφ prßci s formulß°i. Tabulky jsou zalo₧eny na modelu podle RFC 1942. Nov² model nabφzφ mnohem v∞tÜφ kontrolu nad strukturou a v²sledn²m zobrazenφm tabulky. U sloupc∙ lze urΦit jejich Üφ°ku a tabulka m∙₧e b²t vykreslovßna jeÜt∞ p°ed tφm, ne₧ je p°enesen cel² jejφ obsah. Ka₧dou tabulku lze rozd∞lit na hlaviΦku, t∞lo a patiΦku. U dlouh²ch tabulek m∙₧e b²t hlaviΦka a patiΦka neustßle zobrazena pro usnadn∞nφ orientace, zatφmco t∞lo tabulky bude skrolovat. Obecnß podpora pro vlo₧enΘ dokumenty. HTML 4.0 standardizuje pou₧φvanφ elementu OBJECT, kter² m∙₧e b²t vyu₧it pro vklßdßnφ obrßzk∙, videa, zvuku, matematick²ch v²raz∙, r∙zn²ch aplikacφ a dalÜφch objekt∙. Tento nov² element rovn∞₧ umo₧≥uje specifikovat alternativnφ zobrazenφ, kterß se pou₧ijφ v p°φpad∞, ₧e dan² objekt nenφ prohlφ₧eΦem podporovßn. Styly dokument∙ nejsou ₧ßdnou novinkou. DoporuΦenφm W3C jsou ji₧ od konce minulΘho roku. Styly umo₧≥ujφ d∙sledn∞ odd∞lit prezentaΦnφ vlastnosti dokumentu od jeho struktury. HTML nabφzφ n∞kolik zp∙sob∙ pro spojenφ dokumentu se stylem zapsan²m v libovolnΘm stylovΘm jazyce. Podpora skript∙ nenφ v nejpou₧φvan∞jÜφch prohlφ₧eΦφch nic novΘho. NicmΘn∞ teprve te∩ se stßvß standardnφ souΦßstφ HTML. Skripty mohou poslou₧it zejmΘna p°i vytvß°enφ inteligentnφch formulß°∙, kterΘ ov∞°φ sprßvnost dat jeÜt∞ p°ed jejich odeslßnφm na server. HTML pro ka₧d² element definuje udßlosti, kterΘ je mo₧no oÜet°it skriptem. Zakomponovßnφ skript∙ do HTML dokumentu je op∞t nezßvislΘ na pou₧itΘm skriptovacφm jazyce. Specifikace se zmi≥uje i o zp∙sobu, kter²m je mo₧no se odvolßvat na jednotlivΘ elementy (pomocφ nßv∞stφ definovanΘho atributem NAME nebo ID) -- to je d∙le₧itΘ zejmΘna pro objektov² model ve vznikajφcφm dynamickΘm HTML. Tisk vφce souvisejφcφch dokument∙ je nynφ usnadn∞n dφky standardnφmu zp∙sobu definovßnφ vztah∙ mezi dokumenty. Snadnost pou₧itφ byla zachovßna i v novΘ verzi HTML. Dokumenty lze po°ßd bezproblΘmov∞ psßt p°φmo ruΦn∞, i kdy₧ auto°i specifikace doufajφ, ₧e se brzo objevφ nßstroje pro pohodlnΘ vytvß°enφ nap°. slo₧it∞jÜφch formulß°∙.
Kompatibilita s HTML 3.2 HTML 4.0 ve v∞tÜin∞ p°φpad∙ rozÜi°uje verzi 3.2. Existujφ vÜak n∞kterΘ v²jimky. Verze 4.0 ji₧ nepodporuje elementy XMP, PLAINTEXT a LISTING. Mφsto nich se pou₧φvß pouze element PRE. Existuje i velkΘ mno₧stvφ element∙, kterΘ HTML 4.0 obsahuje, ale specifikace jejich pou₧φvßnφ nedoporuΦuje. ZejmΘna proto, ₧e v dalÜφ verzi HTML ji₧ nemusφ b²t obsa₧eny. A o kterΘ elementy se jednß? P°edevÜφm o element APPLET. Applety by se v novΘ verzi m∞ly vklßdat stejn∞ jako ostatnφ objekty pomocφ elementu OBJECT. M∞li bychom se vyhnout i elementu ISINDEX, jeho₧ funkΦnost m∙₧eme velice snadno nahradit jednoduch²m formulß°em. Rovn∞₧ se nedoporuΦuje pou₧φvat elementy DIR a MENU. Ty slou₧φ k podobnΘmu ·Φelu jako neΦφslovan² seznam UL. LiÜφ se pouze grafick²m zobrazenφm. My bychom m∞li pou₧φvat element UL a p°φpadnΘ specißlnφ po₧adavky na zobrazenφ specifikovat pomocφ stylu. Poslednφ velkou zapov∞zenou skupinou jsou elementy slou₧φcφ pro urΦovßnφ druhu pφsma a zp∙sobu zarovnßnφ (FONT, BASEFONT, STRIKE, S, U a CENTER). Mφsto nich bychom m∞li v₧dy pou₧φt styly a odd∞lit tak strukturu dokumentu od po₧adavk∙ na p°esn² grafick² vzhled.
Novinky v HTML 4.0 Nynφ se ve struΦnosti podφvßme na nejd∙le₧it∞jÜφ novinky, kterΘ p°inesla novß verze HTML. Pou₧φvßnφ styl∙ si vynutilo vznik dalÜφho elementu, kter² by slou₧il k oznaΦenφ Φßsti odstavce, na kterou chceme aplikovat n∞jak² styl. Tento element se jmenuje SPAN. Malß ukßzka pou₧itφ: Romßn Temno napsal <SPAN class="small-caps">Alois Jirßsek</SPAN>. Vidφme, ₧e SPAN mß podobnΘ pou₧itφ jako element DIV, ale slou₧φ k oznaΦenφ Φßsti textu uvnit° odstavce. DIV naopak slou₧φ k oznaΦenφ n∞kolika odstavc∙ dohromady. V HTML 4.0 p°ibyl nov² logick² styl pφsma. Skr²vß se za elementem ACRONYM a slou₧φ k oznaΦovßnφ zkratek. Malß ukßzka pou₧itφ: Slu₧ba <ACRONYM title="World Wide Web">WWW</ACRONYM> pat°φ k nejrozÜφ°en∞jÜφm. Vysv∞tlenφ zkratky se m∙₧e objevit nap°. po najetφ myÜφ nad zkratku. Pro za°azovßnφ krßtk²ch citacφ se mφsto BLOCKQUOTE m∙₧e pou₧φvat element Q. Elementy INS a DEL m∙₧eme pou₧φvat k oznaΦenφ Φßsti dokumentu, kterß oproti poslednφ verzi p°ibyla Φi ubyla. Element LINK, kter² mnoho autor∙ WWW strßnek p°ivßd∞l do rozpak∙, dnes slou₧φ k definovßnφ dokument∙, kterΘ majφ k naÜemu dokumentu n∞jak² vztah. Nßsledujφcφ k≤d do dokumentu vlo₧φ informaci o logicky p°edchßzejφcφm a nßsledujφcφm dokumentu a o strßnce s obsahem vÜech souvisejφcφch dokument∙: <HEAD>
<TITLE>Kapitola 2: Jak jsem...</TITLE> Podobn² mechanismus m∙₧e b²t pou₧it i pro specifikovßnφ alternativnφ verze dokumentu urΦenΘ nap°φklad pro tisk: <LINK media="print" title="Dokument v PostScriptu" rel="alternate" href="http://www.server.cz/docs/povidka.ps"> Opravdu komplexnφm je element OBJECT, jeho₧ chovßnφ lze ovlivnit dv∞ma desφtkami atribut∙. D∙le₧itΘ je, ₧e v p°φpad∞, kdy prohlφ₧eΦ zadan² objekt neumφ zpracovat, zobrazφ samotn² obsah elementu OBJECT. Vyu₧ijeme-li tuto vlastnost rekurzivn∞, dosßhneme velice zajφmav²ch a u₧iteΦn²ch efekt∙. Nßsledujφcφ HTML k≤d
<OBJECT classid="java:Earth.class"> </OBJECT> spustφ v prohlφ₧eΦφch, kterΘ podporujφ Javu, applet s rotujφcφ planetou Zem∞. Pokud prohlφ₧eΦ neumφ Javu, ale umφ p°ehrßvat MPEG, spustφ se video s rotujφcφ planetou. Pokud ani s MPEGem neusp∞jeme, zobrazφ se obrßzek planety. Na znakov²ch prohlφ₧eΦφch pak pouze popis toho, co je na obrßzku vid∞t. Mnoho vylepÜenφ se dotklo formulß°∙. Vstupnφ pole lze nynφ sluΦovat do logick²ch celk∙, p°i°azovat jim nßv∞stφ. U odkaz∙ a vstupnφch polφ m∙₧e b²t pomocφ atributu tabindex urΦeno po°adφ, v jakΘm budou postupn∞ aktivovßny p°i stisku tabulßtoru. K dalÜφm novinkßm jako rßm∙m, tabulkßm podle RFC 1942 a kaskßdovit²m styl∙m se podrobn∞ vrßtφme v rubrice "Vytvß°φme si domovskou strßnku". Vß₧n²m a odvß₧n²m zßjemc∙m o HTML nezb²vß ne₧ doporuΦit p°eΦtenφ samotnΘ specifikace na adrese http://www.w3.org/TR/WD-html40-970708/. Specifikace je oproti p°edchozφm verzφm mnohem lΘpe zpracovanß. Obsahuje p°ehlednΘ seznamy element∙ a jejich atribut∙. Navφc v nφ nalezneme i velice u₧iteΦn² ·vod do syntaxe jazyka SGML, kter² je pou₧it p°i deklaraci jednotliv²ch element∙ a jejich atribut∙.
| <<< | CW o Internetu | COMPUTERWORLD | IDG CZ homepage | |