[Arbortext, Inc. - http://www.oasis-open.org/html/xml-for-managers.htm ]

XML pro manažery (Porovnání SGML a XML z pohledu manažera)

Přeložil: Miloslav Nič [MNaaaa]

Úvod

V roce 1986 se stal SGML (standardní zoběcněný značkovací jazyk) mezinárodním standardem pro formátování textu a dokumentů a v testu času obstál. Jeho obliba rychle roste v organizacích, které produkují, spravují a distribuují velké množství dokumentů. Distribuci SGML dokumentů přes WWW však brání řada překážek. K těmto překážkám patří absence široce podporovaných tabulek stylů, potřeba komplikovaného software (SGML obsahuje velké množství funkcí) a problémem je i kompatibilita mezi různými softwarovými balíky zpracovávajícími SGML.

HTML (hypertextový značkovací jazyk) se stal všudepřítomným formátem WWW. Zatímco je HTML neocenitelný pro zpřístupnění jednoduchých dokumentů přes WWW, jeho jednoduchost je vyvážena různými omezeními a tím i podstatně stoupá finanční náročnost při jeho použití v komplexních webovských aplikacích.

Běžné prohlížeče nepodporují SGML a tak aplikace, které vnitřně využívají SGML, musí nejdříve převést data do formátu HTML a až poté je přenášet po webu. Touto transformací se ale ztrácí velké množství popisných dat, které obsahoval původní SGML dokument. Bez těchto popisných dat se téměř vytrácí flexibilita přenášených informací. Je nyní velmi obtížné tyto informace znovu využít, s někým dalším vyměňovat nebo automatizovat jejich zpracování.

XML (rozšiřitelný značkovací jazyk) je vytvářen tak, aby umožnil přenos SGML informací přes web a tak překonal omezení HTML. Pozornost, kterou si získává toto úsilí zaručuje, že se XML bezpochyby stane všudepřítomnou technologií pro velmi hodnotné a všestranné obchodní aplikace na Internetu, intranetech i extranetech.

XML: SGML pro WWW

XML je vysoce funkční podmnožinou SGML. Úkolem XML je vytvoření takové podmnožiny SGML, která bude umožňovat bezproblémový přenos SGML informací přes web. Ve chvíli, kdy budou hlavní WWW prohlížeče podporovat XML, bude, jak věříme, velmi snadné na webu publikovat SGML informace.

XML je téměř nerozeznatelný od běžného použití SGML. XML má téměř všechny schopnosti SGML, které jsou běžně podporovány v programech. Některé důležité schopnosti, které mají vliv zejména na vytváření dokumentů, nikoliv však na jejich přenos, XML ovšem chybí. Účelem XML totiž není nahrazení SGML ve všech jeho aspektech. Jak uvidíte, SGML zůstává vhodnou technologií pro vytváření a skladování informací.

Vynálezci XML

XML je vytvářeno pracovní skupinou W3C, organizací, která si klade za úkol stanovovat specifikace webových technologií tak, aby byla zajištěn co největší stupeň užitečnosti a vzájemné kompatibility.

XML pracovní skupina se skládá ze 14 společností a organizací, které mají velký zájem na poskytování nebo používání XML nástrojů. Tato skupina zahrnuje Adobe, ArborText, DataChannel, Fuji Xerox, Hewlett-Packard, Inso, Isogen, Microsoft, Netscape, SoftQuad, Sun Microsystems, a University of Chicago, spolu s Danem Connolly, zástupcem W3C a Jamesem Clarkem, nezávislým expertem.

Rostoucí podpora XML

Podpora XML narůstá překvapujícím tempem od chvíle, kdy v září 1996 začala práce na vývoji této specifikace:

Již nyní je zřejmé, že XML se stane primárním prostředkem pro přenos velkého množství SGML informací, které již v soušasnosti existují. Je velmi pravděpodobné, že intranety a extranety budou založeny na XML a tím využijí sílu Internetu ve velkých podnikatelských aplikacích.

HTML: technologie dnešního WWW

HTML je současný velmi populární značkovací jazyk pro přenos dokumentů přes web. Proč je tak oblíbený? Proč surfuje web desítky miliónů lidí? Jak se mohly na webu objevit tak rychle stovky tisíc míst?

Následující odstavce podrobně vysvětlují důvody, proč je HTML tolik populární.

Velmi jednoduchý - HTML umožňuje velmi jednoduché surfování po webu, většina lidí se může všemu naučit sama. Vše, co je nutné se naučit je klikání na modrý, podtržený text. A každý, kdo se chce naučit vytvářet jednoduché WWW stránky, pochopí základy HTML za několik hodin.

Vestavěné styly - Formátovací instrukce pro zobrazení na obrazovce jsou rovněž velmi jednoduché. Ačkoliv má HTML formátování řadu nedostatků, poskytuje mnohem lepší možnosti, než obyčejný text, který byl dostupný na Internetu před nástupem HTML a WWW. Omezenost HTML formátování vlastně usnadňuje publikování na webu, protože se nemusíte zabývat vyvážením několika sloupců, přesným umísťováním obrázků, atd.

Jednoduché a standardní odkazy - flexibilní a účinné hypertextové odkazy v HTML jsou snadno vytvořitelné, ale také mají svá omezení, které komplikují jejich nasazení ve větším měřítku.

Podpora formulářů - S HTML můžete vytvářet jednoduché formuláře. Dnešní programy pro psaní HTML vám umožní vytvořit první vlastní formulář za jednu či dvě hodiny. A jakmile vytvoříte první formulář, ty další už vám půjdou mnohem rychleji.

Jednoduché programování - S HTML můžete psát jednoduché CGI skripty a tedy velmi snadno programovat. Ačkoliv s nimi neuděláte vše, velmi snadno dosáhnete slušných výsledků.

Proč HTML nestačí

HTML je velmi účinný nástroj, má však také několik omezení, která se stávají zřetelnějšími při přechodu na komplikovanější a rozsáhlejší domovské stránky a menší WWW servery. Následující odstavce se věnují této problematice podrobněji.

Omezená struktura - Většina omezení HTML má společný zdroj, omezenou sadu tagů, která je v první řadě určena pro specifikaci formátování dokumentů přenášených přes web. Jinými slovy, prvky HTML podporují pouze omezený počet jednoduchých struktur.

Tato omezení má HTML společná s dalšími formátovacími značkovacími jazyky, jakým je RTF, který byl vytvořen pro přenos dokumentů určených pro tisk. Jedním z důvodů vzniku SGML byla snaha o oddělení informací od jejich formátování, tak, aby bylo možné informace označovat nějakým účinným a rozšiřitelným mechanismem.

Malá strukturovanost HTML vytváří významné překážky při použití HTML v aplikacích, které jsou komplikovanější než jednoduché surfování, jako je opakované využití informací, jejich výměna a automatizace. O všem se dočtete níže.

Omezené opakované využití informací - Mnoho organizací publikuje stejné informace řadou různých způsobů. Je velmi běžné, že jsou data publikována zároveň v tištěné formě a na WWW. Informace, které byly původně vytvořeny v HTML mohou být znovu využity při tisku a informace, původně určené pro tisk, mohou být znovu publikovány na webu.

Abychom dosáhly požadovaného výsledku, je ovšem třeba dokumenty nejdříve převést do nové podoby a poté ručně upravit jejich vzhled (tedy formátování konečného dokumentu). A to znamená, že po každé změně zdrojových informací musí následovat konverze a ruční úprava. To je drahé a náročné na čas i práci a představuje jeden z důvodů, proč SGML začaly používat organizace, které potřebují přenášet velká množství dat.

Omezená výměna - Protože je Internet jednoduchý a všudepřítomný, představuje ideální prostředí pro organizace, které si potřebují vyměňovat data. HTML ale podminovává tuto výměnu svou malou a fixovanou sadou tagů, které z velké většiny pouze určují konečný vzhled dokumentu. HTML nám nedává možnost označit si data uvnitř dokumentu a tím jsou možnosti jejich opětovného použití velmi omezeny.

Výrobce počítačů může mít například záměr získat data o používaných polovodičích od svých dodavatelů a použít je pak v systému CAD (design s pomoci počítače).

Omezené možnosti automatizace - automatizace šetří práci, omezuje náklady, urychluje přenos a zlepšuje kvalitu. Existuje mnoho možností, jak automatizovat používání webu, zejména v případě internetů a extranetů. Příkladem mohou být téměř všechny aplikace založené na formulářích, jako je pojišťovací agenda nebo on-line bankovnictví.

HTML ovšem klade automatizaci do cesty významné překážky. Všechny vysoce automatizované procesy jsou založeny na datových formátech majících velké vyjadřovací schopnosti a jsou naprosto konzistentní. Vyjadřovací schopnosti HTML jsou nedostatečné, neboť jsou omezeny pevně stanovenou sadou formátovacích prvků a HTML rovněž nesplňuje požadavek naprosté konzistence, protože neexistuje způsob, jak si vynutit rigorózní strukturu dat z těchto prvků složených.

Prohledávání produkuje příliš mnoho zásahů - Jednou z nejcennějších schopností webu je možnost jeho prohledávání podle klíčových slov. S tím, jak množství informací dostupných na webu stoupá do závratných výšek, množství dat, která navrací běžný dotaz se zvýšil do nepoužitelných proporcí. Každý, kdo hledá nějakou informaci, si musí vybrat ze dvou možností. Buďto klást otázky tak úzce zaměřené, že vynechávají i podstatné informace, a nebo klást otázky obecné, potom je však nemožné všechny zásahy prohlédnout.

Důvod, proč prohledávání webu poskytuje příliš mnoho zásahů, spočívá v tom, že obvykle prohledáváme veškerý obsah každé stránky. Ačkoliv můžeme otázky omezit na to, že budou prohledávány pouze názvy, takovéto dotazy téměř jistě neobjeví řadu relevantních informací.

Jedním z nejlepších způsobů, jak vylepšit prohledávání webu, je používání prvků, které budou specifické pro daný obsah. Tak například slovo "kůň" by mohlo být označeno jako název zvířete nebo gymnastické náčiní. Dotazy na slovo kůň by tedy mohly být omezeny na oblast biologie nebo sportu.

Pohyblivý cíl: HTML 2.0, ..., 3.2, ..., 4.0 ... ??? - Protože je HTML standard, který se vyvíjí, jeho schopnosti se neustále rozšiřují novými tagy. Každý, kdo udržuje velké množství informací ve formátu HTML, musí obvykle znovu prohlédnou a přeznačkovat data poté, kdy je přijat nový standard. Mnoho webových správců je ve skutečnosti rádo, že Microsoft a Netscape již neobměňují své prohlížeče tak rychle, takže nemusí své stránky tak často přeznačkovávat.

Aby se vyhnuly těmto problémům, mnoho organizací vytváří svá data v SGML a teprve pak je převádí do HTML. Zatímco převaděč ze SGML do HTML může být přepsán během několika hodin, přeznačkování stovek nebo tisíců stránek může být otázka řady týdnů.

SGML: otec HTML a bratr XML

SGML (standardizovaný zobecněný značkovací jazyk) specifikuje pravidla pro tvorbu specializovaných značkovacích jazyků jako je HTML. Jinými slovy, HTML je aplikací SGML. HTML představuje jednu sadu tagů, zatímco SGML dává možnost vytvářet libovolnou požadovanou sadu. XML se podobá SGML tím, že umožňuje vytvářet libovolné prvky.

Výhody SGML by měly být čtenáři známy, tento článek je podrobně nepopisuje. Nicméně, následující seznam nám tyto výhody připomene:

Omezení SGML pro přenos informací po webu

SGML nemůže nahradit nebo alespoň doplnit HTML pro přenos dat po webu, protože jeho nasazení brání závažné překážky, které budou posány v následujících odstavcích.

Nulová podpora v běžných prohlížečích. - Hlavním probléme SGML je fakt, že se jej nikdy nepokusily implementovat hlavní dodavatelé prohlížečů. Ani Internet Explorer ani Netscape Navigator neobsahují podporu SGML. Stejný důvod, který činí SGML tak cenným je i příčinou tohoto faktu. SGML nabízí tolik možností, že nástroje, které je dokáží všechny využívat, jsou velmi komplikované. Dokonce i přední výrobci SGML programů, jako je ArborText, nepodporují 100% možností, které dovoluje SGML standard.

Jelikož prohlížeče podporují pouze HTML, organizace, které chtějí publikovat své SGML informace na webu, obyčejně používají automatickou konverzi ze SGML do HTML. Tato procedura poskytuje přijatelné výsledky u jednoduchých zobrazovacích aplikací, ale za cenu "zhloupnutí" dat, takže výměna informací a automatizace je mnohem obtížnější.

Původcem těchto obtíží je skutečnost, že při převodu ze SGML do HTML se ztrácí významné množství informací, tím je však prakticky znemožněna rekonstrukce původního významu SGML souborů, pokud je k dispozici pouze HTML soubor.

Jedná se o podobnou situaci, jako když transformujete CAD nákres do GIF souboru pro publikaci na webu. Zpětně rekonstruovat původní CAD soubor z GIF obrázku je s výjimkou těch nejprimitivnějších příkladů prakticky nemožné.

Žádná podpora stylů - další překážkou pro použití SGML na webu je to, že SGML pouze standardizuje strukturu, ale neposkytuje žádnou podporu stylů. Bylo zde již několik pokusů o ustanovení standardu pro tabulky stylů, zejména FOSI (Specifikace formátování výstupních dokumentů) a DSSSL(Semantika stylu dokument a specifikační jazyk), všechny tyto standardy jsou však podporovány jen velmi omezeně nebo vůbec. Následkem toho neexistuje žádný standardně uznávaný stylový formát pro vyjádření SGML informací.

XML = SGML s malými změnami

XML bylo vynalezeno proto, aby umožnilo přenos SGML informací na webu. XML odstraňuje omezení SGML v prostředí webu, avšak zachovává všechny jeho výhody.

XML se mnoha způsoby liší od SGML, ale jen málo z nich je podstatných z hlediska podnikového manažera. Schopnosti SGML, které byly odstraněny z XML jsou ty, které nemají žádný vliv na přenos strukturované informace přes web, některé jsou ale velmi podstatné při jejich tvorbě.

Je možné, že další revize XML některé nebo všechny vynechané schopnosti doplní. V mezičase vás bude kontinuální používání SGML izolovat od změn v XML.

Následující odstavce vysvětlují důležité rozdíly mezi XML a SGML a jejich implikace.

DTD není povinné - pro zpracování SGML dat musí mít zpracovávající aplikace k dispozici DTD i data. XML naproti tomu DTD při zpracování potřebovat nemusí.

Aby použití DTD nebylo nutnou podmínkou, XML implicitně obsahuje vodítka, která naznačují strukturu dat. Tato vodítka způsobila drobné změny v datovém formátu SGML.

Webovské prohlížeče rozumějící XML, to je pouze jeden příklad XML aplikace. Další takovou XML aplikací může být doplněk bankovního systému, který může přijímat finanční transakce založené na XML a přeměnit je na instrukce pro ukládání a vybírání vkladů. Tím, že DTD není vyžadováno v průběhu zpracovávání, se šetří nejen propustnost sítě, neboť DTD nemusí být přenášeno, ale je také zjednodušena konstrukce a zmenšena velikost zpracovávajících aplikací, protože na nich není vyžadována interpretace DTD.

To, že je DTD eliminováno neznamená, že je snažší vytvořit XML aplikace než SGML programy, v případě, že vám záleží na pravidelné struktuře. Pro jistý druh informací, jako je neformální komunikace nebo tvorba příležitostných dokumentů může být práce bez DTD výhodou. Ale pro naprostou většinu informací, které jsou v současnosti uloženy v SGML, což jsou většinou data s pravidelnou strukturou a vytvořená ve formálním procesu, zůstává DTD základem.

Jinými slovy, abyste získali všechny výhody, které tradičně spojujeme se SGML, opakované použití, výměnu a automatizaci, budete DTD stále používat i při tvorbě XML, neboť tak zajistíte naprostou konzistenci vašich dat, která je podmínkou pro využití všech výhod. A to znamená, že implementace SGML a XML bude obdobně obtížná. Hlavním přínosem XML v nejdůležitějších podnikových aplikacích bude zjednodušení přenosu strukturovaného textu a dokumentů přes web.

Správné formátování - Ačkoliv může být XML přenášeno bez DTD, XML dokument musí stále být "správně formátovaný". A aby byl správně formátovaný, musí dokument splňovat několik podmínek. Tak například správně formátovaný XML dokument musí obahovat alespoň jeden pár tagů, pokud nějaký prvek začíná v jiném, musí v něm i končit a musí mít počáteční i koncový tag, všechny použité entity musí být deklarovány. Takovéto podmínky kladou jen celkem jednoduché požadavky na XML aplikace, které neprovádí validaci podle DTD.

Výjimky - vsuvky a vynechávky umožňují určovat výjimky v modelu vašich dat. Tak je například můžete použít v případě, že chcete, aby odstavec mohl obsahovat odkaz na poznámku pod čarou, pokud se ovšem on sám pod touto čarou nenachází. To je důležité, protože mnoho aplikací nemusí být schopno zpracovávat nečekané požadavky. Co například udělá sazečský software, který narazí na podobný příklad? To, že XML výjimky nepodporuje je jeden z hlavních důvodů, že velká část průmyslově využívaných DTD nebyla dosud nahrazena XML.

AND - XML nepodporuje AND (&). To znamená, že v XML nemůžete specifikovat, že autor může vkládat prvky v libovolném pořadí, ale musí je vložit všechny. To například znamená, že nemůžete specifikovat titulní stránku, na které má být uveden název, případný doplňující název a autoři, a to v libovolném pořadí.

Nepřítomnost AND bude mít velký význam pro některé průmyslové výměnné DTD, které často nevynucují pořadí prvků, zatímco jsou důsledné v tom, že prvky musí být kompletní. Mezipodniková DTD často ponechávají vlobu pořadí na implementátorech v jednotlivých podnicích za použití (A&B&C) s tím, že tyto lokální DTD si zvolí vlastní pořadí. Bez AND musí DTDuvolnit svoji kontrolu na ((A|B|C)+), tedy některé prvky mohou být vynechány, nebo zpřísnit na přesné pořadí (A,B,C).

AND modely mají vždy ekvivalent, který může být použit, ale tento ekvivalent může být příliš rozsáhlý na to, aby byl praktický.

SDATA interní entity - Pokud máte malé množství systémově specifických informací, jak jsou matematické symboly nebo jiné znaky, které jsou specifické pro vaši aplikaci, SGML je vám dovoluje definovat SDATA interními entitami. Ačkoliv se počítalo s tím, že tyto entity budou záviset na systému, mnohé SGML nástroje podporují jejich běžnější zástupce. XML tyto možnosti neposkytuje.

XSL: Styl pro XML

Z XSL (rozšiřitelné tabulky stylů) iniciativy vybíráme následující:

Založeny na DSSSL - Poté, co se z SGML stal mezinárodní standard, začaly práce na vývoji tabulek stylů. Účelem tohoto standardu bylo usnadnění výměny tabulek stylů a vylepšení kompatibility veškerého software, který zachází s dokumenty. Toto úsilí, které se formálně nazývá Semantika stylů dokumentu a specifikační jazyk (DSSSL), nakonec vedlo k přijetí ISO standardu. Až dodnes však nevznikla jediná komerční aplikace, která by podporovala DSSSL. XSL poskytne velkou část funkcí DSSSL, ale ve formátu, u nějž je mnohem větší šance na univerzální podporu.

Kompatabilní s CSS - Tabulky kaskádových stylů (CSS) jsou podporovány společnostmi Microsoft a Netscape, neboť poskytují mechanism pro změnu přednastavených parametrů HTML tagů. Výsledkem je, že CSS poskytuje HTML větší formátovací volnost. XSL bude nadmnožinou funkcí CSS. XSL bude umožňovat automatickou konverzi z CSS, takže existující investice do CSS nebudou ztraceny.

Možnost měnit pořadí - s pomocí tabulek XSL bude možné v prohlížeči změnit pořadí, ve kterém se zobrazují data bez toho, aby se musel zapojit server. To bude užitečné v aplikacích, které umožňují interaktivní potlačení nebo naopak povolení zobrazení dat.

Větší zohlednění kontextu - Zatímco v CSS je možné aplikovat různý styl podle rodiče prvku, v XSL je možná mnohem podrobnější specifikace. Tím bude formátování mnohem flexibilnější.

Podpora formátování on-line i při tisku - zatímco CSS je omezeno na on-line zobrazení, XSL bude podporovat formátovací funkce, které jsou potřebné při formátování složitějších tištěných dokumentů.

XLL: lepší odkazy pro XML

Z XLL (rozšiřitelný odkazovací jazyk) vybíráme:

Využívá zkušeností HyTime a TEI - XLL bude vystavěn na základech odkazovacích možností HyTime a TEI. Zatímco tyto standardy nebyly ve větší míře implementovány poskytovateli software, výrazně zvyšují možnosti standardního HTML odkazování a mají i další funkce, které přesahují rozsah XLL.

Kompatabilní s existujícími URL odkazy - XLL bude plně podporovat současné odkazovací formáty na webu.

Obousměrné odkazy - Obousměrné odkazy umožní uživateli přejít z jednoho dokumentu do druhého a z druhého zase do prvního.

Adresace - XLL umožní přesně odkázat na určité místo v cílovém XML dokumentu.

Nepřímé odkazy - Nepřímé odkazy podstatně zlepší možnosti při údržbě velkých kolekcí webových dokumentů. Pokud v současnosti cíl, ke kterému odkaz směřuje, změní svoji adresu, musí být pozměněn i dokument, který obsahuje tento odkaz. Uvažujme jednoduchý případ, ve kterém dokument na serveru v Seattle odkazuje na dokument v Detroidu. Pokud se poloha dokumentu v Detroidu změní, musí se opravit i daný dokument v Seattle. Je pravděpodobné, že k povolení takových změn je třeba získat souhlas z různých zdrojů, takže lidé spolu musí manuálně komunikovat a koordinovat svůj postup. V případě komplexních struktur webovských stránek to představuje noční můru, která zahrnuje vysoké náklady a frustraci uživatelů.

Nepřímé odkazy tento problém řeší. S pomocí XLL budou odkazy nepřímé, přes zprostředkovatelský soubor odkazů. Pokud soubor změní polohu, bude stačit opravit tohoto prostředníka, zdrojový i cílový soubor zůstávají nezměněny.

Je XML snažší než SGML?

Tato otázka z názvu kapitoly je velmi běžná. Jestliže je odpověď kladná, proč nepoužívat pouze XML a na SGML zapomenout?

A tady je odpověď: Pokud jste softwarový vývojář, budete určitě uvažovat o aplikacích založených na XML místo SGML. Pokud ale publikujete na Internetu a na papíře, nebo pokud vytváříte velké intranetové/extranetové aplikace, potom XML a SGML jsou stejně snadné. Podívejme se na oba druhy aplikací.

Vývoj software - není pochyb o tom, že některé nástroje, které podporují XML, budou snáze programovatelné. Pokud jste softwarový vývojář a chcete použít XML jako formát pro výměnu dat, naleznete volně dostupný parser, který dokáže prozkoumat tok XML dat. Pak vám zbývá napsat malý program, který nalezne ty XML prvky, které potřebujete, a předá je vaší aplikaci. Tento kód bude mnohem kratší než v případě SGML, který musí procházet DTD (a DTD není ve formátu XML, takže potřebujete další parser) spolu s vlastními daty. A jelikož XML nemá téměř žádné volitelné možnosti, jen velmi malá část vašeho kódu se jimi bude zabývat.

Protože můžete získat volně dostupný SGML parser stejně snadno jako parser XML, možná přemýšlíte, proč je ten rozdíl vlastně důležitý. V sitaci, kdy vám postačuje volně dostupný parser je jediným rozdílem velikost kódu a rychlost. SGML parser je mnohem větší a mírně pomalejší. Mnoho aplikačních vývojářů, zejména v oblastech netýkajících se dokumentů, davá přednost vlastním parserům. A v případě SGML je to příliš velký úkol.

Tvorba a přenos - pokud hodláte vytvořit databázi skládající se z různých komponent dokumentů, které můžete snadno opakovaně používat, vyměňovat a automatizovat, potom XML není o nic snažší než SGML. Pro takové aplikace stále potřebujete provést předběžnou analýzu požadavků a zajistit striktní dodržování pravidel, abyste udrželi naprosto konzistentní datový formát.

XML pro aplikace nepracující s dokumenty

Jednou z nejintenzívněji se rozvíjejících XML aktivit je přenos dat při finančních a podnikových transakcích, které nemají žádné spojení s typickými HTML aplikacemi. Je tomu tak proto, že XML je ve své podstatě jen velmi flexibilní datový formát, který dokáže zachytit velkou škálu informací.

Očekává se, že XML bude používáno v aplikacích, jako je tvorba a spravování finančních transakcí zákazníků, zdravotních záznamů a pojišťovacích kontraktů. XML ve skutečnosti rozmaže hranici mezi aplikacemi orientovanými na dokumenty a transakce a zvýší možnosti poskytovatelů informací přenášet informace vyladěné podle potřeb jednotlivých uživatelů.

Závěr: kdy použít XML a SGML

Za jakých okolností a za jakým účelem byste měl použít SGML?

HTML versus XML: příklad aplikace

Tato kapitola demonstruje sílu XML v porovnání s HTML pro přenos informací po webu.

Řekněme že vyrábíte vodovodní baterie a nabízíte jejich katalog na webovské stránce. V XML můžete přidat tagy, popisující jejich specifika. Tak například můžete používat následující prvky:

Na základě těchto a dalších prvků vytvoříte technickou specifikaci každé baterie, kterou vyrábíte. Abyste takovou specifikaci mohli vytvořit, budete muset vytvořit systém, který dokáže nalézt některé potřebné informace, jako jsou rozměry a ceny z klasické databáze a další údaje, jako je popis a seznam funkcí a výhod, použije z databáze dokumentových fragmentů.

Tyto tagy, specifické pro danou aplikaci, poskytují několik výhod:

Automatizace - Můžete vytvořit řadu funkcí, které budou automatizovt vaše webovské stránky a generovat odkazy do transakčních aplikací. Můžete například naprogramovat funkci, která způsobí, že kliknutí na modelové číslo baterie vyvolá na obrazovce objednávkový formulář, nebo s využitím on-line formuláře umožnit prohledávání katalogu podle specifikací uživatele.

Přesné prohledávání - Pokud další výrobci baterií budou používat stejný systém prvků, potom lidé, kteří hledají nějakou informaci o bateriích, mohou vytvořit takový dotaz, který nalezne všechny relevantní informace a jen minimum těch nerelevantních. Pokud chcete například koupit chromovou baterii do koupelny, můžete použít vyhledávací program rozumějící XML, který bude vyhledávat podle jednotlivých prvků (např. baterie, povrch, místnost) a jejich obsahu (např. koupelna, chromování).

Tyto výhody může XML nabídnout za dvou předpokladů:

V některých odvětvích průmyslu, jako je letecký a automobilový průmysl, výroba hardware a software, telekomunikace a nákladní doprava, již došlo k dohodě o používání standardní sady prvků. Ačkoliv je toto úsilí založeno na SGML a ne XML, téměř vše může být implementováno i do světa XML.

Výměna - Stavební firmy mohou získat informace o bateriích přímo z webu a tato data přímo importovat do vlastních programů pro odhad cen nebo konstrukčního software, aniž by se musela data manuálně zadat přes klávesnici.

Ochrana před změnami prohlížečů - Místo toho, abyste vkládali formátovací instrukce přímo do vašeho dokumentu, můžete specifikovat formátování v oddělené tabulce stylů. Tato "nezávislost na prezentaci" (stejně jako v SGML) umožňuje provést zadávání tagů pouze jednou. Pokaždé, kdy se objeví nová verze prohlížeče s novými zobrazovacími možnostmi, postačí změnit tuto stylovou tabulku a vlastní data zůstanou nedotčena.

V našem příkladě s bateriemi, pokud jste potřeboval změnit zobrazení daného druhu baterie ze 14 bodové tučné Helvetiky na zelený 16 bodový Ornamental, postačilo vám změnit tabulku stylů.

Abychom sumarizovali implikace tohoto příkladu, organizace, které uvažují o použití XML místo HTML by měly sledovat následující charakteristiky svých dat: