Přeložil: Miloslav Nič [MNaaaa]
Technologie správy dokumentů tradičně stavěla na základech počítačového systému souborů. Tím, že umožnila blíže charakterizovat uživateli jeho dokumenty, uložené v souborech, systémy pro správu dokumentů usnadňují skladování, vyhledávání a používání dokumentů v porovnání s klasickými systémy souborů.
Dlouho předtím, než kdokoliv pomyslel na XML, byly pro potřeby právních kanceláří vyvinuty systémy správy dokumentů, které pomáhaly kancelářím získat lepší kontrolu nad velkým množstvím produkovaných právních textů. Již první systémy nabízely mimo jiné následující jednoduché, ale velmi užitečné funkce:
Ve své podstatě, systémy pro správu dokumentů vytvářely z těchto dokumentů virtuální knihovny v počítači nebo na síti. Takové knihovny obsahovaly katalog, ve kterém byly skladovány uživatelské informace a ve kterém mohli uživatelé nalézt informace o dokumentech a o přístupu k nim. Takovéto databáze shromažďovaly následující informace o dokumentu:
Uživatelé, vyzbrojení databází, mohli nacházet informace intuitivnějším způsobem než prohledáváním různých adresářů s nadějí, že název souboru bude nějak odrážet to, čeho se dokument týká. Mnoho lidí tvrdí, že prvním úspěchem sysému správy dokumentů byl vznik "systému souborů uvnitř systému souborů".
Brzy byly do těchto systémů přidány další funkce. Tím, že byly tyto databáze obohaceny o další informace (metadata), tyto systémy mohly nabídnout i následující možnosti:
Tyto zásadní schopnosti systémů správy dokumentů měly ohromný úspěch a vedly ke vzniku multimiliardového obchodu, v jehož čele stály Documentum, Xerox, IBM a další.
XML, a jeho otec, SGML, poskytují nástroje nejen pro správu celých dokumentů, ale také jednotlivých informací, ze kterých se dokumenty skládají. To je umožněno některými pozoruhodnými vlastnostmi XML dat.
V XML jsou dokumenty a soubory na sobě nezávislé. Jeden dokument se může nacházet v mnoha souborech nebo jeden soubor obsahovat mnoho dokumentů. Zde leží ten dříve zmíněný rozdíl mezi fyzickou a logickou strukturou informací. XML data jsou v první řadě popsána logickou strukturou. V logické struktuře je prvořadý důraz kladen na povahu jednotlivých informací a na jejich vzájemné vztahy, pouze druhořadá je otázka vlastního fyzického uložení informace.
XML se nespoléhá na hlavičky souborů a jejich další charakteristiky, které závisejí na konkrétním prostředí, ale na vlastní značení dat. Kapitola v dokumentu není kapitolou proto, že se nachází v souboru s názvem kapitola1.doc, ale protože obsah kapitoly se nachází mezi tagy <chapter> a </chapter>. Protože jednotlivé prvky v XML mohou mít atributy, jednotlivé části dokumentu mohou být informačně samonosné, mohou popisovat samy sebe. Tak například v XML se můžete dozvědět velké množství informací o dané kapitole, aniž ji musíte číst, pokud její označení obsahuje dostatek atributů, jako například v <kapitola jazyk="čeština" téma="tržní ekonomika" revize="19980623" autor="Josef Polívka" školitel="Jana Nováková">. Když prvky obsahují sebe sama popisující metadata, systémy, které rozumí syntaxi XML, mohou s těmito informacemi nakládat stejně, jako tradiční systémy pro správu dokumentů. Je zde však důležitý rozdíl.
Značení v XML poskytuje metadata pro všechny složky dokumentu, nejen pro celý dokument. Díky tomu jsou jednotlivé informace stejně snadno spravovatelné jako jednotlivá pole v databázi. Jelikož XML data splňují sadu pravidel, tj. jsou správně formátovány, systémy pro správu dokumentů, které mohou číst a procházet XML data, s nimi mohou dále zacházet tradičním způsobem. Znamená to tedy, že funkce, dříve dostupné pouze pro celé dokumenty, je možné použít na každou označenou informaci v dokumentu.
Zaměření na informace spíše než na dokumenty poskytuje XML několik důležitých schopností
Ačkoliv standardní systémy umožňují do jisté míry opakované použití informací s pomocí sdílení souborů, informační systémy založené na XML nebo SGML mohou obsahovat společné informace, aniž by je musely uložit na několik různých míst.
Jelikož se lidé mohou více soustředit na jednotlivé informace než na celý dokument, tyto systémy dokáží identifikovat a vyhledat užitečné informace, které mají trvalou hodnotu i v dokumentech, jejichž časová platnost je omezená. Některé dokumety mohou být užitečné jen po krátký čas, jeho některé části však mohou být znovu využitelné a platné po mnohem delší dobu.
Jelikož jednotlivé informace v XML dokumentech jsou identifikovatelné, manipulovatelné a spravovatelné, informační technologie založená na XML může nalézt uplatnění v reálném životě například při překladech technických manuálů. (Připravujeme článek na toto téma).
Ačkoliv celý svět správy dokumentů směřuje ke strukturovaným informacím a k použití XML a SGML, tři společnosti dnes vynikají:
Tyto produkty se odlišují od konkurence svým využitím programů pro správu databází, které podporují objektově orientovaná data. Objektově orientovaná data, jak již bylo napsáno v jednom z dřívějších článků v této sérii, se dobře hodí ke struktuře XML dat, a databázové systémy, které takovým datům rozumí, jsou dobře adaptovány pro práci s XML informacemi.
Na druhé straně i další produkty pro správu informací, které pracují s XML nebo SGML daty, využívají relační databáze a poskytují vlastní objektově orientovaná rozšíření těchto databází tak, aby byly schopné porozumět objektově orientovaným datům XML nebo SGML, získaly úspěch a pozici na trhu. Tito výrobci spadají do této druhé kategorie: