XML -- staronový formát

Už jsme si asi zvykli na překotný vývoj v oblasti informačních technologií. Vždyť kdo z nás znal před třemi lety pojmy jako Java, MP3 nebo XML? Při podrobnějším pátráním však zjistíme, že za všemi novinkami stojí dlouholetý vývoj. I přesto vás asi překvapí, že historie XML je více jak třicetiletá.

V šedesátých letech řešila firma IBM problém ukládání velkého množství právních dokumentů. Potřebovala vymyslet formát, který by měl dlouhou životnost, nebyl závislý na používaných programech atd. Výsledkem jejich snažení byl obecný značkovací jazyk, který se v praktickém nasazení osvědčil. Jazyk se postupně rozšiřoval, až se z něj v roce 1986 stal jazyk SGML (Standard Generalized Markup Language), který byl přijat za ISO normu s číslem 8879. SGML bylo velice flexibilní, aby vyhovělo různým požadavkům. To byla jeho velká přednost, ale zároveň i největší slabina. Vývoj aplikací, které by plně podporovaly SGML, byl velice nákladný. SGML se proto používalo převážně na velkých projektech jako byla dokumentace ke zbrojním systémům americké armády nebo například technická dokumentace letadel Boeing.

První masově rozšířenou aplikací SGML byl jazyk HTML. Jazyk HTML byl zpočátku malou množinou tagů, které umožňovaly vytvářet hypertextové dokumenty. Výrobci prohlížečů postupně HTML rozšiřovali, aby se zavděčili uživatelům, kteří měli stále větší požadavky. Začaly tak vznikat problémy s kompatibilitou, které vyústily v nutnost vytvářet stránky v několika verzích pro různé verze prohlížečů.

Konsorcium W3C se snažilo tomuto trendu zabránit tím, že by právě pomocí SGML přesně definovalo, které tagy a kde mohou webové stránky obsahovat. Vznikly tak postupně jazyky HTML 2.0, HTML 3.2 a HTML 4.0. Výrobci prohlížečů však stále přidávali nové tagy a působili tím značné komplikace především autorům stránek.

Bylo jasné, že současný stav je neudržitelný a že Web potřebuje novou technologii, která by byla mnohem flexibilnější než HTML. Výsledkem práce několika předních odborníků byl jazyk XML, jehož finální verze byla publikována v únoru 1998. Jazyk XML je zjednodušenou podmnožinou SGML. Byl tak odstraněn největší problém SGML -- přílišná složitost. Flexibilita však zůstala zachována, a tak XML narozdíl od HTML umožňuje tvorbu dokumentů s vlastními tagy a s možností validace dokumentů oproti DTD.

Po třiceti letech se tak na stoly běžných uživatelů dostává vyzrálá technologie. Určitě se nemusíme bát, že za rok nadšení opadne a XML již bude jen minulostí. Vlastnosti XML předurčují tento jazyk jako vhodný nástroj pro uchovávání informací, na kterých nám opravdu záleží. Díky své otevřenosti se nám nestane, že XML-dokument otevřeme jen v jednom programu od jedné firmy.

© Jiří Kosek 1999