Základy jazyka XML

Jiří Kosek


Obsah

Elementy
Atributy
Znakové entity
Kořenový element
Prohlížení XML
Kódování znaků
Automatická kontrola syntaxe
Komentáře
Sekce CDATA
Instrukce pro zpracování
A co bude příště?
Další zdroje informací

Abyste mohli vytvářet vlastní dokumenty v XML, musíte znát syntaxi tohoto moderního jazyka. Máte-li nějakou zkušenost s jazykem HTML, nebude pro vás její zvládnutí žádný problém. Narozdíl od HTML je však XML mnohem přísnější. Mnoho drobných chyb, které jsme mohli udělat v HTML kódu, nám XML neodpustí. V dnešním prvním díle seriálu o XML vás seznámíme se syntaxi jazyka a s tím, na co si při vytváření dokumentů dát pozor.

XML patří mezi značkovací jazyky (markup languages). Důležité části dokumentu se označují pomocí značek. V terminologii XML se jednotlivým označeným částem dokumentu říká elementy. Elementy do sebe mohou být navzájem vnořené a tím dle potřeby zachycovat strukturu informací uložených v dokumentu.

Kdybychom například do XML ukládali obsah knihy, skládal by se dokument z elementů kapitola. Každý element kapitola by pak obsahoval element nadpis a několik elementů pro odstavce. Příkladem z odlišné oblasti je uložení databázové tabulky do XML dokumentu. Dokument bude obsahovat několik elementů odpovídajících jednotlivým záznamům (řádkám) tabulky. Každý z těchto elementů pak samozřejmě bude obsahovat další elementy pro jednotlivé položky tabulky. Každý XML dokument se dělí postupně na menší a menší části.

Elementy

Elementy se v textu vyznačují pomocí tzv. tagů. Většině elementů odpovídají dva tagy – počáteční a ukončovací.

<para>Toto je obsah elementu para.</para>

Naše ukázka obsahuje jeden element para. Jeho obsah je vyznačen pomocí tagů <para> (počáteční tag) a </para> (ukončovací tag). Jen na okraj poznamenejme, že výše uvedená ukázka je asi nejjednodušší XML dokument, který vůbec můžeme vytvořit.

Názvy tagů se zapisují mezi znaky `<' a `>'. Ukončovací tag má před svým názvem ještě znak `/', aby se snadno odlišil od počátečního.

Obrázek 1. XML dokument se skládá jen z několika málo prvků

Některé elementy nemusejí mít žádný obsah. Můžeme je samozřejmě zapisovat tak, že za počátečním tagem uvedeme hned ten ukončovací.

<para>Toto je obsah elementu para.<br></br> A tohle taky.</para>

Není to však příliš pohodlné, a proto můžeme v XML použít ještě jednu variantu tagu, která říká, že element nemá žádný obsah. Za jméno elementu v počátečním tagu se uvede znak `/'. Ukončovací tag se pak už nepoužije.

<para>Toto je obsah elementu para.<br/> A tohle taky.</para>

Každý XML dokument musí obsahovat pro všechny počáteční tagy odpovídající ukončovací tag, nebo musí být počáteční tag zapsán jako element s prázdným obsahem. Následující ukázky jsou ukázkami špatných dokumentů, které nevyhovují specifikaci XML.

<para>Toto je obsah elementu para.<br> A tohle taky.</para>

Tag <br> není ukončen.

<para>Toto je obsah elementu para.<br/> A tohle taky.</oara>

Počáteční tag <para> není ukončen a k ukončovacímu tagu </oara> v dokumentu neexistuje odpovídající počáteční tag. Chybou rovněž je, když se elementy v dokumentu kříží.

<b>Ukázka <i>překřížení</b> elementů</i>
© Jiří Kosek 2000-2001