Verze XML

  • v praxi se používá téměř výhradně verze 1.0

  • existuje verze 1.1, která se v praxi vůbec neujala, ale vznikla spíše kvůli „politické korektnosti“

    • jména elementů a atributů mohou používat téměř jakýkoliv znak z Unicode včetně budoucích verzí Unicode (to je ale možné i v posledním pátém vydání XML 1.0)

    • jako znak konce řádku lze používat i znaky NEL (…) a unicodový oddělovač řádek (
)

    • v dokumentu mohou být použity i znaky s kódem 1 až 31, ale musí být zapsány jako číselný odkaz na znak

    • řetězce uvnitř dokumentu by měly být normalizované (NFC) – tj. preferuje se znak s diakritickým znaménkem, ne znak a za ním kombinující diakritické znaménko

  • pragmatický přístup:

    • přijímat dokumenty v obou verzích v libovolném kódování

    • generovat dokumenty ve verzi 1.0 a v kódování UTF-8

  • podmnožiny XML

    • obecně není dobré je vytvářet a používat

    • SOAP – nepodporuje entity a instrukce pro zpracování