• +49-(0)721-402485-12
Ihre Experten für XML, XQuery und XML-Datenbanken

Die Struktur eines XML-Dokumentes

Das Element ist das grundlegende Konstrukt eines XML-Dokuments. Ein Element besteht aus folgenden Komponenten:

  • Start-Tag
    Ein Start-Tag beginnt mit einer öffnenden spitzen Klammer, die vom Namen des Elementes, optional von Attributen und jedenfalls von einer schließenden spitzen Klammer gefolgt wird.
  • Inhalt
    Der Inhalt eines Elementes kann aus Text und verschachtelten Elementen bestehen.
  • End-Tag
    Ein End-Tag beginnt mit einer öffnenden spitzen Klammer und einem Schrägstrich, gefolgt vom Namen des Elementes und einer schließenden spitzen Klammer.

Wenn ein Element sowohl weitere Elemente als auch Text enthält, spricht man von gemischtem Inhalt, wie in folgendem Beispiel, in dem im Text Formatierungsanweisungen vorliegen:

<Befund>Mattheit, Fieber. Verdacht auf <em>schwere Grippe</em></Befund>

Für leere Elemente gibt es eine verkürzte Schreibweise. Folgende beiden Notationen sind äquivalent:

<Bett ID="Bett_reha_25_001" Zimmernummer="025"></Bett>
<Bett ID="Bett_reha_25_001" Zimmernummer="025"/>

Attribute bestehen aus Name und Wert(en), jeweils durch ein Gleichheitszeichen verbunden (im Beispiel Zimmernummer="025"). Der Wert muss in einfachen oder doppelten Anführungszeichen eingeschlossen sein. Ein Attributname darf pro Element nur einmal vorkommen. Während die Reihenfolge von Elementen Semantik trägt und nicht geändert werden darf, ohne dass sich das XML-Dokument ändert, ist die Reihenfolge der Attribute innerhalb eines Elementes beliebig vertauschbar.

Zum oben gezeigten Beispieldokument ist keine Strukturbeschreibung bekannt. Es ist also zwar wohlgeformt, aber nicht gültig. XML lässt dies ausdrücklich zu. Damit ein Dokument wohlgeformt ist, muss es nur wenige Syntaxanforderungen erfüllen. Die wichtigsten sind:

  • XML-Deklaration
    Ein XML-Dokument darf mit einer XML-Deklaration beginnen, die beispielsweise folgendermaßen aussieht:

    <?xml version="1.0" encoding="utf-8" standalone="yes"?>

    Dabei gibt das optionale encoding an, welcher Zeichensatz für das Dokument verwendet wurde, und die ebenfalls optionale standalone-Direktive, ob das Dokument externe Deklarationen enthält.
  • DTD
    Nach der XML-Deklaration kann die Sprachdefinition in Form der Document Type Definition (DTD) folgen.
  • Wurzelelement
    Ein XML-Dokument muss genau ein Element (auf oberster Ebene) enthalten (das normalerweise weitere Elemente enthält). Dieses wird als Wurzelelement bezeichnet.
  • Kommentare
    An jeder Stelle außerhalb des Markup, also auch vor und nach dem Wurzelelement dürfen Kommentare stehen. Ein Kommentar beginnt mit <!-- und endet mit -->.
  • Verarbeitungsanweisungen
    Eine Verarbeitungsanweisung ("processing instruction") gibt einer Applikation Hinweise, wie sie mit einem XML-Dokument umgehen soll. Bekannt ist die Verarbeitungsanweisung, die ein Stylesheet an ein XML-Dokument bindet:

    <?xml:stylesheet type="text/xsl" href="stylesheets/print.xsl" ?>

    Eine Verarbeitungsanweisung beginnt immer mit <? gefolgt vom Ziel (target) — hier xml:stylesheet —, anhand dessen eine Anwendung entscheidet, ob sie die Verarbeitungsanweisung interpretieren kann. Danach folgt der eigentliche Inhalt der Verarbeitungsanweisung und die abschließende Zeichenfolge ?>.

 

Quelle: "XQuery – Grundlagen und fortgeschrittene Methoden", dpunkt-Verlag, Heidelberg (2004)

<< zurückvor >>