Entscheidungshilfe: Daten richtig mit XML verwalten
XML-Datenbanken – Technik für die Zukunft?

Big DataData & StorageIT-ManagementIT-ProjekteNetzwerk-ManagementNetzwerke

XML-Datenbanken sind schon lange kein Marketingtrick mehr. Sich aber für die richtige Art von Lösung zu entscheiden, benötigt ein Grundverständnis der Funktionsweise unterschiedlicher Ansätze. Ein Streifzug durch Techniken und eine Sammlung von Entscheidungshilfen.

Verschiedene Datenverwaltungs-Ansätze für verschiedene Zwecke

Entscheidungshilfe: Daten richtig mit XML verwalten

Nachdem schon seit längerer Zeit jedes Textverarbeitungsprogramm, das etwas auf sich hält, Texte auch im XML-Format abspeichert, konnte es nicht ausbleiben, dass auch Datenbankhersteller diese Funktion entdecken. Schon allein die schiere Menge an XML-Dokumenten bietet dafür eine überzeugende Basis.

Glaubt man den Herstellern, wird mit XML-Datenbanken die Bereitstellung von Daten im Internet zum Kinderspiel. Vorbei die Zeiten, in denen Werkzeuge wie Java, C++, Perl und andere Tools in die Bresche springen müssen, um Datenbankinformationen im Internet bereitzustellen. Das trifft so nicht zu. Trotzdem bieten sie Vorteile bei der Verarbeitung der Rohdaten. Man unterscheidet zwei Typen von XML-Datenbanken:
XML-fähige Datenbanken (XML-enabled). Es handelt sich hier meist um relationale Datenbanken, die um Programme erweitert wurden, die XML-Dateien verarbeiten und in das jeweilige interne Datenformat der Datenbank konvertieren und umgekehrt.

Reine XML-Datenbanken (Native XML). Diese bauen grundsätzlich auf das XML-Format auf und benötigen deshalb keine Übersetzung der Daten in ein anderes Format. Dieser Typ wird auch als NXD (Native XML Database) bezeichnet.

Zur Verwirrung trägt oft bei, dass beide Typen unterschiedslos auch als XDBMS oder XML Data Server bezeichnet werden. Und obwohl XML-Datenbanken schon seit einigen Jahren auf dem Markt sind, sind wichtige Fragen gleich geblieben: Wer braucht welche XML-Datenbank? Was sind die Vor- und Nachteile bei beiden Modellen? Wie verhält es sich mit den Standards?

Eine weitere Entscheidungshilfe kann die Unterscheidung zwischen Daten- und Dokumentzentrierter XML-Dateien bieten. Die Informationen eines Reisepasses entsprechen dabei den datenzentrierten Typ, der angeblich mehr für relationale Datenbanken mit XML-Erweiterung geeignet ist, während dokumentzentrierte Daten mit unterschiedlichen Textinhalten, wie sie etwa bei Amazon üblich sind, eher für reine XML-Lösungen geeignet sein sollen. Durch neue Techniken bei beiden XML-Datenbanktypen hat dieser Aspekt jedoch an Bedeutung verloren.

Den XML-enabled Produkten wird nachgesagt, dass sie, was Performance anbelangt, hinter den reinen XML-Datenbanken zurückbleiben. Diese “Trägheit” resultiert aus der doppelten Arbeit: Die XML-Datei muss zuerst in das jeweilige Datenbankformat umgewandelt werden, bevor es verarbeitet werden kann. Das gilt auch für den umgekehrten Weg, wenn das jeweilige Datenbankformat in eine XML-Ausgabedatei umgewandelt werden muss.

Native XML-Datenbanken leiden angeblich darunter, dass sie keine standardisierte, ausgeklügelte, feingranulierte Abfragesprache wie etwa SQL aufweisen und die schnelleren Abfragezeiten durch ein Mehr an Speicherplatz und redundanten Daten erkaufen.


Wann empfiehlt sich welches XML?

Entscheidungshilfe: Daten richtig mit XML verwalten

Alle diese Argumente besitzen ein Körnchen Wahrheit. Relativiert werden die Aussagen dadurch, dass es mehrere SQL-Dialekte gibt, der vielgepriesene “heilige” Standard bei den relationalen Datenbanken also nicht existiert. Und einige Hersteller von Native XML-Lösungen verschweigen, dass sie kein Stand-alone-Produkt anbieten. Und was die “Trägheit”betrifft: Viele NDX-Lösungen verstehen nur XML und bieten keine Konvertierung in andere Formate an. Weitere Datenbanklösungen aus dem NDX-Sektor speichern die XML-Daten auch nicht als reine Textdatei oder den anderen Vorgaben ab, wie sie etwa von der XML:DB Initiative (www.xmldb.org) gefordert werden. Und was den Speicherverbrauch und die Datenredundanz betrifft, wurde durch Datenkomprimierung oder Indexierung Abhilfe geschaffen.
Nachdem so der dichteste Reklamenebel entfernt ist, fällt eine Entscheidung schon leichter. Falls Sie mit einer relationalen Datenbank arbeiten, sollten Sie eine XML-Erweiterung ins Auge fassen. Vor allem, wenn Sie schon viel Zeit und Arbeit in Ihre Datenbank investiert haben.

Eine reine NDX-Lösung bietet sich an, wenn Sie den Datenaustausch im Internet völlig neu aufbauen oder eine Abkoppelung von der bestehenden Datenbank aus rechtlichen oder technischen Gründen nötig ist. Auch Sicherheitsaspekte können eine Rolle spielen.

Die Anschaffung einer XML-Erweiterung oder einer reinen NDX-Lösung ist vor allem bei Webinhalten, die einer ständigen Veränderung unterliegen, sinnvoll. Typische Beispiele sind:

– Kataloge im weitesten Sinn (von Ersatzteilen bis zum Auktionsangebot)
– Informationsdienste (Medizin, Recht, Unternehmen usw.)
– Dokumentenverwaltung


XML-Datenbanken: Kosten-Nutzen-Analyse frei erhältlich

Entscheidungshilfe: Daten richtig mit XML verwalten

Dass es sich bei XML-Datenbanken nur um einen Verkaufstrick der Hersteller von objektorientierten Datenbanken handelt, trifft sicher nicht zu.

XML hat sich als Datenaustauschformat inzwischen fest etabliert. Der günstigste Weg, um herauszufinden, ob sich das Engagement in XML-Datenbanken rechnet, ist immer noch ein Test.

Bei Sourceforge oder Apache sind kostenlose Opensource-Produkte im Angebot, mit denen eine praktische Kosten-Nutzen-Analyse – Pflege, Wartung, Konvertierungsgenauigkeit usw. – zumindest grob abgeschätzt werden kann.