Daten-Migration in die Cloud und zurück

Big DataCloudData & Storage

Viele Unternehmen nutzen externe Cloud-Dienste. SaaS, Online-Conferencing, Office-Anwendungen oder Plattformen wie Amazons EC2 werden immer populärer. Ein häufig übersehenes Problem ist dabei die Migration von Daten.

Das Problem der Daten-Migration gilt umso mehr, wenn man neue, bisher nicht genutzte Dienste in Betrieb nimmt. Dort werden Daten erzeugt, die sich beim Cloud-Provider befinden. Was macht man aber, wenn man diesen wechseln möchte? Dabei geht es um Schnittstellen und Datenformate, aber auch um die Datenmenge.

Wie komplex es sein kann, Daten in die Cloud und wieder aus ihr heraus zu transportieren zeigt sich schon daran, dass beispielsweise an Amazon mancher Datenträger per Post gesendet wird, weil der Transfer über das Internet immer noch zu teuer wäre – nicht unbedingt zu langwierig, denn der klassische Transportweg ist ja auch nicht sonderlich schnell.

Schnittstelle zum Cloud-Provider
Die Datenmenge ist aber in Situationen, in denen von Cloud-Providern weg migriert werden soll, das kleinste Problem. Zumindest solange dieser Schritt nicht unter Zeitdruck erfolgen muss. Falls es allerdings Zeitdruck gibt, ist man ohnehin in einer schwierigen Situation, weil das nur klappt, wenn es Schnittstellen gibt, die Datenformate beherrscht werden und die Datenmengen überschaubar groß sind – was meist nur dann der Fall ist, wenn man diesen Wechsel bereits frühzeitig vorbereitet hat.

Die erste Frage ist, ob es überhaupt Schnittstellen gibt, um in automatisierter Weise auf die Informationen beim Provider zugreifen zu können. Das ist keineswegs immer der Fall. Viele Provider bieten bis heute keine geeigneten Verfahren für einen Massenexport an – weder für Daten in Datenbanken beispielsweise bei SaaS-Anwendungen noch für Dokumente oder E-Mails.

Datenformat kann Probleme verursachen
Doch selbst wenn es diese Zugriffsmöglichkeit gibt, stellt sich noch das Problem des Formats dieser Daten. Selbst bei ausreichender Beschreibung muss man es selbst häufig noch in die erforderliche Form bringen. Das setzt im besten Fall voraus, dass man ETL-Technologien einsetzt (Extraction, Transformation, Load), was kein triviales Unterfangen ist. Oft, gerade bei spezifischen Dokumentformaten, besteht aber auch das Risiko, dass sich gar nicht alle Informationen korrekt und vollständig übernehmen lassen.

»Bei der Auswahl von Cloud-Providern muss die Frage gestellt werden, wie man auch wieder zurück wechseln kann – in die eigene, interne Umgebung oder zu einem anderen Anbieter.« Martin Kuppinger

Kurz gesagt: Es kann erheblichen Aufwand verursachen, wenigstens einigermaßen an die Daten ranzukommen und sie in eine Form zu bringen, mit der wenigsten die wichtigsten Informationen weiterhin nutzbar sind.
Derzeit gibt es auch nur von wenigen Anbietern Whitepaper und Dokumentationen dazu, wie man Daten aus der jeweiligen Cloud zurück migrieren kann – deutlich weniger als es für die Frage, wie man die Daten hin zum Provider bringt, gibt. Und Tool-Support fehlt fast völlig. Es gibt zwar Anbieter, die an entsprechenden Migrationswerkzeugen arbeiten, noch steckt dieser Markt aber in den Kinderschuhen.

Das K.O.-Kriterium
Deshalb muss bei der Auswahl von Cloud-Providern von Beginn an die Frage gestellt werden, wie man auch wieder zurück wechseln kann – in die eigene, interne Umgebung oder zu einem anderen Anbieter. Wenn man darauf keine befriedigende Antwort hat, ist das letztlich ein K.O.-Kriterium für den Schritt zu diesem Cloud-Anbieter.

Natürlich betrifft das nicht alle Dienste gleichermaßen. Office-Anwendungen, E-Mail-Dienste (man denke an die Aufbewahrungspflichten in diesem Bereich) oder SaaS-Anwendungen mit großen Datenmengen wie im CRM- und ERP-Bereich sind besonders kritisch, während beispielsweise das Web Conferencing vergleichsweise unproblematisch ist. Die Frage muss aber in jedem Fall gestellt werden und ist eines der wichtigsten Entscheidungskriterien.

Letztlich ist das aber auch ein Thema für die Cloud-Provider: Wer auf Lock-In setzt und seinen Kunden keinen vernünftigen Weg zurück anbietet, wird vom Markt verschwinden. Denn eines der wesentlichen Merkmale des Cloud Computings ist, dass man den am besten geeigneten Dienstanbieter flexibel auswählen und zwischen Anbietern wechseln kann.
(Martin Kuppinger/Mehmet Toprak)

Martin Kuppinger ist Gründer des Analystenunternehmens Kuppinger Cole, das sich neben Cloud Computing auch mit digitalen Identitäten, Identity und Access Management, GRC (Governance, Risk Management, Compliance) Computing beschäftigt. Kuppinger Cole ist daneben Ausrichter der regelmäßig stattfindenden European Identity Conference. Martin Kuppinger hat darüber hinaus eine Vielzahl von IT-Fachbüchern und Fachartikeln veröffentlicht. Weitere Informationen finden Sie auf der Website.