Serie: OpenSource im Business
Teil 1: Datenintegration

Big DataData & StorageIT-ManagementIT-ProjekteNetzwerk-ManagementNetzwerkeOpen SourceSoftware

Aktuelle Studien bestätigen: OpenSource ist im Geschäftsleben angekommen. Selbst im wichtigen Bereich der Datenintegration – also dem gesteuerten Data Mining – gibt es mittlerweile Lösungen.

Aus Daten Informationen machen

Daten sind die Grundlage aller wichtigen Geschäftsprozesse, das betrifft sowohl Verwaltungsaufgaben, die Abwicklung weltweiter Transaktionen, Steuerung komplexer Produktionsabläufe als auch die Informationsvorbereitung für Entscheidungsträger. Dabei kennen Datenmenge und Anzahl der zu integrierenden Plattformen seit Jahren nur eine Richtung: steil nach oben. Schneller, transparenter Zugriff auf Unternehmensdaten ist mittlerweile »mission critical«, für den Erfolg einer Organisation, egal wo diese Daten gespeichert sind, wann sie anfallen, auf welchem System und in welchem Format sie vorliegen.

Der reine Transport der Daten stellt dabei kein Problem mehr dar. Herausfordernd ist jedoch die Einbindung in Geschäftsprozesse bis hin zur Echtzeit-Verarbeitung sowie der bedarfsgerechte Zugriff durch Mitarbeiter. Datenintegrations-Software löst die damit verbundenen Probleme, indem sie Daten von jedem beliebigen Quellsystem entnimmt und so aufbereitet, dass das Zielsystem etwas damit anfangen kann. Aus Daten werden so Informationen.

Im OpenSource-Programm Talend lässt sich der Prozess der Datenintegration zuvor definieren


Open-Source beseitigt Einstiegshürden

Datenintegrationssoftware ist nicht neu, mehrere etablierte Anbieter, etwa Informatica, IBM, SAS oder Ab Initio, haben solche Lösungen im Programm. Allerdings lag die Einstiegshürde bislang für die meisten Unternehmen in unerreichbarer Höhe. Nahezu prohibitive Preise und komplizierte Lizenzierungen haben dafür gesorgt, dass insbesondere mittelständische Firmen außen vor blieben.

Mit dem Aufkommen leistungsfähiger Open-Source-Alternativen hat sich diese Situation geändert. Es scheint, als hätte der Markt darauf gewartet: in nur drei Jahren hat beispielsweise Talend über 300.000 Anwender für seine Software gewinnen können. Mittlerweile deckt die Lösung auch Data-Quality-Aspekte ab und nach einer jüngst erfolgten Akquisition wird derzeit gerade ein Modul für das Stammdatenmanagement (MDM) integriert. Für Unternehmen, die beispielsweise im Team entwickeln möchten, massive Datenaufkommen haben, Daten in Echtzeit bearbeiten müssen oder Wert auf Support durch den Hersteller legen, existiert eine kommerzielle Plattform, die erheblich günstiger ist als die proprietären Alternativen.

Ein Wizard im freien Datentool Talend hilft, die Informationsquellen richtig zusammenzustellen


Lizenzkosten sparen durch Umgehung der »Datensteuer«

Open-Source-Datenintegration ist aber nicht nur für Einsteiger interessant, auch Unternehmen mit bestehenden Installationen der traditionellen Anbieter können die Kosten für ihre Infrastruktur erheblich senken, indem sie die Open-Source-Lösungen parallel einsetzen. Der Hintergrund ist, dass traditionelle Hersteller ihre Software nach Parametern wie dem bewegten Datenaufkommen, der Zahl der Quell- und Zielsysteme oder nach genutzten CPUs lizenzieren. Die Kosten wachsen also mit der Anzahl der genutzten Datenbanken, Anwendungen oder eingesetzten CPUs – die so genannte »Datensteuer« wird fällig.

Kombiniert man jedoch Open-Source mit proprietärer Software, kommen interessante Einsparungspotentiale zum Vorschein: Angenommen, ein Unternehmen hat eine Informatica-Quelllizenz für Oracle und eine für das IBM-Zielsystem DB2. Wenn nun auch eine Sybase-Datenbank integriert werden soll, so muss normalerweise eine weitere Lizenz erworben werden. Kommt jedoch ein quelloffenes Tool wie Talend zum Einsatz, lassen sich die Sybase-Daten über Talend nach DB2 ziehen. Die »Datensteuer« wird umgangen und dennoch lässt sich alles wie gewünscht zusammenfügen. Dabei sind die Kombinationsmöglichkeiten enorm: Mehr als 400 verfügbare Konnektoren, die zu einem großen Teil von der Open-Source-Community entwickelt wurden, stellen sicher, dass zu allen wichtigen Anwendung eine nahtlose Anbindung existiert.

 

Die richtige Verknüpung verschiedener Datenquellen in ein Ziel geschieht bei Talend per grafischer Benutzerführung

 


Vorurteile sitzen tief

Wachsende Anforderungen und schrumpfende Budgets haben Open-Source mittlerweile salonfähig und zu einem Markt mit enormem Wachstumspotenzial gemacht.

Noch existieren aber auch zahlreiche Vorbehalte. Bertrand Diard, Gründer und CEO von Talend, wird aber nicht müde, die Kunden aufzuklären: »Wir machen immer wieder die Erfahrung, dass Kunden unsere Datenintegrationssoftware zuerst in eng begrenzten Projekten einsetzen und dann davon so angetan sind, dass sie das Einsatzgebiet nach und nach immer weiter ausdehnen. Aber genauso häufig stoßen wir auf die immer gleichen Vorurteile, die den IT-Verantwortlichen von ihren traditionellen Lieferanten über Jahre eingeimpft wurden: Open-Source sei unsicher, es drohten versteckte Kosten und bei Problemen stände man allein im Regen. Das alles sind widerlegbare Vorurteile, die verbreitet werden, um die Anwender zu verunsichern«.

So können OpenSource-Lösungen in verschiedenen Bereichen sogar zur besseren Lösung werden als die kostenpflichtigen – Kunden verschiedener Lösungen berichten von schnelleren Support-Reaktionszeiten der Community und der Herstellerfirmen. Noch nicht alle Software-Gattungen im openSource-Bereich haben schon derart positives Feedback aus dem Unternehensbereich, doh es werden immer mehr. In unserer Serie rund um die ausgereiftesten OpenSource-Business-Lösungen  erfahren Sie mehr dazu.