Datenchaos minimieren
Datenqualität unternehmensweit sichern

CRMIT-ManagementIT-ProjekteMarketingNetzwerk-ManagementNetzwerkeSoftware

Eine deutsche Firma macht sich auf, auch in komplexen Sprachen wie Arabisch und Chinesisch Ähnlichkeiten wie beispielsweise Adress-Dubletten zu finden.

Dublettenhemmer in der SOA

Datenchaos minimieren

Mit den serviceorientierten Architekturen, kurz SOA, hält eine stille Revolution Einzug in die Unternehmen. Und nun könne mit so einem Service sogar die Qualität der Kundendaten in der unternehmensweiten IT-Landschaft abgesichert werden, erklärt die Pforzheimer Omikron Data Quality GmbH. Auf teure Dienstleister oder komplizierte Spezial-Software müsse dann nur noch in Sonderfällen zurückgegriffen werden.

Wer im Management, Marketing, Call Center oder Vertrieb mit Kundendaten zu tun hat, kennt die Konsequenzen schlechter Datenqualität: doppelt gespeicherte Adressen (Dubletten), uneinheitliche Feldeinträge, postalisch Fehler in der Anschrift, inkorrekte Anreden… Und die haben Folgen:

1. Dubletten kosten Firmen bares Geld – nicht nur bei jeder Direktmarketing-Aktion.
2. Falsche Anreden wie “Sehr geehrter Herr Einkaufs.-Abt.” zerstören das persönliche Mailing.
3. Postalische Fehler erhöhen die Brieflaufzeiten oder aber die Sendung kommt gar nicht erst an.
4. Unvollständige Adressen vereiteln Kundensegmentierung für Direktmarketing-Aktionen.
5. Strategische Entscheidungen auf schlechter Datenbasis sind zum Scheitern verurteil.

Es gibt unzählige weitere Folgen schlechter Datenqualität, eines haben Sie aber alle gemeinsam: Sie beeinflussen nachhaltig den Erfolg des Unternehmens. Omikron, der Hersteller der “intelligenten Adressabgleichs-Software” (Eigenwerbung), hat dazu zahlreiche Unternehmen befragt: Demnach sind in mehr als der Hälfte aller Firmen 20 Prozent der Daten fehlerhaft. 61 Prozent der Unternehmen vermissen laut Studie Lösungen zur automatischen Datenpflege, mit denen sich beispielsweise Dublettenprüfungen, postalische Korrekturen, Adressergänzungen und Anrede-Erzeugungen vornehmen lassen.


Linguistische Suchalgorithmen vermeiden Datenchaos

Datenchaos minimieren

Die Firma Omikron aus Pforzheim kam zu diesem lukrativen Marktsegment wie die Jungfrau zum Kinde: Unternehmensgründer Carsten Kraus war von seinem schlechten Adressbestand so genervt, dass er ein entsprechendes Tool zur Dublettenerkennung entwickelte. Mit neuen Programmierern und schlauen Algorithmen mauserte sich das Programm zu mehreren Diensten, die die Firma zum Spezialisten für Datenbankmarketing, Adress-Suche und CRM-Dienste machte.

Ihr “Data Quality Server” wurde speziell für den Einsatz in serviceorientierten Architekturen entwickelt und kann, so der Hersteller, von jeder Stelle der IT-Landschaft aus genutzt werden. Dabei können der Firma zufolge beliebige Datenqualitätsprozesse frei definiert werden. Die Funktionen des Servers lassen sich über die eigene Oberfläche, aber auch über Standard-System-Schnittstellen aufrufen, damit ältere und neuere IT-Technologien barrierefrei verknüpft werden können. Zentrale Schaltstelle des Data Quality Server für alle Prozesse ist dabei der Webservice, über den die Technologie in dynamischen Szenarien zum Einsatz kommt.

Bekannt ist das Unternehmen hierzulande für einen ganz anderen Service: seinen “Fact-Finder“, der aber im Grunde die gleiche Technik verwendet. Sie ist zugeschnitten auf Online-Shops und hilft, die richtigen Produkte zur Suchanfrage zu zeigen. So kann der Shop-Betreiber den Kunden trotz Vertippern und Rechtschreibfehlern zum richtigen Produkt führen.

Matthias Hau, der Internet-Leiter des Versandhändlers Pearl Agency, erklärt auf den Omikron-Seiten, er habe durch das Tool die Konversionsrate seiner Online-Shopper um 10 Prozent erhöhen können. Auch Neckermann, BOL und myToys verwenden die Technik, um den bequemen Kunden doch noch da hinzuführen, wo sie ihn haben wollen.


Adressdatenbanken über Schnittstellen erweitern

Datenchaos minimieren

Mit seinem neuen Data Quality Server führt das Pforzheimer Softwarehaus diese Technik noch einen Schritt weiter. Zu den Aufgaben des Servers gehört schon das Sicherstellen korrekter Adress- Eingaben: Damit Stammdaten dauerhaft “sauber” bleiben, müssen Adressen, die beispielsweise über ein Kontaktformular generiert werden, zuerst kontrolliert und bei Bedarf aktualisiert werden. So lassen sich automatisch Namensprüfungen, postalische Korrekturen, Sanktionslisten-Abgleiche und Dubletten-Kontrollen durchführen. Adressfehler werden korrigiert, Spaßvögel und bekannte Betrüger abgewiesen und jede Adresse gelangt nur ein Mal ins System. Falls die Adresse schon gespeichert ist, wird sie automatisch um neu gewonnene Kunden-Informationen ergänzt.

Ein “Customer Data Hub” gleicht unterschiedliche interne und externe Datenquellen mit dem zentralen Datenstamm ab, um etwa neue Adressen aus einer Filiale oder Kontakte der Außendienstmitarbeiter ins System zu überführen. Hier prüft der Data Quality Server zuerst, ob die Adressen schon vorhanden sind. Wenn ja, erzeugt der Server eine eindeutige ID, wenn nein, wird eine neue ID generiert und der Datensatz im Zentralregister eingetragen. So wird die Entstehung von Dubletten von Anfang an verhindert.

Wie ein CRM-System kann der Data Quality Server Daten vervollständigen: etwa Ergebnisse von Mailings und Call-Center-Anrufen einbinden oder Zielgruppen-Zuordnungen vornehmen. Das Tool kann hier beim Abgleich je nach Kunde externe Datenbestände mit einbinden.


Babylonisches Sprachwirrwarr vermeiden

Datenchaos minimieren

Nun klingt das alles sehr brauchbar für den lokalen Anwender. Doch bisher galten allenfalls die Such- und Vergleichstechnologien des deutschen Unternehmens als international wettbewerbsfähig – die Dublettensuche wurde des Öfteren sogar mit Googles Synonym- Wörterbuch verglichen – mit dem sie aber im Grunde nichts gemein hat.

Mit den nun auf der CRM-Expo vorgestellten Erweiterungen allerdings machen die Deutschen bei internationalen Kunden von sich reden: Die Abgleich-Technologien des Anbieters funktionieren auch mit Unicode. Das hätten viele Anbieter versucht, doch hinter den schon komplexen Unicode-Zeichen steckten oft noch komplexere Sprachen, erklärt der Hersteller. Als Beispiel nennt er Arabisch, in dem keine Vokale geschrieben werden und dessen Aussprache je nach Dialekt differiert. Oder Chinesisch, in dem gleich Geschriebenes auch vom Sinnzusammenhang etwas völlig anderes bedeuten kann.

An dieser Stelle kommt die Omikron-Technologie “Worldmatch” ins Spiel, die man flugs zum Patent anmeldete. Die Technologie für “fehlertolerante, internationale Datenabgleiche” versetzt Anwender in die Lage, Namen und Adressen aus ganz unterschiedlichen Weltsprachen gleichzeitig miteinander zu vergleichen. So können etwa Adressen mit japanischen (Kanji, Hiragana und Katakana) und lateinischen Schriftzeichen (Romaji) fehlertolerant verglichen werden.

Im zunehmenden weltweiten Sprachmix ist so eine Vergleichsfunktion durchaus sinnvoll – ein reines Übersetzungstool reicht oft nicht mehr. So ist zwar der US-Präsident Bush vielleicht noch aus deutschen Datenbanken heraus falsch geschrieben als “Busch” erkennbar, vielleicht aber der chinesische “bu shi” nicht mehr – ganz zu schweigen von den arabischen Zischlauten, mit denen der US-Präsident beschrieben werden kann. (mk)