Start Partner Neuigkeiten von FLEXact
Produkte Downloads Wie und warum FLEXact besonders ist
Produkte Artikel zu verschiedenen Themen Impressum
Aktuelles : Vom täglichen Umgang mit Kundendaten und der Vermeidung von Duplikaten

Täglicher Umgang

In jedem Unternehmen auf der ganzen Welt wird täglich mit Kundendaten umgegangen. Standardprodukte bekannter Softwarehersteller finden dabei ebenso Anwendung wie individuelle Entwicklungen. Kunden werden neu erfasst, es werden Daten aufgrund von Umzügen oder Umfirmierungen geändert und ebenso selbstverständlich werden Kundenkonten deaktiviert oder gelöscht.

Natürlich gibt es herausfordernde Tätigkeiten, als Kundendaten zu bearbeiten. Aber der Teufel steckt hierbei im Detail. Schwierig wird es dann, wenn ein Mitarbeiter einen Kunden nicht in der Datenbank auffinden kann oder hierfür länger als gewöhnlich benötigt. Beliebte Duplikatquellen sind Umzug, Heirat/Scheidungen oder Todesfälle, gerade wenn Daten von Endkunden verarbeitet werden. So passiert es dann sehr schnell, dass für einen bereits vorhandenen Kunden ein neuer Datensatz angelegt wird.

Aber ist der Kunde wirklich noch nicht in der Datenbank?

Jedes einzelne Kundenduplikat verursacht doppelte Kosten. Spätestens wenn Sie Mailings starten möchten, diese vielleicht noch nach Umsatz differenzieren oder einfach nur Einladungen für Ihren bevorstehenden Messeauftritt versenden, laufen Sie außerdem Gefahr, den Kunden zu verwirren oder gar zu verärgern. Würden Sie sich über zwei Einladungen zu Ihrem Messeauftritt auch doppelt freuen oder auf ein mehrfaches Werbemailing eher reagieren als auf ein einzelnes?

Vermutlich hätten Sie ebenso wie ich nur ein Kopfschütteln übrig und würden die Werbebotschaft kaum mehr wahrnehmen.

Wenn Sie das nicht schlimm finden, gibt es eine Fülle weiterer Szenarien, die Ihnen vielleicht mehr liegen. Geburtstagsgrüße an einen Verstorbenen, welche die Hinterbliebenen erhalten, Lieferungen an den ehemaligen Arbeitgeber oder Gutschriften auf das Konto des Ex-Mannes sind nur einige Fehler, die aufgrund von Dubletten und veralteten Daten täglich passieren. Jeder dieser Fehler verursacht Kosten, führt zu einem entgangenen Umsatz oder schadet dem Image Ihres Unternehmens.

Duplikate vermeiden und aktuelle Daten erhalten

Der Arbeitsablauf

Um Duplikate weitestgehend zu vermeiden und die Daten aktuell zu halten, sollte zunächst der Arbeitsablauf beim Umgang mit Kundendaten optimiert werden. Ein Adressabgleich bei jedem Kundenkontakt kostet maximal 5 Sekunden und amortisiert sich bereits mit der ersten vermiedenen Fehllieferung bzw. -adressierung.

Die Software

Darüber hinaus sind aber auch softwareseitige Ansätze notwendig, um effektiv neue Duplikate zu vermeiden und bestehende zu ermitteln. Obwohl diese Methoden aufeinander aufbauend eingesetzt werden können, trägt der Einsatz eines einzelnen Ansatzes bereits wesentlich zur Optimierung bei:

Ähnlichkeitsbasierte phonetische Suche (z.B. nach Soundex)

Namensschreibweisen gibt es wie Sand am Meer und so bilden diese eine beliebte Fehlerquelle. Eine phonetische Suche, z.B. mittels des bekannten Soundex-Algorhythmus, kann diese Fehler minimieren, indem grundsätzlich auch ähnliche Namen angezeigt werden. So würde eine Suche nach dem Namen "Schmidt" auch alle "Schmitt", "Schmid", usw. ergeben. Auch für Vor- oder Straßennamen ist diese Technik verwendbar. In einer entsprechend sortierten Suchergebnisliste (siehe unten) werden beispielsweise die Kunden "Schmidt" und "Schmitt" mit gleicher Anschrift schnell als Duplikat offenbahrt.
Eine Demonstration dieser Suchmethode können Sie hier selbst testen!

Vorgaben für PLZ/Ort/Straße-Kombinationen

In Deutschland, und vielen anderen Ländern auch, ist jede Postleitzahl einem oder mehreren Orten zugeordnet und jeder Straßenname einem Ort. Unter Verwendung einer entsprechenden Datenbasis kann eine Software den Benutzer somit aktiv bei der Eingabe von Kundendaten unterstützen und Fehler vermeiden.

Jede Eingabe eines Straßen- oder Ortsnamens oder einer Postleitzahl schränkt dabei die zur Verfügung stehenden weiteren Auswahlmöglichkeiten ein. Die Software ergänzt aufgrund der Eingaben die Straßen- oder Ortsnamen automatisch, bis der Benutzer diese durch Sichtprüfung bestätigt.

Neben der Arbeitserleichterung für den Benutzer werden Tippfehler somit praktisch ausgeschlossen, ebenso wie eine ungültige Kombination aus Postleitzahl, Ort und Straße.

Ähnlichkeitsanalyse vorhandener Datensätze

Während der Soundex-Algorhythmus für den Einsatz bei Suchvorgängen in Echtzeit optimiert ist, gibt es noch weitere Algorhythmen, die sich aufgrund Ihrer Funktionsweise nicht für zeitkritische Vorgänge eignen. So basiert der sogenannte "Levenshtein-Algorhythmus", benannt nach seinem Schöpfer, auf der Ähnlichkeit zweier Worte. Er berechnet die Anzahl der Lösch-, Einfüge- und Austauschoperationen die nötig sind, damit ein Wort dem anderen entspricht. Jede Operation wird dabei mit Strafpunkten belegt. Je weniger Punkte notwendig sind, desto ähnlicher sind sich demzufolge die Worte.

Hiermit ist es beispielsweise möglich, die Ähnlichkeit eines vorhanden (Straßen-)Namens zu einem anderen zu ermitteln und eine Ergebnisliste zu erzeugen, die zuverlässig Duplikate eines Datensatzes anzeigt. Mit Hilfe dieser Liste können Mitarbeiter Datensätze aktualisieren bzw. als Duplikat zuordnen.

Duplikatoptimierte Ergebnisliste bei der Kundensuche

Jeder Eingabe eines Kunden oder Erfassung eines Auftrages sollte eine (möglichst ähnlichkeitsbasierte) Kundensuche vorausgehen, die eine duplikatoptimierte Ergebnisliste erzeugt. Dubletten werden hierdurch in unmittelbarer Nachbarschaft zueinander angezeigt und können vom Benutzer sofort als Duplikat erkannt werden.

Einen entsprechenden Arbeitsablauf vorausgesetzt, werden somit Duplikate eines Kundendatensatzes bereits während des normalen Geschäftsbetriebes alltäglich aussortiert.

Aktuelle Software

Obwohl diese Ansätze alles andere als neu sind, gehören Sie leider nicht zum normalen Funktionsumfang der meisten heute erhältlichen Software. Noch immer wird dem Benutzer die genaue Eingabe von Daten abverlangt, da ansonsten entsprechende Suchergebnisse ausbleiben.

Selbst die sogenannte "Wildcard-Suche", einer der ersten Ansätze für eine ähnlichkeitsbasierte Suche, ist eher selten vertreten. Hier kann man wenigstens eine Suche nach Teilworten durchführen. So würde beispielsweise eine Suche nach "M??er*" Kunden mit Namen wie "Meier", "Mayer" oder "Mayerhuber" finden. Doch wozu soll man die Benutzer auf die Verwendung von Wildcards schulen, wenn doch die heutige Informationstechnologie bereits mehr bietet?

Das Optimum ist uns gerade gut genug für Sie!

Wenn Sie noch keine Probleme mit Dubletten haben, werden Sie mittelfristig welche bekommen, sofern die von Ihnen verwendete Software die oben genannten Ansätze nicht unterstützt!

Wir helfen Ihnen bei der Analyse vorhandener Daten und der Implementierung eines zukunftssicheren Dubletten-Managements und setzen dabei auf die jeweils neusten Erkenntnisse der Informationstechnologie.



© 2006 Mathias Wührmann, Alle Rechte vorbehalten.

FLEXact Informationssysteme Mathias Wührmann
Bernhardstr. 22
26122 Oldenburg

http://www.flexact.de

FLEXact Informationssysteme Mathias Wührmann, 26122 Oldenburg, Tel.: 0441/98330606