Täglicher Umgang
In jedem Unternehmen auf der ganzen Welt wird täglich mit Kundendaten
umgegangen. Standardprodukte bekannter Softwarehersteller finden dabei ebenso
Anwendung wie individuelle Entwicklungen. Kunden werden neu erfasst, es werden
Daten aufgrund von Umzügen oder Umfirmierungen geändert und ebenso
selbstverständlich werden Kundenkonten deaktiviert oder gelöscht.
Natürlich gibt es herausfordernde Tätigkeiten, als Kundendaten zu
bearbeiten. Aber der Teufel steckt hierbei im Detail. Schwierig wird es dann,
wenn ein Mitarbeiter einen Kunden nicht in der Datenbank auffinden kann oder
hierfür länger als gewöhnlich benötigt. Beliebte Duplikatquellen
sind Umzug, Heirat/Scheidungen oder Todesfälle, gerade wenn Daten von Endkunden
verarbeitet werden. So passiert es dann sehr schnell, dass für einen bereits
vorhandenen Kunden ein neuer Datensatz angelegt wird.
Aber ist der Kunde wirklich noch nicht in der Datenbank?
Jedes einzelne Kundenduplikat verursacht doppelte Kosten. Spätestens wenn
Sie Mailings starten möchten, diese vielleicht noch nach Umsatz differenzieren
oder einfach nur Einladungen für Ihren bevorstehenden Messeauftritt versenden,
laufen Sie außerdem Gefahr, den Kunden zu verwirren oder gar zu verärgern.
Würden Sie sich über zwei Einladungen zu Ihrem Messeauftritt auch
doppelt freuen oder auf ein mehrfaches Werbemailing eher reagieren als auf ein
einzelnes?
Vermutlich hätten Sie ebenso wie ich nur ein Kopfschütteln übrig
und würden die Werbebotschaft kaum mehr wahrnehmen.
Wenn Sie das nicht schlimm finden, gibt es eine Fülle weiterer Szenarien,
die Ihnen vielleicht mehr liegen. Geburtstagsgrüße an einen Verstorbenen,
welche die Hinterbliebenen erhalten, Lieferungen an den ehemaligen Arbeitgeber
oder Gutschriften auf das Konto des Ex-Mannes sind nur einige Fehler, die aufgrund
von Dubletten und veralteten Daten täglich passieren. Jeder dieser Fehler
verursacht Kosten, führt zu einem entgangenen Umsatz oder schadet dem Image
Ihres Unternehmens.
Duplikate vermeiden und aktuelle Daten erhalten
Der Arbeitsablauf
Um Duplikate weitestgehend zu vermeiden und die Daten aktuell zu halten, sollte
zunächst der Arbeitsablauf beim Umgang mit Kundendaten optimiert werden.
Ein Adressabgleich bei jedem Kundenkontakt kostet maximal 5 Sekunden und amortisiert
sich bereits mit der ersten vermiedenen Fehllieferung bzw. -adressierung.
Die Software
Darüber hinaus sind aber auch softwareseitige Ansätze notwendig,
um effektiv neue Duplikate zu vermeiden und bestehende zu ermitteln. Obwohl
diese Methoden aufeinander aufbauend eingesetzt werden können, trägt
der Einsatz eines einzelnen Ansatzes bereits wesentlich zur Optimierung bei:
Ähnlichkeitsbasierte phonetische Suche (z.B. nach Soundex)
Namensschreibweisen gibt es wie Sand am Meer und so bilden diese eine beliebte
Fehlerquelle. Eine phonetische Suche, z.B. mittels des bekannten Soundex-Algorhythmus,
kann diese Fehler minimieren, indem grundsätzlich auch ähnliche
Namen angezeigt werden. So würde eine Suche nach dem Namen "Schmidt"
auch alle "Schmitt", "Schmid", usw. ergeben. Auch für
Vor- oder Straßennamen ist diese Technik verwendbar. In einer entsprechend
sortierten Suchergebnisliste (siehe unten) werden beispielsweise die Kunden
"Schmidt" und "Schmitt" mit gleicher Anschrift schnell
als Duplikat offenbahrt. Eine Demonstration dieser Suchmethode können Sie hier selbst testen!
Vorgaben für PLZ/Ort/Straße-Kombinationen
In Deutschland, und vielen anderen Ländern auch, ist jede Postleitzahl
einem oder mehreren Orten zugeordnet und jeder Straßenname einem Ort.
Unter Verwendung einer entsprechenden Datenbasis kann eine Software den Benutzer
somit aktiv bei der Eingabe von Kundendaten unterstützen und Fehler vermeiden.
Jede Eingabe eines Straßen- oder Ortsnamens oder einer Postleitzahl
schränkt dabei die zur Verfügung stehenden weiteren Auswahlmöglichkeiten
ein. Die Software ergänzt aufgrund der Eingaben die Straßen- oder
Ortsnamen automatisch, bis der Benutzer diese durch Sichtprüfung bestätigt.
Neben der Arbeitserleichterung für den Benutzer werden Tippfehler somit
praktisch ausgeschlossen, ebenso wie eine ungültige Kombination aus Postleitzahl,
Ort und Straße.
Ähnlichkeitsanalyse vorhandener Datensätze
Während der Soundex-Algorhythmus für den Einsatz bei Suchvorgängen
in Echtzeit optimiert ist, gibt es noch weitere Algorhythmen, die sich aufgrund
Ihrer Funktionsweise nicht für zeitkritische Vorgänge eignen. So
basiert der sogenannte "Levenshtein-Algorhythmus", benannt nach
seinem Schöpfer, auf der Ähnlichkeit zweier Worte. Er berechnet
die Anzahl der Lösch-, Einfüge- und Austauschoperationen die nötig
sind, damit ein Wort dem anderen entspricht. Jede Operation wird dabei mit
Strafpunkten belegt. Je weniger Punkte notwendig sind, desto ähnlicher
sind sich demzufolge die Worte.
Hiermit ist es beispielsweise möglich, die Ähnlichkeit eines vorhanden
(Straßen-)Namens zu einem anderen zu ermitteln und eine Ergebnisliste
zu erzeugen, die zuverlässig Duplikate eines Datensatzes anzeigt. Mit
Hilfe dieser Liste können Mitarbeiter Datensätze aktualisieren bzw.
als Duplikat zuordnen.
Duplikatoptimierte Ergebnisliste bei der Kundensuche
Jeder Eingabe eines Kunden oder Erfassung eines Auftrages sollte eine (möglichst
ähnlichkeitsbasierte) Kundensuche vorausgehen, die eine duplikatoptimierte
Ergebnisliste erzeugt. Dubletten werden hierdurch in unmittelbarer Nachbarschaft
zueinander angezeigt und können vom Benutzer sofort als Duplikat erkannt
werden.
Einen entsprechenden Arbeitsablauf vorausgesetzt, werden somit Duplikate
eines Kundendatensatzes bereits während des normalen Geschäftsbetriebes
alltäglich aussortiert.
Aktuelle Software
Obwohl diese Ansätze alles andere als neu sind, gehören Sie leider
nicht zum normalen Funktionsumfang der meisten heute erhältlichen Software.
Noch immer wird dem Benutzer die genaue Eingabe von Daten abverlangt, da ansonsten
entsprechende Suchergebnisse ausbleiben.
Selbst die sogenannte "Wildcard-Suche", einer der ersten Ansätze
für eine ähnlichkeitsbasierte Suche, ist eher selten vertreten. Hier
kann man wenigstens eine Suche nach Teilworten durchführen. So würde
beispielsweise eine Suche nach "M??er*" Kunden mit Namen wie "Meier",
"Mayer" oder "Mayerhuber" finden. Doch wozu soll man die
Benutzer auf die Verwendung von Wildcards schulen, wenn doch die heutige Informationstechnologie
bereits mehr bietet?
Das Optimum ist uns gerade gut genug für Sie!
Wenn Sie noch keine Probleme mit Dubletten haben, werden Sie mittelfristig
welche bekommen, sofern die von Ihnen verwendete Software die oben genannten
Ansätze nicht unterstützt!
Wir helfen Ihnen bei der Analyse vorhandener Daten und der Implementierung
eines zukunftssicheren Dubletten-Managements und setzen dabei auf die jeweils
neusten Erkenntnisse der Informationstechnologie.
© 2006 Mathias Wührmann, Alle Rechte vorbehalten.
FLEXact Informationssysteme Mathias Wührmann Bernhardstr. 22 26122 Oldenburg
http://www.flexact.de |