Dubletten, ein Ärgernis für Unternehmen

Bei einer Dublette handelt es sich lt. Wikipedia um einen redundanten Datensatz in einer Datenbank. Diese Redundanz kann aufgrund abweichender Schreibweise nicht erkannt werden. Der Datensatz wird somit mehrfach vorgehalten.

Besonders betroffen sind Adressdatenbanken. Hier sind nicht selten die gleichen Personen oder Firmen mehrfach erfasst. Dies kann beispielsweise aufgrund unterschiedlicher Eingabeinformationen geschehen. Es spielen auch Namens- und Adressänderungen eine große Rolle. Namen ändern sich bei Firmen häufiger. Aber auch im Privaten kann es durch Eheschließung zu einer Namensänderung kommen. Von Adressänderungen durch Umzüge sind private wie gewerbliche Adressen gleichermaßen betroffen. Nicht immer teilen die Kunden ihre Adressänderung mit.  Auch bei der Zusammenlegung verschiedener Systeme und Datenbanken, können viele Dubletten entstehen. Nicht selten werden Personen oder Firmen auch in fehlerhafter oder unterschiedlicher Schreibweise eingegeben, so dass sehr schnell zwei Datensätze mit „gleichem“ Inhalt entstehen.

Dubletten werden dann zum Problem, wenn die Adressen für statistische Auswertungen oder Mailings verwendet werden sollen. Die Folge sind unnötige Kosten für den Mailingversand und ein Imageverlust des Unternehmens. Auch Cross- und Up-Selling sind nur bedingt möglich.

Verschiedene Softwareprodukte helfen bei der Identifizierung und automatischen Bereinigung von Dubletten in Adressdatenbanken. Hierbei kommen phonetische, musterbezogene oder assoziative Algorithmen zum Einsatz. Ein ganz gutes Tool, um Dubletten zu bereinigen stammt von AdressExpert.  Dieses Produkt ist vor allem für Unternehmen geeignet, die über große Adressdatenbestände verfügen. Wir werden an dieser Stelle noch weitere Informationen zu Tools sammeln und zur Verfügung stellen.

Folgen

Erhalte jeden neuen Beitrag in deinen Posteingang.