GeoCoder: Wie Avobis Adressbestände analysiert, verifiziert und aufbereitet

Avobis GeoCoding

Avobis bereinigt Adressbestände – vollautomatisch und digital. Dirk Kunischewski, Senior Data Analyst und Mitentwickler des GeoCoders, gibt im Interview Auskunft über die Funktionsweise, die Anwendungsfelder und welchen Mehrwert der GeoCoder den Nutzern bringt.

Der GeoCoder ist die neuste Innovation aus dem Hause Avobis und basiert auf einer der grössten Geodatenbanken in der Schweiz, welche von Avobis aufgebaut und gepflegt wird. Der GeoCoder gleicht einen Adressdatensatz mit dieser Geodatenbank ab, erkennt dabei fehlerhafte Einträge und macht diese sichtbar. Dieser Service unterstützt Unternehmen dabei, Adressdaten auf einen aktuellen Stand zu halten. Firmen, welche ihre Daten zur Bearbeitung nicht ausser Haus geben möchten oder können, bietet sich die Möglichkeit, den GeoCoder direkt in ihre eigene IT-Infrastruktur zu implementieren.

Dirk Kunischewski ist Senior Data Analyst bei Avobis und Mitentwickler des GeoCoders. Im Interview ermöglicht er einen Schulterblick und zeigt auf, welchen Mehrwert eine Adressbereinigung und -anreicherung bringt.

Wohl jedes Unternehmen hat da und dort Adressleichen oder fehlerhafte Adressen. Was macht das Vorgehen bei Avobis so speziell?

Dirk Kunischewski: Es ist exemplarisch für viele Kunden. In bestehenden Adressen stecken viele Potenziale, aber man ist sich nicht sicher, ob die Daten so einsetzbar sind. Meist reicht ein Blick in den Datenbestand und nach den ersten Stichproben, unvollständigen Datensätzen und Dubletten ahnt man, dass Vorsicht geboten ist. Bei Avobis haben wir noch eine weitere Herausforderung: Als Dienstleisterin verwalten wir für unsere Kunden/Mandanten Daten, Personendaten – wie auch besonders schützenswerte Personendaten – und folgen strengen regulatorischen Auflagen. Dazu gehört, Mandanten zu trennen als auch den Zugang zu den Daten selbst stringent zu kontrollieren.
Adressbestände einfach mal so bei Adressdienstleistern hochzuladen, um diese dort bereinigen zu lassen, oder systematisch per API-Call bei Dienstleistern abzufragen, ist an dieser Stelle keine Option.

Welche Optionen hat man an dieser Stelle als Datenverantwortlicher?

Man bringt die Referenzdaten zu den Adressbeständen. Wir verwenden dazu unseren GeoCoder on Premise, verschiedene Referenzdatensammlungen stehen zusammen mit einer smarten Fuzzy-Search-Logik in einer einfach zu bedienenden Applikation zur Verfügung.

Der GeoCoder on Premise wird in die eigene gesicherte Infrastruktur kopiert. Als erster Schritt wird dann eine initiale Analyse der Adressbestände durchgeführt, um den Ist-Zustand festzustellen. Der Zustand der Daten bestimmt dann das weiter Vorgehen.

Was passiert in der initialen Analyse?

Der GeoCoder erstellt eine Übersicht der Adressenprüfung und teilt diese in drei Gruppen ein: Daten, die korrekt sind, Daten, die Auffälligkeiten zeigen und vom GeoCoder mit einem Vorschlag versehen werden – hier werden zum Beispiel Tippfehler von Strassennamen oder Postleitzahlen sichtbar. Die letzte Gruppe enthält Daten mit Auffälligkeiten, für die kein Vorschlag gefunden werden konnte.

Wie kann man sich dies vorstellen?

Hier ein paar Zahlen von der letzten Datenbereinigung mit dem Avobis GeoCoder: Von 3466 Adressen haben knapp 186 Auffälligkeiten gezeigt, was ein typisches Ergebnis ist. Der GeoCoder hat für die auffälligen Adressen selbstständig 109 Vorschläge generiert, die dann bei der Korrektur bzw. Bereinigung eine zügige Bearbeitung erlauben. Für den Rest konnten keine Vorschläge generiert werden und es ist Handarbeit angesagt.
Der GeoCoder arbeitet mit der Skript-Sprache Python, mit der viele Anwendungsfälle abgedeckt werden können: von der vollautomatischen Korrektur in den Applikationsdatenbanken bis hin zu der Erstellung von Korrekturlisten.

Wie kann man hier die Daten bereinigen?

Unserem Auftraggeber war es wichtig, die eventuelle Korrektur von Hand in das System einzupflegen, um einen akkuraten Datenbestand sicherzustellen. Eine Besonderheit bei einer Überprüfung war, dass die Liegenschaftsobjekte teilweise in der Planungsphase waren und somit auch Strassen bzw. Hausnummern zugewiesen bekommen haben, die noch nicht in den offiziellen Referenzdaten hinterlegt waren. Wir sind also für alle Eventualitäten und Wünsche unserer Auftraggeber gerüstet!

Haben Sie Datensilos, unvollständige Adressdaten und Dubletten unstrukturiert über verschiedene Systeme und Listen verteilt und keine Möglichkeit, die Daten extern bereinigen zu lassen?

Dann kontaktieren Sie uns für eine individuelle Offerte.

Dirk Kunischewski Rund

Kontaktperson

Dirk Kunischewski

Senior Data Analyst

Tel. +41 58 255 39 38

dirk.kunischewski@avobis.ch

Brandschenkestrasse 38
8001 Zürich