Beim aktuellen Massenimport wurden bewusst Sicherheitsvorkehrungen entfernt und trotz vielfacher Warnung Daten einfach unkontrolliert in riesigen Mengen blind hochgeladen, die dafür gar nicht geeignet sind - mal abgesehen davon, dass mit Ausnahme der Lizenz wohl auch noch gegen jeden einzelnen Punkt der Import Guidelines verstoßen wurde. Ich teste dennoch gerade ein paar zusätzliche Checks für die BEV-Daten, die eigentlich VOR dem Upload geklärt werden müssten, um hier jetzt wenn möglich zumindest im Nachhinein noch einige Problemfälle zu finden ohne alles rückgängig machen zu müssen, oder zumindest die Auswirkungen in Zukunft zu reduzieren. Manche Punkte kosten gar nichts, andere sind in der aktuellen Form aber nicht gerade effizient was die Laufzeit betrifft. Ein einzelner Bezirk kann dann in manchen noch nicht so gut erfassten Gegenden auch schon einmal 1-2 Stunden laufen. Prinzipiell könnten solche Fälle gefunden werden:
-
BEV-Adressen ohne Gebäude oder Identadressen
Die Daten scheinen hier nicht besonders verlässlich zu sein. Die meisten Adressen des folgenden Chaos haben in den BEV-Daten zwar kein Gebäude zugewiesen (mit “F” markiert), es sind aber durchaus auch einige dabei, wo die “Gebäudeposition” mitten im See liegen soll - ohne visueller Kontrolle wird man solche fehlerhaften Daten oft nicht finden:
Umgekehrt gibt es auch Adressen, wo eindeutig Gebäude vorhanden sind, der BEV-Adresse aber dennoch keine zugewiesen sind (und mit “eindeutig” meine ich lokales Wissen und nicht möglicherweise veraltete Luftbilder)
-
ähnliche Adresse in X m Entfernung
Ähnliche Adressen werden nur heraus gefiltert, wenn es keine größere Abweichung der Position gibt, da anderenfalls nicht klar ist, welche der Positionen falsch ist (falls überhaupt und nicht nur das Gelände so groß ist). Diese Fälle werden jetzt entspr. markiert. -
sehr nahe andere Adresse gefunden bzw. innerhalb eines Gebäudes/Bereichs mit anderer Adresse
(Der Screenshot ist nicht mehr ganz aktuell, ich prüfe bspw. nicht mehr mehrere Bedingungen, wenn schon eine zutrifft, aber zur Demonstration ist es ganz gut geeignet)
4a) keine Straße mit diesem Namen (oder alt_name/official_name) in der Nähe / in dem Bereich gefunden
Neben einem fehlenden Straßennamen kann das auch ein Hinweis darauf sein, dass eigentlich addr:place statt addr:street gehört, oder dass die Schreibweise des Straßennamens in einer Form abweicht, die nicht durch die Normalisierung abgedeckt ist.
4b) Straße weit entfernt von der einzelnen Adresse
Punkt a kann zum Teil auch mit dem OSM Inspector überprüft werden, der ebenfalls auch alternative Straßennamen unterstützt, ansonsten aber um einiges kleinlicher ist, was die Schreibweise betrifft und schon fehlende Bindestriche bekrittelt. Bei der Distanz zur Straße ist er dagegen recht tolerant und nicht geeignet solche Ausreißer zu finden.
( 5) Hausnummern ohne addr:street/addr:place in der Umgebung gefunden)
Es gibt Bereiche, wo Leute OTG oder per basemap nur Hausnummern, aber keine dazugehörigen street/place eingetragen haben.
Wird tlw. schon von Punkt 3 und v.a. auch vom OSMI abgedeckt, also habe ich das wieder gestrichen.
( 6) addr:place ohne Place mit entsprechendem Namen in dem Bereich)
Nach meinen Tests war das oft falscher Alarm, da addr:place sowieso nur automatisch gesetzt wird, wenn der Straßenname mit dem Ortsnamen in den BEV-Daten ident ist und in diesen Fällen existiert auch meistens ein place Node für die Ortschaft, der nur in bestimmten nachvollziehbaren Fällen durch die Auswahl des Suchbereichs nicht gefunden wurde, weshalb ich das wieder gestrichen habe.
Kann auch mit OSMI überprüft werden, was aber offenbar keine flächigen Places unterstützt.
Nachdem die Ausgangsdaten des Imports bekannt sind und praktisch alle davon völlig unbearbeitet sind, sollte sich das auch im Nachhinein noch recht einfach finden und löschen lassen. Die gefundenen Adressen sind natürlich nicht alle zwingend falsch, aber auch nicht so problemlos, dass man sie ohne weitere Bearbeitung einfach irgendwo in die Gegend schmeißt und die “Drecksarbeit” dann anderen Mappern überlässt. Bei den Fällen von Punkt 4a (keine Straßen mit diesem Namen in dem Bereich) zahlt es sich wohl aus, die zu kontrollieren, Stichprobenweise habe ich das auch schon quer über Österreich gemacht, alle anderen Treffer würde ich löschen, beginnend mit einzelnen Bezirken in NÖ/Bgld. und anschließender Evaluierung. Auch tlw. automatisiert ist das Bereinigen aber immer noch um einiges aufwändiger als der Import
Code dazu findet sich hier. Für einzelne Gemeinde sollte damit das Filtern auch über den Standard-Overpass-Server möglich sein.