OSMSuspects - Qualitätssicherung Adressen (Deutschland)

Das hat aber woanders negative Auswirkungen:
Ich hatte eine Straße, die war 100 m lang richtig getaggt, hatte dann aber einen falschen Namen. Erst die Häuser am Ende nach ca. 500 m (mit richtiger Adresse) wurden dann moniert. Dadurch fiel der Fehler im Straßenname auf.

Ein Suchradius von 1500 m für Straßen scheint mir viel zu groß. Dadurch gehen alle Adressen als ok durch, wenn im Dorf nur irgendeine Straße so heißt. Sogar 500 m finde ich sehr reichlich. So weit ist im residential kein Haus von der Straße entfernt.
Da bleiben tendenziell viele Fehler unentdeckt (missing positives).

Was anderes ist es mit addr:place. Das kommt vor allem in der Pampa vor, wo in der Nähe typischerweise nichts mit anderem Namen liegt.

Das stimmt natürlich. Ich hatte mich für 500m als Kompromiss entschieden, weil es doch einige Gebäude, gibt, die etwas weiter von der Straße entfernt sind. Nun, mal die Auswertung morgen abwarten. Der Parameter ist ja schnell geändert.

Das ist wie bei praktisch allen solchen Überwachungstools ein Kompromiss zwischen zu vielen missing positives und zu vielen false alarms. Problem ist, dass fehlende Punkte viel schwerer zu entdecken sind als welche zu viel, nur die letzteren fallen aber ins Auge.

Wie der eine oder andere vielleicht gemerkt hat, ist OSMSuspects u.U. heute etwas zäh. Das liegt daran, dass ich im Moment die Auswertung etwas umstelle und Laufzeiten getestet habe, um realistische Werte zu erhalten.

Der ungenaue Check auf addr:city (nur Schreibweise, keine räumliche Prüfung) hat mich ja schon eine Weile gestört und ich habe dazu auch ein paar Fragen bekommen. Ich habe das jetzt folgendermaßen umgestellt: Prüfung auf Namen von den administrativen Boundaries aus OSM und (per Verknüpfung über amtliche Gemeindeschlüssel) “gen” aus den VG250-Daten UND ein räumlicher Check, ob das Adress-Objekt innerhalb der admin-Boundaries liegt. Der Vergleich mit den Namen aus den PLZ-Notes ist dafür weggefallen.

U.a. wie und was geprüft wird, kann man jetzt auf meiner Benutzerseite im Wiki nachlesen: https://wiki.openstreetmap.org/wiki/User:Dooley

Nachteil des neuen Verfahrens: Eventuell dauert die Auswertung nun “etwas” länger, bisher war sie um ca. 04:00 fertig, dass ist nicht mehr erreichbar. Aber wenn sie um 06:00 fertig ist, bin ich auch zufrieden.

Im Augenblick (18.02. 19:40) habe ich nochmal einen kompletten Durchlauf der Auswertung manuell gestartet. Wenn der erfolgreich durch ist, werde ich die Statistik-Seite am Montag auf “null” setzen, da die Werte so nicht mehr vergleichbar sind.

Edit: Ausserdem habe ich gestern einen schweren Fehler gefunden, den ich gestern abend noch behoben habe für die heutige Auswertung: ich hatte admin_level 7-9 verwendet statt 6-8. Daher in der Statistik vom 18.02 auch die Riesensprünge.

Super! Schon werden zahlreiche weitere Problemfälle gefunden, die vorher nicht entdeckt wurden.

Allerdings fallen mir auch ein paar falsch-positive Treffer auf. Wahrscheinlich sind diese nie ganz vermeidbar. Hier hätte ich zwei Gebäude, die jeweils (so wie derzeit gemappt) „auf“ der Gemeindegrenze stehen, wobei sie jeweils mit dem größeren Teil auf der „richtigen“ Seite stehen. addr:city stimmt also jeweils. Wahrscheinlich ist es nicht zu vermeiden, ja sogar sinnvoll, sie dennoch anzuzeigen, weil sie ja Zweifelsfälle sind; oder was meinst Du/Ihr?

https://osm-suspects.gbconsite.de/#17/49.06445/9.11233/osm-wrongcity
= https://www.openstreetmap.org/way/109588687

https://osm-suspects.gbconsite.de/#15/49.0521/9.0958/osm-wrongcity
= https://www.openstreetmap.org/way/143770010

In der Gegend gibt es noch mehrere ähnliche Fälle. Immer wenn ein ein Gebäude (oder ein leisure etc.) direkt auf der Grenze steht, wird das als fehlerhaft markiert. Die Frage ist: gut oder nicht gut? Wahrscheinlich muss man es so machen, denn man kann schlecht automatisiert feststellen, welche Seite die richtige ist – außer man geht nach dem größeren Teil … aber das ist aufwändig und fehleranfällig, oder?

so, nu is bei mir alles weiß und alles falsepositive :laughing:
ist halt das problem in deutschland, dass es einfach nicht durchgängig gleich ist.

Ja, Berlin war bis gestern komplett frei von Weißen, heute Hunderte, vielleicht Tausende :open_mouth:

Argh, ich Depp. Die Stadtstaaten Hamburg und Berlin vergessen, die 2 Sonderfälle haben ja admin_level. 4 Ich setz mich gleich dran.

Edit: Berlin und Hamburg sind gefixt. Um die 600.000 Adressen waren betroffen.

@Harald: Ich schau mal, ob ich auch noch die PLZ-Boundaries (spatial) zur Prüfung dazunehmen kann. Das Problem besteht sicher auch in anderen Gemeinden (wobei wir wieder beim Problem wären “Navi”- oder “Briefträger”-Adresse).

Des einen Freud, des anderen Leid:
Bei mir sind etliche Adressfehler entlang der Stadtgrenze neu aufgetaucht.

BTW: Richtige PLZ, aber falsche Stadt, daher bei den Fools nicht gefunden.

Nix “Depp” - hast ein ziemlich hilfreiches QA-Tool aufgebaut!

Danke. Sieht in der Tat wieder “ordentlich” aus. Ein paar Fehlerchen wurden dennoch über den alten Stand hinaus gefunden (‘addr:city=Berlin Neukölln’). Hab mich dieser größtenteils schon angenommen

Schönen Sonntag :slight_smile:

Genau darauf wollte ich hinaus, man wird es trotzdem eigentlich “geordneten” Deutschland mit all seinen Gesetzen und Verordnungen wohl nicht jedem Recht machen können.

PS: Und ich hatte es ja schon erwähnt, da die postialische Sicht bei uns noch gar nicht geklärt ist, habe ich definitiv aus navigatorischer Sicht (Ortsschilder) erfasst, inkl. admin_level 10/11

Ich mein rein theoretisch müsste/könnte ich jetzt auch einfach addr:city=Schleusegrund und addr:suburb=Gießübel|Schönbrunn|Steinbach|Langenbach|Lichtenau|Engenstein|Biberschlag|Tellerhammer taggen

Das mit dem Prüfen des Namens gegen die PLZ-Boundary würde auch kein Ergebnis liefern, da in den Notes dort auch nur Schleusegrund vermerkt ist. Das baue ich also erstmal nicht ein.

Dein Vorschlag würde darauf hinauslaufen, (in Deutschland) administrative statt postalischer Adressen zu verwenden. Das wäre gegen das akzeptierte https://wiki.openstreetmap.org/wiki/DE:Key:addr - wobei ich persönlich deinem Vorschlag viel abgewinnen kann. Mit “Rehbachstraße, 98667 Schleusegrund - Gießübel” können sowohl der Briefträger wie auch das Navi oder allgemeine Suchen was anfangen. Tja, so ist es halt.

jetzt muss ich leider mal, und weil es auch schon neulich in einem anderen Thread erwähnt wurde, den Krümmelkacker und Besserwisser raushängen lassen, laut Briefumschlag richtig beschriften wäre es eher

Gießübel
Rehbachstraße
98667 Schleusegrund

:wink: :sunglasses:

PS: und bzgl. postialischer/navigatorischer Adresse bin ich halt zwiegespalten, da es hier halt nicht klar ist. würde ich jetzt nur addr:city=Schleusegrund taggen, wäre postialisch und administrativ und politisch richtig(er), aber ein Autofahrer sucht doch in erster Linie nach addr:city=Schönbrunn (Ortseingangsschild)

EDIT: typo

Da musste allerdings noch bissi üben, oder was ist ein Krümmel? :wink:

Mein Garmin findet die Rehbachstraße wahlweise mit Stadtname Gießübel oder Schleusegrund :smiley:

Unstrukturierte Suchen (wie bei Nominatim z.B.) sollten ebenso mit “Rehbachstraße Gießübel” oder “Rehbachstraße Schleusegrund” zurechtkommen.

Ich werde jetzt erstmal das Restwochende genießen…

PS: Bei uns heisst das Korinthenkacker :wink: Da sind auch nicht soviel “m” drin :laughing:

Gruß, Frank

Edit: “postalisch richtig(er)”: https://www.postdirekt.de/plzserver/ findet Schleusegrund gar nicht, aber Gießübel mit Zusatz. Da weiss ich jetzt gar nicht, was ich davon halten soll.

Vielen Dank für dieses tolle Tool, habe schon einiges in meiner Umgebung bereinigt :slight_smile:

Einen interessanten Fall habe ich gefunden:
und zwar der Weiler Hardt- und Schönbühlhof https://de.wikipedia.org/wiki/Hardt-_und_Sch%C3%B6nb%C3%BChlhof
Der liegt zur Hälfte in Markgröningen, zur Hälfte in Schwieberdingen, gehört postalisch allerdings komplett zu Markgröningen.

Und problematisch sind auch die Ortsnamen, die es in mehreren Teilen Deutschlands gibt.
Sonst gefällt mir die Seite aber sehr! :slight_smile:

OSMsuspects! hat eine kleine Verbesserung erfahren: Ähnlich wie auf openstreetmap.org kann man jetzt mit Klick auf die Karte rausfinden, in welchem PLZ-Gebiet und in welchen administrativen Boundaries die Koordinaten des Klicks liegen. Einzuschalten über den “?”-Button rechts oben und dann auf die Karte klicken und kurz warten. Das ist ein “Once-Only”-Klickhandler - d.h. ausschalten braucht man das nicht, nur jedesmal einschalten.

Als nächstes werde ich mich den “false positives” widmen, da kamen doch einige Rückmeldungen. Das bisherige Filtern/Ignorieren ist nicht zufriedenstellend, das muß “global” passieren.

Kurzer Hinweis: Ich habe am Wochenende das short_name-Tag zum matchen von addr:city in die Auswertung mit reingenommen.

Hi,

hab mir kurz mal angeschaut wo so alles Fehler sind dabei ist aufgefallen…

Das er hier eine Fehler meldet das die addr:city falsch ist… “Grafing bei München” … das ist aber richtig… im boundary ist das “bei München” als “name:suffix” eingetragen. Wird das nicht berücksichtigt?

https://www.openstreetmap.org/relation/929925#map=13/48.0349/11.9768

Ah ja, das muß ich noch einbauen. Danke für den Hinweis.