OSMSuspects - Qualitätssicherung Adressen (Deutschland)

Kannst Du nicht einfach den Schwerpunkt (oder einen sonstwie definierten Mittelpunkt) der Flächen zur Auswertung nehmen? Dann gäb’s keine angeschnittenen Flächen mehr.

Baßtölpel

Unsere Tropenhalleninsel (Tropical Islands) ist wahrlich eine suspekte Angelegenheit…

Das ganze firmiert (offiziell) Tropical-Islands-Allee 1 in 15910 Krausnick. Von der Lage her liegt das aber Briesen ( Ortsteil von Halbe). Sowohl Biesen, als auch Krausnick haben eine Tropical-Islands-Allee. Ob die Häuser im postalischen Sinne eigenständig sind, weiß ich nicht… Um das Areal mache ich immer gerne einen Bogen…

Ich lass das erst mal…

Nicht ganz so falsch ist Jänschwalde Ost; ist auch postalisch unterschieden von Jänschwalde. (Fall von Adresse ist korrekt.)

Sven

@dooley: ich nehm für sowas ST_PointOnSurface(geom). Ist fast immer der Schwerpunkt aber liegt auch bei “komischen” Flächen immer innerhalb der Fläche. ST_Center(geom) erzeugt schon mal seltsame Punkte.

Gruss
walter

Dann gibt es keine angeschnittenen Flächen, das ist richtig. Damit ist das Problem immer noch nicht gelöst - der Schwerpunkt oder das Zentrum kann immer noch in der falschen Boundary liegen. Das wird man automatisiert nicht hinbekommen.

@Walter: Klar, PointOnSurface wäre dann die geeignete Funktion.

In der Regel liegt der “Schwerpunkt” im größeren Teil des Buildings. Damit ist die Wahrscheinlichkeit relativ gross, dass die Daten dazu passen…

Bei deiner Lösung hast du bei grenzüberschreitenden Polygonen (Buildings) definitiv immer einen Fehler, da ein Teil immer im falschen Bereich liegt. Aufgrund meiner Erfahrungen bei der PLZ-Auswertung beträgt die Trefferrate bei mir > 95 %.

Probier es doch einfach mal aus und vergleiche.

Gruss
walter

Doch die reicht :slight_smile:

Ich hab ma ne halb-OT-Frage an die Experten:

(wikipedia)

wie mapt man das? addr:city=Naumburg und Bad Kösen lässt man aussen vor?

Siehe https://osm-suspects.gbconsite.de/map#18/51.10544/11.67381/osm-wrongcity-falsepositive

Es gab vor Jahren (< 2015) mal ein Tool

http://gulp21.bplaced.net/osm/housenumbervalidator/

was äußerst hilfreich war, um Adressfehler aufzuspüren. Leider wird das nicht weitergeführt. Könnte man dessen Features irgendwie mit in OSMsuspects unterbringen? Das wäre super!

(wikipedia)
Hmm, dass wäre dann ein addr:suburb in addr:suburb in addr:city?!
Und wie ist da eigentlich dann die postialische Anschrift?

PS: Nur zur Info, also bei https://www.postdirekt.de/plzserver/ wird es als

PLZ: 06628
Ortsname: Naumburg (Saale)
Ortsteil: Kleinheringen

geführt, da sieht man gar nichts von Bad Kösen…

ADD: also Bad Kösen findet man natürlich selbst auch als ein Ortsteil von Naumburg (Saale)

Welche Features meinst du genau?

Das was du (noch?) nicht eingebaut hast, war die Duplikatsuche. Da wurden Duplikate in ähnlich und exakt gleich noch unterteilt.

In diesem Sinne wäre (ich will es nur noch mal deutlicher formulieren) also folgendes Tagging empfehlenswert:

addr:city=Naumburg (Saale)
addr:suburb=Kleinheringen

Ich glaube am besten wäre es, wenn du einfach mal dieses Tool kurz ausprobierst. Dann siehst du sofort, was es kann.

Der heute dazugekommene Layer “Duplikate” auf der OSMsuspects-Karte ist höchst experimentell.

Ausgewertet werden mehrfache addr:housenumber und addr-street und Objekttyp (soweit ich die feststellen kann im Moment) innerhalb einer 1000m Radius.

Wenn ihr meint, dass da ein Fehler drin ist, bitte mindestens 2 betroffene Objekte mit Links zu openstreetmap.org angeben und kurz beschreiben, warum das ein falsch ist, ansonsten suche ich mich tot.

Gruß, Frank

https://osm-suspects.gbconsite.de/#18/48.27600/11.55884/osm-dupes

Die häufigsten false-positive in meiner Gegend sind gleiche Straßennamen&Hausnummern in nah beieinanderliegen Dörfern z.B. hier
https://osm-suspects.gbconsite.de/#15/54.0111/9.2207/osm-dupes

https://www.openstreetmap.org/way/194752169 https://www.openstreetmap.org/way/194925605

Gruß Norbert

Wo liegen denn die Dörfer auch unter 1 km beieinander :wink: Ok, notiert und sollte morgen gefixt sein.

Moin,

ich bin ja mal gespannt, welche Entfernung Du jetzt gewählt hast.
Ich (unter)biete sonst noch mal: 680 m :wink:
https://osm-suspects.gbconsite.de/#15/54.3450/10.3439/osm-wrongcity-wrongstreet-outsideplz-dupes

Grüße, Georg

Radius ist gleich, ich prüfe nur zusätzlich auf addr:city, wenn vorhanden.

Die optimale Strategie der Dublettensuche scheint nicht trivial zu sein. Ich nehme an, es ist bekannt, dass der Quellcode von
http://gulp21.bplaced.net/osm/housenumbervalidator/

auf

https://github.com/gulp21/housenumbervalidator

zu finden ist. Vielleicht könnte man dort ja nach dem entsprechenden Algorithmus suchen, oder ist das schon erfolgt?

vs:

Was imho noch wünschenswert wäre, wäre Aufnahme in die Statistik und false-positive setzen.

Meine Lösung basiert rein auf SQL. Ich muß halt immer die Laufzeit im Auge behalten, soll ein täglicher Update erfolgen und die Daten bis ~07:00 zur Verfügung stehen.

Gleiche Hausnummer + gleiche Strasse + gleiche City + gleicher Objekttyp innerhalb 1000 Meter ist für mich eine Doublette. Welche Objekttypen (OSM: key eines Tags) zusätzlich in Frage kommen, ist noch zu klären. Da warte ich in Ruhe die Rückmeldungen ab…