OSMSuspects - Qualitätssicherung Adressen (Deutschland)

wambacher · March 4, 2017, 10:54pm

@dooley: ich nehm für sowas ST_PointOnSurface(geom). Ist fast immer der Schwerpunkt aber liegt auch bei “komischen” Flächen immer innerhalb der Fläche. ST_Center(geom) erzeugt schon mal seltsame Punkte.

Gruss
walter

dooley · March 4, 2017, 11:37pm

Dann gibt es keine angeschnittenen Flächen, das ist richtig. Damit ist das Problem immer noch nicht gelöst - der Schwerpunkt oder das Zentrum kann immer noch in der falschen Boundary liegen. Das wird man automatisiert nicht hinbekommen.

@Walter: Klar, PointOnSurface wäre dann die geeignete Funktion.

wambacher · March 5, 2017, 12:45am

In der Regel liegt der “Schwerpunkt” im größeren Teil des Buildings. Damit ist die Wahrscheinlichkeit relativ gross, dass die Daten dazu passen…

Bei deiner Lösung hast du bei grenzüberschreitenden Polygonen (Buildings) definitiv immer einen Fehler, da ein Teil immer im falschen Bereich liegt. Aufgrund meiner Erfahrungen bei der PLZ-Auswertung beträgt die Trefferrate bei mir > 95 %.

Probier es doch einfach mal aus und vergleiche.

Gruss
walter

MKnight · March 5, 2017, 4:11pm

Doch die reicht

Ich hab ma ne halb-OT-Frage an die Experten:

(wikipedia)

wie mapt man das? addr:city=Naumburg und Bad Kösen lässt man aussen vor?

Siehe https://osm-suspects.gbconsite.de/map#18/51.10544/11.67381/osm-wrongcity-falsepositive

Geofreund1 · March 5, 2017, 4:17pm

Es gab vor Jahren (< 2015) mal ein Tool

http://gulp21.bplaced.net/osm/housenumbervalidator/

was äußerst hilfreich war, um Adressfehler aufzuspüren. Leider wird das nicht weitergeführt. Könnte man dessen Features irgendwie mit in OSMsuspects unterbringen? Das wäre super!

Harald_Hartmann · March 5, 2017, 4:44pm

(wikipedia)
Hmm, dass wäre dann ein addr:suburb in addr:suburb in addr:city?!
Und wie ist da eigentlich dann die postialische Anschrift?

PS: Nur zur Info, also bei https://www.postdirekt.de/plzserver/ wird es als

PLZ: 06628
Ortsname: Naumburg (Saale)
Ortsteil: Kleinheringen

geführt, da sieht man gar nichts von Bad Kösen…

ADD: also Bad Kösen findet man natürlich selbst auch als ein Ortsteil von Naumburg (Saale)

dooley · March 5, 2017, 8:49pm

Welche Features meinst du genau?

Thomas8122 · March 5, 2017, 9:06pm

Das was du (noch?) nicht eingebaut hast, war die Duplikatsuche. Da wurden Duplikate in ähnlich und exakt gleich noch unterteilt.

Chrysopras · March 6, 2017, 7:35am

In diesem Sinne wäre (ich will es nur noch mal deutlicher formulieren) also folgendes Tagging empfehlenswert:

addr:city=Naumburg (Saale)
addr:suburb=Kleinheringen

Geofreund1 · March 6, 2017, 10:45am

Ich glaube am besten wäre es, wenn du einfach mal dieses Tool kurz ausprobierst. Dann siehst du sofort, was es kann.

dooley · March 9, 2017, 9:42am

Der heute dazugekommene Layer “Duplikate” auf der OSMsuspects-Karte ist höchst experimentell.

Ausgewertet werden mehrfache addr:housenumber und addr-street und Objekttyp (soweit ich die feststellen kann im Moment) innerhalb einer 1000m Radius.

Wenn ihr meint, dass da ein Fehler drin ist, bitte mindestens 2 betroffene Objekte mit Links zu openstreetmap.org angeben und kurz beschreiben, warum das ein falsch ist, ansonsten suche ich mich tot.

Gruß, Frank

https://osm-suspects.gbconsite.de/#18/48.27600/11.55884/osm-dupes

Fischkopp0815 · March 9, 2017, 9:59am

Die häufigsten false-positive in meiner Gegend sind gleiche Straßennamen&Hausnummern in nah beieinanderliegen Dörfern z.B. hier
https://osm-suspects.gbconsite.de/#15/54.0111/9.2207/osm-dupes

https://www.openstreetmap.org/way/194752169 https://www.openstreetmap.org/way/194925605

Gruß Norbert

dooley · March 9, 2017, 10:37am

Wo liegen denn die Dörfer auch unter 1 km beieinander Ok, notiert und sollte morgen gefixt sein.

GeorgFausB · March 9, 2017, 1:52pm

Moin,

ich bin ja mal gespannt, welche Entfernung Du jetzt gewählt hast.
Ich (unter)biete sonst noch mal: 680 m
https://osm-suspects.gbconsite.de/#15/54.3450/10.3439/osm-wrongcity-wrongstreet-outsideplz-dupes

Grüße, Georg

dooley · March 9, 2017, 2:19pm

Radius ist gleich, ich prüfe nur zusätzlich auf addr:city, wenn vorhanden.

Geofreund1 · March 9, 2017, 2:29pm

Die optimale Strategie der Dublettensuche scheint nicht trivial zu sein. Ich nehme an, es ist bekannt, dass der Quellcode von
http://gulp21.bplaced.net/osm/housenumbervalidator/

auf

https://github.com/gulp21/housenumbervalidator

zu finden ist. Vielleicht könnte man dort ja nach dem entsprechenden Algorithmus suchen, oder ist das schon erfolgt?

MKnight · March 9, 2017, 2:30pm

vs:

Was imho noch wünschenswert wäre, wäre Aufnahme in die Statistik und false-positive setzen.

dooley · March 9, 2017, 4:22pm

Meine Lösung basiert rein auf SQL. Ich muß halt immer die Laufzeit im Auge behalten, soll ein täglicher Update erfolgen und die Daten bis ~07:00 zur Verfügung stehen.

Gleiche Hausnummer + gleiche Strasse + gleiche City + gleicher Objekttyp innerhalb 1000 Meter ist für mich eine Doublette. Welche Objekttypen (OSM: key eines Tags) zusätzlich in Frage kommen, ist noch zu klären. Da warte ich in Ruhe die Rückmeldungen ab…

streckenkundler · March 9, 2017, 4:27pm

Ich würde wohl eher maximal 250m Umkreis befürworten… 50-100m würden sicher auch reichen… Wie große wäre denn da der Unterschied?

Sven

dooley · March 9, 2017, 4:33pm

Man sollte nachts nicht arbeiten… Gültig ab morgen: Hab den Link korrigiert und einen zusätzlichen eingebaut. In der Statistik sollten die Dupes dann auch auftauchen.

dupes auf false-positive setzen: Wird nur gehen, wenn ihr damit leben könnt, dass die dann erst am nächsten Tag “weg” sind. Das hat technische Gründe.