@dooley: ich nehm für sowas ST_PointOnSurface(geom). Ist fast immer der Schwerpunkt aber liegt auch bei “komischen” Flächen immer innerhalb der Fläche. ST_Center(geom) erzeugt schon mal seltsame Punkte.
Gruss
walter
@dooley: ich nehm für sowas ST_PointOnSurface(geom). Ist fast immer der Schwerpunkt aber liegt auch bei “komischen” Flächen immer innerhalb der Fläche. ST_Center(geom) erzeugt schon mal seltsame Punkte.
Gruss
walter
Dann gibt es keine angeschnittenen Flächen, das ist richtig. Damit ist das Problem immer noch nicht gelöst - der Schwerpunkt oder das Zentrum kann immer noch in der falschen Boundary liegen. Das wird man automatisiert nicht hinbekommen.
@Walter: Klar, PointOnSurface wäre dann die geeignete Funktion.
In der Regel liegt der “Schwerpunkt” im größeren Teil des Buildings. Damit ist die Wahrscheinlichkeit relativ gross, dass die Daten dazu passen…
Bei deiner Lösung hast du bei grenzüberschreitenden Polygonen (Buildings) definitiv immer einen Fehler, da ein Teil immer im falschen Bereich liegt. Aufgrund meiner Erfahrungen bei der PLZ-Auswertung beträgt die Trefferrate bei mir > 95 %.
Probier es doch einfach mal aus und vergleiche.
Gruss
walter
Doch die reicht
Ich hab ma ne halb-OT-Frage an die Experten:
(wikipedia)
wie mapt man das? addr:city=Naumburg und Bad Kösen lässt man aussen vor?
Siehe https://osm-suspects.gbconsite.de/map#18/51.10544/11.67381/osm-wrongcity-falsepositive
Es gab vor Jahren (< 2015) mal ein Tool
http://gulp21.bplaced.net/osm/housenumbervalidator/
was äußerst hilfreich war, um Adressfehler aufzuspüren. Leider wird das nicht weitergeführt. Könnte man dessen Features irgendwie mit in OSMsuspects unterbringen? Das wäre super!
(wikipedia)
Hmm, dass wäre dann ein addr:suburb in addr:suburb in addr:city?!
Und wie ist da eigentlich dann die postialische Anschrift?
PS: Nur zur Info, also bei https://www.postdirekt.de/plzserver/ wird es als
PLZ: 06628
Ortsname: Naumburg (Saale)
Ortsteil: Kleinheringen
geführt, da sieht man gar nichts von Bad Kösen…
ADD: also Bad Kösen findet man natürlich selbst auch als ein Ortsteil von Naumburg (Saale)
Welche Features meinst du genau?
Das was du (noch?) nicht eingebaut hast, war die Duplikatsuche. Da wurden Duplikate in ähnlich und exakt gleich noch unterteilt.
In diesem Sinne wäre (ich will es nur noch mal deutlicher formulieren) also folgendes Tagging empfehlenswert:
addr:city=Naumburg (Saale)
addr:suburb=Kleinheringen
Ich glaube am besten wäre es, wenn du einfach mal dieses Tool kurz ausprobierst. Dann siehst du sofort, was es kann.
Der heute dazugekommene Layer “Duplikate” auf der OSMsuspects-Karte ist höchst experimentell.
Ausgewertet werden mehrfache addr:housenumber und addr-street und Objekttyp (soweit ich die feststellen kann im Moment) innerhalb einer 1000m Radius.
Wenn ihr meint, dass da ein Fehler drin ist, bitte mindestens 2 betroffene Objekte mit Links zu openstreetmap.org angeben und kurz beschreiben, warum das ein falsch ist, ansonsten suche ich mich tot.
Gruß, Frank
https://osm-suspects.gbconsite.de/#18/48.27600/11.55884/osm-dupes
Die häufigsten false-positive in meiner Gegend sind gleiche Straßennamen&Hausnummern in nah beieinanderliegen Dörfern z.B. hier
https://osm-suspects.gbconsite.de/#15/54.0111/9.2207/osm-dupes
https://www.openstreetmap.org/way/194752169 https://www.openstreetmap.org/way/194925605
Gruß Norbert
Wo liegen denn die Dörfer auch unter 1 km beieinander Ok, notiert und sollte morgen gefixt sein.
Moin,
ich bin ja mal gespannt, welche Entfernung Du jetzt gewählt hast.
Ich (unter)biete sonst noch mal: 680 m
https://osm-suspects.gbconsite.de/#15/54.3450/10.3439/osm-wrongcity-wrongstreet-outsideplz-dupes
Grüße, Georg
Radius ist gleich, ich prüfe nur zusätzlich auf addr:city, wenn vorhanden.
Die optimale Strategie der Dublettensuche scheint nicht trivial zu sein. Ich nehme an, es ist bekannt, dass der Quellcode von
http://gulp21.bplaced.net/osm/housenumbervalidator/
auf
https://github.com/gulp21/housenumbervalidator
zu finden ist. Vielleicht könnte man dort ja nach dem entsprechenden Algorithmus suchen, oder ist das schon erfolgt?
vs:
Was imho noch wünschenswert wäre, wäre Aufnahme in die Statistik und false-positive setzen.
Meine Lösung basiert rein auf SQL. Ich muß halt immer die Laufzeit im Auge behalten, soll ein täglicher Update erfolgen und die Daten bis ~07:00 zur Verfügung stehen.
Gleiche Hausnummer + gleiche Strasse + gleiche City + gleicher Objekttyp innerhalb 1000 Meter ist für mich eine Doublette. Welche Objekttypen (OSM: key eines Tags) zusätzlich in Frage kommen, ist noch zu klären. Da warte ich in Ruhe die Rückmeldungen ab…
Ich würde wohl eher maximal 250m Umkreis befürworten… 50-100m würden sicher auch reichen… Wie große wäre denn da der Unterschied?
Sven
Man sollte nachts nicht arbeiten… Gültig ab morgen: Hab den Link korrigiert und einen zusätzlichen eingebaut. In der Statistik sollten die Dupes dann auch auftauchen.
dupes auf false-positive setzen: Wird nur gehen, wenn ihr damit leben könnt, dass die dann erst am nächsten Tag “weg” sind. Das hat technische Gründe.