OSMSuspects - Qualitätssicherung Adressen (Deutschland)

Gut erkannt. Da muß ich ein wenig testen, ob ich das einigermaßen performant hinbekomme, grundsätzlich spricht da aber nichts dagegen.

Heute nacht ist die Auswertung nicht fertig geworden, osm2pgsql habe ich eben nach 8 Stunden Laufzeit (normal ca. 90 Minuten) abgebrochen und den Import/Auswertung manuell neu gestartet.

Da ich gestern in dem Abschnitt keine Änderungen vorgenommen habe und das pbf normal groß aussieht, muß ich wohl den Admin mit einer Hardware-Analyse belästigen, wenn es wieder nicht funktioniert.

Der Dienst ist heute nur eingeschränkt nutzbar :frowning: - Is-In wird nicht ǵehen und etwas langsamer dürfte es auch sein.

Hier ein Beispiel für falsch erkannte Adressdubletten.

https://www.openstreetmap.org/way/391765404
https://www.openstreetmap.org/node/4721589554

In Schenefeld und Puls scheinen auch falsche Dubletten zu sein. Ich habe das aber nicht genauer überprüft.

https://osm-suspects.gbconsite.de/map#13/54.0483/9.5274/osm-dupes

Die in Schenefeld dargestellten 2 Dubletten-Paare (Lindenweg 6 und 8) scheinen aber echte Dubletten zu sein, d.h. hier ist jeweils entweder die Hausnummer oder die Straßenzuordnung falsch. Oder was übersehe ich da?

(Nicht immer liegt OSMSuspects falsch, meistens sind wirklich unsere Daten falsch – jedenfalls ist das bisher meine Erfahrung ;))

Ja, im Lindenweg sind wohl echte Dubletten. Aber die in der Bahnhofstraße von Schenefeld und Puls sind Fehler.

Ich hatte gestern abend noch einen Bug gefixt deswegen gefixt - ich hab fehlende “addr.city” aus den Boundaries geholt, aber statt den name-Key der Boundaries zu verwenden, hatte ich den addr-city-Key verwendet. Die Auswertung ist heute auch erst um 08:37 fertiggeworden > bitte nochmal nachschauen. Danke.

Hallo dooley,

“meine” false positiv Dublette wird jetzt nicht mehr angezeigt (und viele andere sicher auch). Ich hoffe, dass diese Änderung nicht doch noch an dem Laufzeitproblem scheitern muß.

Nochmals vielen Dank!

Dooley: https://forum.openstreetmap.org/viewtopic.php?pid=637530#p637530 überlesen, kein Interesse, nicht umzusetzen etc.?
Hätte da gern mind. eine Absage.

Dafür sind einige Änderungen nötig, für die ich im Moment leider keine Zeit habe. Aber ich habs mal in meine ToDo-Liste aufgenommen.

Danke.

Auch nach der Aktualisierung vom 31.3.2017 sind die falschen Dubletten noch drin

  1. Beispiel:
    https://www.openstreetmap.org/way/391765404
    https://www.openstreetmap.org/node/4721589554

2.Beispiel:
https://www.openstreetmap.org/way/277863429
https://www.openstreetmap.org/way/403844492

Beide enthalten von Haus aus eine vollständige Adresse, einmal mit addr:suburb. addr:postcode ist gleich. Könnte das eine Rolle spielen?


Ortsteil: Schenefeld
Bahnhofstr.

25560 Schenefeld

Nein. Ich hab dummerweise einen case im SQL übersehen… :frowning: Danke fürs Dranbleiben. Morgen bitte nochmal kontrollieren.

PS: suburb wird (noch) nicht berücksichtigt

Die gestrige Änderung an der Dupes-Erkennung scheint gewirkt zu haben. Mit dem netten Nebeneffekt, dass die komplette Auswertung jetzt ca. 1,5h schneller fertig ist, wieder so zwischen 06:30 und 07:00. Was so ein kleiner übersehener Entscheidungszweig ausmachen kann :smiley:

Stimmt. Meine Problemfälle sind weg.

2 kleine Änderungen in OSMsuspects!

  • Die Statistik zeigt jetzt auch falsche addr:housenumber an
  • Im Duplikate-Popup kann man jetzt durch Klick auf die Duplikate-Einträge zu dem entsprechenden Duplikat hinspringen.

Ich habe hier z.B. einen Problemfall wo ich mir “Als korrekt markierte Adressen” bei “Duplikate: addr:housenumber + addr:street + Objekttyp innerhalb 5 km” wünschen würde (oder auch als falsch-positive).

http://www.openstreetmap.org/node/4473532389#map=19/50.99705/13.64831
http://osm-suspects.gbconsite.de/#19/50.99715/13.64802/osm-dupes

Zwei Ärzte (unterschiedliche) eine mit Eingang von der Straße (neben der Apotheke) und eine im ersten Stock des (Wohn-)Hauses - Eingang über den Hof (Haupteingang des Hauses) betretbar.

Der benachbarte Fall ist auch so ähnlich:

http://www.openstreetmap.org/node/4475360258

Haupteingang zu den Geschäftsräumen im Erdgeschoss - Straßenseite
Haupteingang zu den Wohnräumen über die Außentreppe im Hof

Ich würde (zumindest im Moment) sehr gerne auf das “als korrekt markieren” bei den Dupes verzichten. Ich hab die Erkennung eben um “name” erweitert, das sollte zumindest in den Fällen “mehrere gleiche POI-Typen mit gleicher Adresse” helfen.

Zu deinem letzten Fall (Hausnummer 206):

Mir ist da nicht klar, ob das tatsächlich 2 verschiedene Gebäude sind oder eins mit 2 Eingängen. Wenn es 2 verschiedene sind und die in real die gleiche Hausnummer haben, dann hab ich ein Problem mit der Auswertung (das wäre pro korrekt markieren).

Wenn es aber das gleiche Gebäude ist, wären die Eingänge entsprechend ihrer Bedeutung zu kennzeichnen und somit auch unterscheidbar.

Nebenbei: AFAIK sind Hauseingänge als Teil des Gebäudes und nicht als einzelstehende Punkte zu taggen, zumindest schreibt das Wiki so: https://wiki.openstreetmap.org/wiki/Key:entrance

Dooley, deine lezten Änderungen müssen irgendwas zerschossen haben. Heute werden gefühlt 99% der Dupes nicht mehr angezeigt.

Ja, ich habs grad gemerkt. Man sollte Namen nur dann vergleichen, wenn auch welche vorhanden sind, das hab ich gestern nicht gemacht. :expressionless:

Ich hab die Abfrage eben geändert und teste diese gerade.

Edit: Der Live-Update ist durch, sieht auf den ersten Blick gut aus.