OSMSuspects - Qualitätssicherung Adressen (Deutschland)

Hi dooley,

wie definierst Du eigentlich "benutzbare Adressen? Die letzen Tage sind anscheinend täglich etwa 1000 mehr neue als benutzbare Adressen hinzugekommen.

Baßtölpel

@dooley: so wie es eine Warnung bei zoom<10 gibt, wäre eine Warnung, daß man noch keinen layer ausgewählt hat sinnvoll.

Baßtölpel

Objekte, bei denen Hausnummern, Straße oder Platz, City und Postleitzahl vorhanden und nicht falsch sind, die man also ohne weitere Verarbeitung verwenden könnte.

FYI: Irgendwie hat der Download des germany-Extraktes heute nacht nicht geklappt, daher im Moment keine Daten in OSMsuspects vorhanden. Ich habe die Auswertung eben manuell angestoßen, bis spätestens ca. 14:30 sollte sie fertig sein.

Hallo dooley,

vielen Dank für Deine Arbeit und das wirklich gute Tool, das dabei herausgekommen ist. Ich habe bisher mit OSM Inspector gearbeitet, der unter der Rubrik “Adressen” auch schon viele Fehler findet (und ich hatte geglaubt ich wäre fertig in “meinem Revier”), aber ich wurde leider desillusioniert durch OSMSuspects!

Bei der Duplicat-Prüfung ist mir jedoch ein einen false positive aufgefallen:

https://www.openstreetmap.org/way/169991752

addr:housenumber	8
addr:street	Geringswalder Straße
addr:suburb	
addr:country

https://www.openstreetmap.org/way/1493348959

addr:housenumber	8
addr:street	Geringswalder Straße
addr:suburb	Zschaagwitz
addr:postcode	09306
addr:city	Seelitz
addr:country	DE

Die werden als Duplikat angezeigt, vermutlich weil bei der ersten Adresse “addr:city” nicht gesetzt ist. Sie sind aber keines, da die erste Adresse in der Gemeinde Erlau liegt. Könnte man dieses fehlende Attribut irgendwie abfragen? Oder könnte man feststellen, dass zwischen beiden ein Grenze mit admin_level=8 (oder kleiner) existiert?

Fakt ist, wenn bei beiden addr:city gesetzt ist wird es nicht mehr angezeigt, Beispiel:
https://www.openstreetmap.org/node/4041040281
https://www.openstreetmap.org/way/70081458

Bei letzterem habe ich letzte Woche addr:city ergänzt, davor war es auch ein Duplikat.

Vielen Dank im voraus,
JSe

Gut erkannt. Da muß ich ein wenig testen, ob ich das einigermaßen performant hinbekomme, grundsätzlich spricht da aber nichts dagegen.

Heute nacht ist die Auswertung nicht fertig geworden, osm2pgsql habe ich eben nach 8 Stunden Laufzeit (normal ca. 90 Minuten) abgebrochen und den Import/Auswertung manuell neu gestartet.

Da ich gestern in dem Abschnitt keine Änderungen vorgenommen habe und das pbf normal groß aussieht, muß ich wohl den Admin mit einer Hardware-Analyse belästigen, wenn es wieder nicht funktioniert.

Der Dienst ist heute nur eingeschränkt nutzbar :frowning: - Is-In wird nicht ǵehen und etwas langsamer dürfte es auch sein.

Hier ein Beispiel für falsch erkannte Adressdubletten.

https://www.openstreetmap.org/way/391765404
https://www.openstreetmap.org/node/4721589554

In Schenefeld und Puls scheinen auch falsche Dubletten zu sein. Ich habe das aber nicht genauer überprüft.

https://osm-suspects.gbconsite.de/map#13/54.0483/9.5274/osm-dupes

Die in Schenefeld dargestellten 2 Dubletten-Paare (Lindenweg 6 und 8) scheinen aber echte Dubletten zu sein, d.h. hier ist jeweils entweder die Hausnummer oder die Straßenzuordnung falsch. Oder was übersehe ich da?

(Nicht immer liegt OSMSuspects falsch, meistens sind wirklich unsere Daten falsch – jedenfalls ist das bisher meine Erfahrung ;))

Ja, im Lindenweg sind wohl echte Dubletten. Aber die in der Bahnhofstraße von Schenefeld und Puls sind Fehler.

Ich hatte gestern abend noch einen Bug gefixt deswegen gefixt - ich hab fehlende “addr.city” aus den Boundaries geholt, aber statt den name-Key der Boundaries zu verwenden, hatte ich den addr-city-Key verwendet. Die Auswertung ist heute auch erst um 08:37 fertiggeworden > bitte nochmal nachschauen. Danke.

Hallo dooley,

“meine” false positiv Dublette wird jetzt nicht mehr angezeigt (und viele andere sicher auch). Ich hoffe, dass diese Änderung nicht doch noch an dem Laufzeitproblem scheitern muß.

Nochmals vielen Dank!

Dooley: https://forum.openstreetmap.org/viewtopic.php?pid=637530#p637530 überlesen, kein Interesse, nicht umzusetzen etc.?
Hätte da gern mind. eine Absage.

Dafür sind einige Änderungen nötig, für die ich im Moment leider keine Zeit habe. Aber ich habs mal in meine ToDo-Liste aufgenommen.

Danke.

Auch nach der Aktualisierung vom 31.3.2017 sind die falschen Dubletten noch drin

  1. Beispiel:
    https://www.openstreetmap.org/way/391765404
    https://www.openstreetmap.org/node/4721589554

2.Beispiel:
https://www.openstreetmap.org/way/277863429
https://www.openstreetmap.org/way/403844492

Beide enthalten von Haus aus eine vollständige Adresse, einmal mit addr:suburb. addr:postcode ist gleich. Könnte das eine Rolle spielen?


Ortsteil: Schenefeld
Bahnhofstr.

25560 Schenefeld

Nein. Ich hab dummerweise einen case im SQL übersehen… :frowning: Danke fürs Dranbleiben. Morgen bitte nochmal kontrollieren.

PS: suburb wird (noch) nicht berücksichtigt

Die gestrige Änderung an der Dupes-Erkennung scheint gewirkt zu haben. Mit dem netten Nebeneffekt, dass die komplette Auswertung jetzt ca. 1,5h schneller fertig ist, wieder so zwischen 06:30 und 07:00. Was so ein kleiner übersehener Entscheidungszweig ausmachen kann :smiley:

Stimmt. Meine Problemfälle sind weg.