housenumbervalidator

Done.

Die Liste ist jetzt nach PLZ sortiert; angegeben ist jeweils die höchste PLZ, die in der Datei vorkommt.

(Das Skript für die Aufteilung ist Momentan noch in bash geschrieben, wird aber noch in das php-Skript, was ich noch ein wenig überarbeiten werde, integriert werden)

So, ich hab das Projekt jetzt mal wiederbelebt…

Den Code habe ich nochmal komplett in C++ neugeschrieben (Qeullcode bei GitHub) und die Ergebnisse sind jetzt auf einer Karte zu finden. Zur Zeit wird nur nach doppelt eingetragenen Hausnummern gesucht, wobei unvollständige Einträge ohne addr:(housenumber|street|postcode|city) und Einträge mit fixme ignoriert werden. Momentan werden nur Nodes ausgewertet, bei den Ways gib es irgendwie noch ein Problem, welches ich noch genauer untersuchen muss. (Vllt. wäre es doch am einfachsten, das ganze mit einer Datenbank zu machen…)

Bei den Ergebnissen sind wieder häufig falsche Straßennamen zu finden, die sich auch ohne Ortskenntnis korrigieren lassen.

Hast du den Auswertebereich eingeschränkt? Es fällt auf das auf den ersten Blick das “Ruhrgbiet” sehr stark betroffen ist. Weiter südlich scheint alles i.O. zu sein. Wäre ja schön, ist aber wenig glaubhaft… :slight_smile:
Desweiteren habe ich gesehen, dass ß,ä,ö,ü unterschlagen werden?!
Georg

Edit… sorry Frage eins hat sich erledigt, du schreibst ja oben das der Bereich eingeschränkt ist…

Ja, das hätte ich vielleicht nochmal hinschreiben können. Ausgewertet wird nordrhein-westfalen.osm von gestern.

Ein bekanntes Problem… QTextStream::readLine() ‘filtert’ die Sonderzeichen – warum auch immer – raus. Falls jemand weiß, wo der Fehler in meinem Code ist, soll er/sie es bitte sagen/schreiben.

Im Laufe des Tages kommt übrigens vllt. noch ein Update mit Unterstützung für Ways (sofern jetzt nichts schiefläuft…).

Die Seite wurde inzwischen etwas erweitertet: Es stehen jetzt folgende, standardmäßig ausgeblendete Layer zur Verfügung:

  • Broken Street: Zeigt Hausnummern, bei denen addr:street auf “str” oder “str.” endet. Abkürzungen sollten grundsätzlich nicht verwendet werden.
  • Broken Postcode: Hausnummern, bei denen addr:postcode keine Zahl ist. Oft wird fälschlicherweise die Stadt mit angegeben. (z.B. addr:postcode=48143 Münster)
  • Incomplete: Hausnummern, bei denen nicht alle wichtigen addr:*-Tags angegeben sind. Da es hier sehr viele Ergebnisse gibt (150567), werden nur 2000 Treffer angezeigt, bei denen vier Informationen fehlen (i.d.R. ist nur die Hausnummer angegeben). Wichtig: Das Programm prüft nicht, ob evtl. eine Adressrelation vorhanden ist. Und wie schon früher erwähnt ist es Geschmackssache, ob alle Adressinformationen an den Knoten/Weg gehören.

Außerdem ist jetzt das Encoding-Problem behoben. (Vielen Dank an User_5359, der mich nochmal auf setCodec() aufmerksam gemacht hat.)

Die sogenannten broken street sollten eigentlich durch den xybot korrigiert werden, die habe den Maintainer mal dazu angeschrieben.
Bei der Postcode Geschichte würde mir auch noch eine Prüfung auf 5 Stellen nummerisch wünschen, da öfters mal auch die Hausnummer in das Attribut rutscht.
Beim Prüfen der Karte für Bonn ist mir (außer dem Rechtschreibfehler im roten Schriftzug) noch ein Problem aufgefallen: Du berichtest z.B. Dupe: 101534198 (JOSM) DE Bonn 53227 Julius-Vorster-Straße 10 Itzel-Sanatorium im Collegium Augustinum nursing_home is dupe of 98389278 (JOSM), dabei gibt es diese Adresse direkt dreimal: Neben den genannten Wegen
http://www.openstreetmap.org/browse/way/101534198
http://www.openstreetmap.org/browse/way/98389278
ist dieser auch im Weg
http://www.openstreetmap.org/browse/way/101534200

MfG Georg V. (OSM=user_5359)

P.S.: Ich werde die Adresse nach geeigneter Zeit (zum Testen) hoch zur Relation verschieben…

Hallo,

http://gulp21.bplaced.net/osm/housenumbervalidator.html?zoom=17&lat=6887377.74636&lon=1011510.48213&layers=BTTFFF wird als Fehler markiert. Die Hausnummern sind aber definitiv korrekt. Wie kann man das „Problem" lösen?

Grüße
Rob

Dafür ist der Link “Fehlalarm melden” (unten auf der Seite) gedacht. Für dieses Problem hab ich das jetzt schon erledigt.

Hallo,

da habe ich mich nicht ganz korrekt ausgedrückt.
Wie der „Fehler" in der Karte zu beheben ist, war mir klar. Es geht mir nur um die Tatsache, das möglicherweise jemand anderes denken könnte, dass genau diese Hausnummern dort falsch getagt wurden (was nicht der Fall ist). Daher meine Frage, wie man das anders lösen könnte oder ob das so korrekt ist?

Grüße
Rob

Hallo littleRob,

fasse die Gebäude in einer Relation zusammen und setze die Adressinformationen an diese Relation.

MfG Georg V. (OSM=user_5359)

Also aus meiner Sicht besteht keine Gefahr einer Verschlimmbesserung, da die Häuser ja offensichtlich alle zu demselben farmyard gehören und somit auch dieselbe Hausnummer haben (können). Ein Tagging-Problem sehe ich eigentlich nicht, man könnte sich aber streiten, ob man nicht lieber den farmyard mit der Hausnummer versieht oder – wie von user_5359 vorgeschlagen – eine Relation erstellt.

Ja, das ist wirklich eher eine Aufgabe für einen Bot.

Danke für die Anregung, werde ich einbauen.

101534200 wird nicht beanstandet, weil der name-Tag anders (bzw. nicht vorhanden) ist.

Es sind jetzt übrigens auch Daten für Hamburg verfügbar.

Außerdem gibt es jetzt bei den angezeigten Duplikaten die Möglichkeit, über den [show]-Link das zugehörige Duplikat auf der Karte zu markieren.

Der Ruleset von xybot, der das Thema Broken Street behandelt, ist wieder aktiviert worden. Die Anzahl müsste eigentlich in den nächsten Tag deutlich sinken.

MfG Georg V.

Die Zahl ist schon am 04.01. deutlich zurückgegangen (−256). Der xybot korrigiert jetzt übrigens auch addr:postcode-Werte der Form “D-12345” und “DE 12345”.

Es ist jetzt eine Version für ganz Deutschland verfügbar: http://gulp21.bplaced.net/osm/housenumbervalidator/

Bitte beachten, dass max. 1800 Probleme auf einmal angezeigt werden (wenn nötig, reinzoomen).

Durch die Umstellung auf die Datenbank gibt es jetzt leider wieder ein Encoding-Problem. An der Datenbank selbst kann es eigentlich nicht liegen, da in der Ausgabe die Umlaute in Ordnung sind. Ich vermute, dass ich OpenLayers noch irgendwie den Codec mitteilen muss. Es wäre schön, wenn mir jemand sagen könnte, wie ich das Problem lösen kann.

Vielen Dank, konnte gleich ein paar Fehler ausbessern, die mir vor einiger Zeit unterlaufen waren.

Tolle Sache, “meine” Daten sind sauber :sunglasses:
kann also getrost weiter ODBL-remappen :slight_smile:

Jetzt werden auch Probleme in Österreich angezeigt: http://gulp21.bplaced.net/osm/housenumbervalidator/?zoom=9&lat=6079441.998&lon=1679165.62212&layers=BTTTT

Und mit dem OSMAddressCorrector gibt jetzt noch ein weiteres Tool zum Aufspüren fehlerhafter Hausnummern.

Es gibt eine größere Zahl false positives, wo eine Präposition im Straßennamen steht, und die klein geschrieben ist. Zum Beispiel von-Links-Straße, an der Mauer. Der Name kann dann tatsächlich so korrekt sein. Ist es möglich, das abzufangen?

Baßtölpel