housenumbervalidator

Ja, das hätte ich vielleicht nochmal hinschreiben können. Ausgewertet wird nordrhein-westfalen.osm von gestern.

Ein bekanntes Problem… QTextStream::readLine() ‘filtert’ die Sonderzeichen – warum auch immer – raus. Falls jemand weiß, wo der Fehler in meinem Code ist, soll er/sie es bitte sagen/schreiben.

Im Laufe des Tages kommt übrigens vllt. noch ein Update mit Unterstützung für Ways (sofern jetzt nichts schiefläuft…).

Die Seite wurde inzwischen etwas erweitertet: Es stehen jetzt folgende, standardmäßig ausgeblendete Layer zur Verfügung:

  • Broken Street: Zeigt Hausnummern, bei denen addr:street auf “str” oder “str.” endet. Abkürzungen sollten grundsätzlich nicht verwendet werden.
  • Broken Postcode: Hausnummern, bei denen addr:postcode keine Zahl ist. Oft wird fälschlicherweise die Stadt mit angegeben. (z.B. addr:postcode=48143 Münster)
  • Incomplete: Hausnummern, bei denen nicht alle wichtigen addr:*-Tags angegeben sind. Da es hier sehr viele Ergebnisse gibt (150567), werden nur 2000 Treffer angezeigt, bei denen vier Informationen fehlen (i.d.R. ist nur die Hausnummer angegeben). Wichtig: Das Programm prüft nicht, ob evtl. eine Adressrelation vorhanden ist. Und wie schon früher erwähnt ist es Geschmackssache, ob alle Adressinformationen an den Knoten/Weg gehören.

Außerdem ist jetzt das Encoding-Problem behoben. (Vielen Dank an User_5359, der mich nochmal auf setCodec() aufmerksam gemacht hat.)

Die sogenannten broken street sollten eigentlich durch den xybot korrigiert werden, die habe den Maintainer mal dazu angeschrieben.
Bei der Postcode Geschichte würde mir auch noch eine Prüfung auf 5 Stellen nummerisch wünschen, da öfters mal auch die Hausnummer in das Attribut rutscht.
Beim Prüfen der Karte für Bonn ist mir (außer dem Rechtschreibfehler im roten Schriftzug) noch ein Problem aufgefallen: Du berichtest z.B. Dupe: 101534198 (JOSM) DE Bonn 53227 Julius-Vorster-Straße 10 Itzel-Sanatorium im Collegium Augustinum nursing_home is dupe of 98389278 (JOSM), dabei gibt es diese Adresse direkt dreimal: Neben den genannten Wegen
http://www.openstreetmap.org/browse/way/101534198
http://www.openstreetmap.org/browse/way/98389278
ist dieser auch im Weg
http://www.openstreetmap.org/browse/way/101534200

MfG Georg V. (OSM=user_5359)

P.S.: Ich werde die Adresse nach geeigneter Zeit (zum Testen) hoch zur Relation verschieben…

Hallo,

http://gulp21.bplaced.net/osm/housenumbervalidator.html?zoom=17&lat=6887377.74636&lon=1011510.48213&layers=BTTFFF wird als Fehler markiert. Die Hausnummern sind aber definitiv korrekt. Wie kann man das „Problem" lösen?

Grüße
Rob

Dafür ist der Link “Fehlalarm melden” (unten auf der Seite) gedacht. Für dieses Problem hab ich das jetzt schon erledigt.

Hallo,

da habe ich mich nicht ganz korrekt ausgedrückt.
Wie der „Fehler" in der Karte zu beheben ist, war mir klar. Es geht mir nur um die Tatsache, das möglicherweise jemand anderes denken könnte, dass genau diese Hausnummern dort falsch getagt wurden (was nicht der Fall ist). Daher meine Frage, wie man das anders lösen könnte oder ob das so korrekt ist?

Grüße
Rob

Hallo littleRob,

fasse die Gebäude in einer Relation zusammen und setze die Adressinformationen an diese Relation.

MfG Georg V. (OSM=user_5359)

Also aus meiner Sicht besteht keine Gefahr einer Verschlimmbesserung, da die Häuser ja offensichtlich alle zu demselben farmyard gehören und somit auch dieselbe Hausnummer haben (können). Ein Tagging-Problem sehe ich eigentlich nicht, man könnte sich aber streiten, ob man nicht lieber den farmyard mit der Hausnummer versieht oder – wie von user_5359 vorgeschlagen – eine Relation erstellt.

Ja, das ist wirklich eher eine Aufgabe für einen Bot.

Danke für die Anregung, werde ich einbauen.

101534200 wird nicht beanstandet, weil der name-Tag anders (bzw. nicht vorhanden) ist.

Es sind jetzt übrigens auch Daten für Hamburg verfügbar.

Außerdem gibt es jetzt bei den angezeigten Duplikaten die Möglichkeit, über den [show]-Link das zugehörige Duplikat auf der Karte zu markieren.

Der Ruleset von xybot, der das Thema Broken Street behandelt, ist wieder aktiviert worden. Die Anzahl müsste eigentlich in den nächsten Tag deutlich sinken.

MfG Georg V.

Die Zahl ist schon am 04.01. deutlich zurückgegangen (−256). Der xybot korrigiert jetzt übrigens auch addr:postcode-Werte der Form “D-12345” und “DE 12345”.

Es ist jetzt eine Version für ganz Deutschland verfügbar: http://gulp21.bplaced.net/osm/housenumbervalidator/

Bitte beachten, dass max. 1800 Probleme auf einmal angezeigt werden (wenn nötig, reinzoomen).

Durch die Umstellung auf die Datenbank gibt es jetzt leider wieder ein Encoding-Problem. An der Datenbank selbst kann es eigentlich nicht liegen, da in der Ausgabe die Umlaute in Ordnung sind. Ich vermute, dass ich OpenLayers noch irgendwie den Codec mitteilen muss. Es wäre schön, wenn mir jemand sagen könnte, wie ich das Problem lösen kann.

Vielen Dank, konnte gleich ein paar Fehler ausbessern, die mir vor einiger Zeit unterlaufen waren.

Tolle Sache, “meine” Daten sind sauber :sunglasses:
kann also getrost weiter ODBL-remappen :slight_smile:

Jetzt werden auch Probleme in Österreich angezeigt: http://gulp21.bplaced.net/osm/housenumbervalidator/?zoom=9&lat=6079441.998&lon=1679165.62212&layers=BTTTT

Und mit dem OSMAddressCorrector gibt jetzt noch ein weiteres Tool zum Aufspüren fehlerhafter Hausnummern.

Es gibt eine größere Zahl false positives, wo eine Präposition im Straßennamen steht, und die klein geschrieben ist. Zum Beispiel von-Links-Straße, an der Mauer. Der Name kann dann tatsächlich so korrekt sein. Ist es möglich, das abzufangen?

Baßtölpel

Ich kann natürlich sämtliche Straßennamen, die mit van|von|an|am beginnen ignorieren lassen. Ich war mir nur mangels solcher Straßennamen in meiner Umgebung nie richtig sicher, ob die Straßennamen auch auf den Straßenschildern mit kleinem Anfangsbuchstaben geschrieben werden.

Dort, wo es mir aufgefallen ist, hatte die die zugehörige Straße die gleiche Schreibweise.

Was wird bei den Straßennamen denn überhaupt getestet?

Baßtölpel

Ein Straßenname wird als problematisch angesehen, wenn eine der folgenden Bedingungen erfüllt ist:

  • endet auf “Str” oder “str”
  • enthält “Str.” oder “str.”
  • erstes Zeichen ist kein Großbuchstabe (Ausnahmen: enthält eine Zahl, auf die ein “e” folgt (z.B. “55er-Straße”), oder (neu) beginnt mit “an”, “am”, “van” oder “von”)

Update 21.02.12: Ab heute werden Straßennamen, die mit einem kleingeschriebenen “an”, “am”, “van” oder “von” beginnen, nicht mehr als “problematisch” eingestuft. (Diese Änderung hat für einen sehr deutlichen Rückgang der Fehlerzahlen gesorgt.)

Zur Vollständigkeit halber sei es auch hier erwähnt:

Es gibt jetzt die Möglichkeit, sich bei einem Art Newsletter anzumelden, bei dem man (fast) täglich eine E-Mail mit einer fehlerhaften Adresse und einem Duplikat bekommt. (Idee von poppei82). Registrierung über “Ein korrigierter Fehler am Tag” unter http://gulp21.bplaced.net/osm/housenumbervalidator/.