Wie kann ich einen kompletten Ort auf Tippfehler etc. überprüfen?

Hi Tobi, das ist schön dass du dich um Qualitätssicherung kümmerst, zu meiner Schande muss ich gestehen, dass ich sowas noch garnicht gemacht habe :wink:
Hier findest du alle notwendigen Analyse-Tools: http://wiki.openstreetmap.org/wiki/QA
Die meisten von uns nehmen Keepright und den OSM-Inspector.

Hallo !i! und T0Bi

Als allererstes Tool verwende ich den Validator von JOSM.
Der liefert zwar manchmal zu viel Treffer, weil er irgendetwas (noch) nicht kennt, aber er zeigt vieles an, was bei anderen Tools nicht beachtet wird. Durch die Prüfung auf bekannte Schlüssel und Werte findet sich z.B. so mancher Tippfehler. Anderes ist durchaus richtig, aber JOSM/Validator kenne es halt (noch) nicht.

Für die Überprüfung von Adressen gibt es beim Inspector einen eigenen Layer, der z.B. die Zuordnung Adresse zu Straße zeigt. So finden sich auch falsch eingeordnete Adressen. oder abweichende Schreibweisen bei den Straßennamen.

Edbert (EvanE)

Ich habe den Ausschnitt von Wallerstein mal durch mein PHP-Script checkosm gejagt und neben einer deutschen Zahlschreibweise (Relation 138194 “distance=134,8 km” korrekt(er) wäre “distance=134.8” [ohne der Default-Einheit km]) eigentlich nur ungewöhnlich Werte von building und surface gefunden.

Das wird schon etwas schwieriger, da hier auch Kombinationen von Tag berücksichtigt werden müssen. Auch sind Straßen ja nicht immer in einem WAY vorhanden (z.B. wenn die Straße unterschiedliche Geschwindigkeitsbeschränkungen besitzt). Auf die Schnelle kann ich Dir nur eine Liste der Tags mit Ihrer Häufigkeit und der unterschiedlichen Ausprägungen anbieten. Du hast 648 addr:city Einträge (mit nur einer Ausprägung! Gut), aber nur 647 addr:postcode und 645 addr:country etc. Was mich persönlich nervt, ist dass auch 17 addr:housename (mit 12 Ausprägungen) existieren, obwohl in Deutschland für die postalische Zustellung keine Hausnamen existieren. Bei Interesse an dieser Liste, bitte PM.

Da wage ich mich mal aus der Deckung und behaupte, dass der Schlüssel opening_hours [nach der offiziellen Definition] nicht mit beweglichen Feiertagen umgehen kann. Allerdings hat Netzwolf sich mal an eine ausführlichere Defintion gewagt und sie hier http://www.netzwolf.info/kartografie/osm/time_domain/erklaerung erläutert. In Deutschland wird es in 27 Stellen verwendet, z.B.: auch hier in Pirna http://www.openstreetmap.org/browse/node/772503981 .

MfG Georg V. (OSM=user_5359)

Was nervt dich daran? Es gibt nun mal auch in Deutschland Häuser mit Namen. Diese können sogar groß angeschrieben sein und so zur Orientierung dienen. Die Adressen sind ja nicht nur für die Postzustellung gedacht.
Vielleicht nutzen auch Rettungskräfte solche Karten als Unterstützung und Ortsfremde nehmen immer den nächstmöglichen Anhaltspunkt. Dazu gehört dann meist nicht die richtige postalische Adresse.

Das stimmt und wird auch von mir regelmäßig genutzt. Entweder weil das Haus wirklich einen Namen hat der auch aktiv genutzt wird (“Knabenschule”) oder weil es auf einem größeren Campus mit nur einer Anschrift häufig “Haus 1” … gibt :slight_smile:

Kannst su mir das etwas genauer erkläre, was ich da evtl. falsch gemacht habe, versteh das gerade nicht so was du meinst.
Gebäude habe ich so getagt building= house bzw. building=garage und bei manchen Fußwegen bzw. Flächen habe ich als sufrace=gravel etc. angegeben.

hi tobi,

ein Bild Link sagt mehr als 1000 Worte: http://tools.geofabrik.de/osmi/debug.html?view=addresses&lon=10.47897&lat=48.89136&zoom=15&opacity=0.80&overlays=buildings,buildings_with_addresses,postal_code,nodes_with_addresses_defined,nodes_with_addresses_interpolated,no_addr_street,street_not_found,interpolation,interpolation_errors,connection_lines,nearest_points,nearest_roads

Gruss
Walter

Mir sagt das Bild der Link nun nicht so dolle viel. Eine Mapnik-Karte mit ein paar Layern wo man Features anklicken kann. Wofür soll das gut sein, gibts dazu eine Anleitung?

ja natürlich gib es die! - schalte mal dein Gehirn ein und schau dich etwas auf der Seite um. Ist langfristig besser als “denken lassen”.

walter

p.s. ich hab den Sinn dieser Sache auch ohne Hilfe erfassen können.

Danke für den Link. Scheint nur leider so, dass der Inspector ein paar Tage hinterherhinkt. Lässt sich da was mache?

Einfach ausprobieren: Nimm mal links den Haken raus bei “Street not found” udn schon verschwinden die roten Punkte.

Dann klick mal auf eines der Häuser, die den roten Punkt haben, dann erscheinen rechts die tags.

Dann siehst du, dass dort street = Birkhauser Straße eingetragen ist, die Straße daneben ist aber als Birkhausener Straße eingetragen.

gruß,
Ajoessen

nee, leider nicht.
Die Aktualität ist nicht die Beste, aber der Server ist in guten Händen.
Da hilt nur Geduld.
Gruss
Walter

Ich gehe mal davon aus, dass Dir der Fehler bei Relation 138194 klar ist. Bei den Keywörter für surface und building habe ich nochmal meine Keywortliste mit den Wikiwerten abgeglichen (obwohl ich z.B. building=church bei amenity=place_of_worship doppelt gemoppelt halte) und diese Hinweise auf mögliche Fehler haben sich in Luft aufgelöst.

Auch wenn ich zwei prominente Widersprecher habe: Versucht doch mal statt der Straße und Hausnummer den Hausname (aktuelles Beispiel aus meinen Urlaub: Schwalbennest) auf den Brief zu schreiben. Der PostebotIN muß wirklich gute Laune haben, wenn er dies noch zustellt.

Auch wenn es keine festen Regeln gibt, als Grundlinie sollte gelten: unter addr gehört nur das rein, was man auf einen Brief schreibt (ja hier habe ich eine andere Meinung als viw).

Aber interessant finde ich es, wenn im addr:housename und name der gleiche Wert steht. Das führt bei mir zum direkten Löschen von addr:housename wegen doppelter Information.

An diesem Wochenende habe ich das in den vorherigen Replys erwähnten Script checkosm.php als neues Feature die Kontrolle zwischen zwei verschiedenen Schlüsselwerten eingebaut (als schnelles Beispiel: das Format einer Postleitzahl in Abhängigkeit vom Ländercode). Die Mächtigkeit dieses Abgleiches hat mich veranlasst direkt einen Ableger streetmap.php zu erstellen und auf meiner HP (http://familieverweyen.de/txt_0055.php) zur Verfügung zustellen.

Das Script liest eine OSM-Datei (Erstellung wird beschrieben) und erstellt eine Liste der Straßen. Da das Script auch zwischen den Straßenangaben aus Adressen und Straßennamen unterscheidet, kann man dieses Skript auch zur Qualitätskontrolle einsetzen. Straßen, die nur in Adressangaben erscheinen, sind mit hoher Wahrscheinlichkeit Tippfehler.

Kommentare sind erwünscht, aber habt Geduld: Es ist noch eine Version 0.01 und läßt sich deshalb nur auf Promptebene nutzen.

Hi,

  • ich konnte keine Lizenz des proggi finden. Darf ich mir eine wünschen? Dann hät’ ich gerne die Apache License :wink:
  • Die Beschreibung “Am alten Schloß” passt nicht zur Ausgabe “Hinterm Alten Schloß”
  • Nürnberg brauchte auf meinen kleinen netbook 2 min :slight_smile:
  • Die “suspekten” haben nur ein “A” am Anfang der Zeile, vielleicht noch deutlicher kennzeichnen in der Doku.

Vielen Dank.

Ciao,
Frank

Hallo Frank

Vorsicht mit den Verallgemeinerungen. Da sollte man genau hinsehen.

  • Wenn es einzelne Adressen sind, sind es wahrscheinlich Ausrutscher.
  • Wenn es viele mit gleichem Straßennamen sind, dann könnte auch die
    Straße falsch geschrieben sein.
    Ist hier in Bonn mit der Leibni(t)zstraße (korrekt ohne ‘t’) passiert.

PS:
Abweichungen zwischen Straßennamen und Adressen kann man auch mit dem Adress-View des OSM-Inspectors finden. Allerdings hat man damit natürlich keine Straßenliste.

Edbert (EvanE)

Lizenz: Dazu habe ich mir ehrlich gesagt noch keine ausführliche Gedanken gemacht: Es wäre nur nett, wenn man den Kommentarheader nicht entfernt. Sollte Teil der Routinen gefallen, wäre ein Quellhinweis sinnvoll.

Danke für den Hinweis auf die Differenz zwischen Output und Beschreibung: Ist bereits behoben.

Ich habe mich mit Absicht nicht über die Ursachen geäußert :-). Ich habe jetzt eine Empfehlung für eine Vor-Ort-Prüfung ausgesprochen.

Edbert, dass ist mir (bzw. uns) bekannt, aber beim OSM-Inspector muß man warten, bis die Daten dort angekommen sind. Mit dem Skript kann man es direkt nach dem Hochladen der Änderungen gegenprüfen (z.B. nach einer Eintrageaktion). Außerdem ist das ja erst die Version 0.01, da kann/wird sich noch einiges ändern. :slight_smile:

Der Datensatz der Geofabrik von Münster (hatte ich gerade noch auf Platte) hat eine Größe von 410 MB hat 65.266 Straßenstücke, 49.491 Adressen und 10.175 Referenzen. Benötigt wurden 5:30 Minuten auf einer Unix-Maschine.

So, das script war sehr gebrauchlich, so konnte ich ein Dutzend Adressen korrigieren, u. a. ein Münchener Kino,
das sich ins schöne Frankenland verirrte :slight_smile:

Ciao,
Frank

Ich will die Vorteile deiner Lösung nicht schmälern, ganz im Gegenteil bin ich davon beeindruckt, was du alles so an Auswertungen aufbaust.

Wenn ich mir als Vergleich die Straßenlistenauswertung von Bonn ansehen (über 2000 Straßen) ist das in Listenform nicht mehr gut zu händeln. Ohne die beiden Übersichten (Nicht/Nur in OSM) und die farbige Hervorhebung würde man Fehler kaum finden.

Vorteile deiner Lösung sind:

  • Auf einem beliebigen, auch selbst erstellten Ausschnitt anwendbar.
    Nicht wie bei den Straßenlisten auf administrative Gebiete beschränkt.
  • Abgleich Adressen und Straßennamen
    Fehlt bei den Straßenlisten.
  • Jederzeit durchführbar, Ergebnis nach wenigen Minuten verfügbar.
    Nicht wie beim OSM-Inspector mit einigen Tagen Verzug.

PS: Die Geschwindigkeit ist beeindruckend.

Edbert (EvanE)