Da wir in Berlin ja seit Kurzem freie Geodaten haben, habe ich mal ein Tool gebastelt, das die in OSM vorhandenen Adressen mit den offiziellen Adressdaten abgleicht. Das Tool ist zu finden unter http://berlinadd.morbz.de/.
Gefiltert werden kann nach Bezirk/Ortsteil/PLZ und natürlich Straße. Die gelben Balken stellen unvollständige, fehlerhafte oder interpolierte Adressen dar. Das Tool leistet auch kleinere Validierungsdienste: Fehlende addr:country Tags, falsche addr:city Tags oder abweichende Schreibweise der Straße.
Relationen werden nicht unterstützt, Interpolationen schon. Der Update-Zyklus steht noch nicht fest, je nach Interesse könnte das auch täglich geschehen.
Ich hoffe das Tool kann dem ein oder anderen helfen rauszufinden wo noch was fehlt.
Danke dass du dir die Mühe gemacht hast, das sieht wirklich gut aus und ich werde es bestimmt in Zukunft nutzen. Eine Sache ist mir aber aufgefallen:
In einer Straße, die ich Ende Februar bearbeitet habe, werden die Hausnummern als fehlend angegeben, auf der slippy map sind sie aber seit langem zu sehen.
Ich habe addr:street und addr:housenumber direkt dem Gebäudeumriss zugeschrieben, ohne den Eingang extra zu markieren oder einen extra node für die Adresse zu erstellen. Weitere Adresstags wie addr:city, addr:postcode o.ä. habe ich weggelassen.
Woran kann das liegen? Sind die Änderungen (Ende Februar) noch zu neu?
Hier ist die Straße (Emser Straße zwischen Hermannstraße und Oderstraße):
Die Daten wurden heute aktualisiert. Bei diesen Häusern fehlt die PLZ. Das Tool benötigt mindestens addr:street, addr:housenumber und addr:postcode, da es mehrere Straßen gleichen Namens in verschiedenen PLZ geben kann.
Ich nicht. Gehört zu einer vollständigen Adresse dazu. Wenn man sich nur einen kleinen Extrakt runterlädt ohne Admin-2-Grenze (z.B. Hessen) kann man daraus keine Länderzugehörigkeit ableiten.
Wenn das Interesse gegeben ist werde ich die Seite auf jeden Fall dauerhaft anbieten. Ich habe schon einen Eintrag im Wiki Artikel von Berlin gesetzt. Wenn du der Ansicht bist, dass das auch bei Qualitätssicherung reingehört, kannst du dort auch gerne einen Eintrag setzen.
Ich wollte auch der Berliner Mailingliste bescheid geben, aber die nehmen offensichtlich derzeit niemanden auf oder lassen keine Nachrichten durch. Da ich wenig Erfahrung mit Mailingslisten habe, wäre es nett wenn das jemand übernehmen könnte der sich auskennt.
Ich schreibe auch nicht auf der Mailingliste, finde es aber sehr wünschenswert, wenn du diesen Abgleich weiter fortführst. Noch eine Frage zur Aktualität: Gestern stand als letzte Aktualisierung irgendeine Uhrzeit am Vormittag, meine Eintragungen aus der Vorwoche waren aber noch nicht drin. Liegt das an den Daten der Geofabrik?
schön zu sehen, was die Vollständigkeit in Berlin für einen riesigen Sprung gemacht hat. Könntest du evtl. ohne allzu großen Aufwand auch Listen mit Duplikaten erstellen? Also (wie vermutlich bei den aktuellen Listen auch) nur mit Berücksichtigung von Punkten und Gebäuden mit Adressen, ohne Shop, Amenity etc.?
Dann könnte man evtl. noch etwas aufräumen. Zumindest teilweise war die Vermeidung von Duplikaten wohl eher nicht so sehr im Fokus.
Wenn an einem shop/office/… ein addr:* ist würde ich es nicht löschen. Es ist ein Bestandteil der Daten und viele Auswerter nutzen diese für diesen node. Auch zwei oder drei “gleiche” Adressen an verschiedenen nodes stören m.E. nicht, sie lassen doch eine Auswahl zu.
Ja, genau das meinte ich ja: doppelte Adressen von Shops etc. gar nicht in die Auswertung nehmen, also auch nicht löschen. Aufräumen nur doppelte Adress-Nodes bzw. Adress-Node + Adresse am Gebäude (dann kann m.E. der Adress-Node weg, sofern alle Informationen am Gebäude vollständig sind). Adressen an Grundstücken wären evtl. noch zu bedenken, die sind mir in Berlin aber noch nicht untergekommen, auch wenn es sie vereinzelt geben mag.