Pflege der deutschen PLZ-Daten in OSM

Das ist jetzt zwar fast schon ein neuer Thread, aber an den PLZ-Daten sieht man die Problematik recht gut:

Gegen Redundanzen spricht, dass sich die Einträge widersprechen können (in welchem Ausmaß, kann man an der Irrläuferliste von wambacher sehen). Wären die PLZ nur an den Grenzrelationen, könnte das nicht passieren (one information at one place).

Für Redundanzen spricht, dass auch die Grenzrelationen oft ungenau sind. Ohne (dann nicht redundanten) Eintrag an Gebäuden oder POIs wäre das längst nicht so einfach zu entdecken.

Generell plädiere ich dafür, vorhandene Attribute bis auf Trivialitäten wie layer=0 oder oneway=no nicht zu löschen, auch nicht Beinahe-Trivialitäten wie address:country. Ich trage letzteres aber bis auf Ausnahmen auch nicht ein.
Redundante Information kann eben auch Abfragen deutlich einfacher machen.

Die OSM-Daten sind ja auch gar nicht so dazu gedacht. Wie schon ein paar mal geschrieben bräuchten wir mehr Anwendungen, die OSM-Daten in brauchbare Formate für den jeweiligen Anwendungszweck konvertieren und haben zuviele, die OSM-Daten direkt nutzen (bzw es versuchen).
So könnte es dann z.B. ein Tool geben, das alle Objekte mit einem vollständigen is_in=* oder addr:= aus den Grenzen versorgt. Mit dem Argument, dass nicht alle Anwendungen solche Abfragen durchführen können müsste man nämlich alle Objekte damit taggen, ergänzt um Informationen wie “Ist in Landuse xy” oder “Ist in Gebäude abc”.

Diese Tags behandle ich darum genau wie z.B. oneway=no: Wo es nicht eindeutig ist sollten sie bleiben, woanders weg.

So mach ich es auch - nicht löschen aber auch nicht neu eintragen, wenn es sich um triviale Fälle handelt

Habe in Hamburg aufgeräumt (Grenzen 22359, 22393, 22395). Ca. 1000 Irrläufer weniger könnten es dort sein.

Wenn jemand noch Laucha an der Unstrut macht wäre wieder ein Durchlauf für Sachsen Anhalt angebracht. Das war mir auf die schnelle grade zu heikel/kompliziert dort die Grenzen neu zu basteln. sry ^^ Ansonsten hab ich mich vor allem um Halle und den nächsten Gebieten nach Laucha gekümmert.

Nachgereicht hier nochmal die Top10-Übersicht für ways und nodes mit Adress-Tags für Straße und Hausnummer nach Gemeinden:


Name           | ways   | nodes | all
----------------------------------------
Berlin         |  44802 | 88570 | 133372
Hamburg        | 109338 | 23752 | 133090
München        |  35743 | 66674 | 102417
Dortmund       |  97044 |   431 |  97475
Köln           |  70133 | 10972 |  81105
Frankfurt a.M. |  68509 |  8309 |  76818
Hannover       |  19845 | 42293 |  62138
Bielefeld      |  58943 |  2557 |  61500
Düsseldorf     |  49979 |  8021 |  58000
Dresden        |  21361 | 34706 |  56067

Insgesamt zähle ich 5.228.659 Adressen dieses Typs in DE (Duplikate nicht ausgeschlossen) - davon 70 % an ways.
Von den 11.355 Gemeinden (laut OSM) haben 51 % weniger als 10 Adressen (was vollständig sein kann!), 23 % keine einzige.

Korrigiert: Bei der Gesamtzahl wurden Gemeinden, die auch eine Landmasse-Relation haben, doppelt gezählt.

EDIT: Hamburg wurde doppelt gezählt! (wegen gleichnamiger Landmasse-Relation :frowning: )

Done. :slight_smile:

NRW und BW sind heute nacht gelaufen, RP rennt zur Zeit. Dann werde ich mal Sachsen Anhalt dazwischen schieben.

Gruss
walter

ps: die Statusliste ist übrigens jetzt sortierbar.

pps: BW war noch “von Gestern”

hi, ein ganzer Schwung von Ergebnissen sind gerade eingetrudelt - war nicht @home aber die Kiste hatte was zu tun :wink:

Bremen ist als erstes “irrläuferfrei”! nun denn, bei der “Größe” wohl nicht allzu schwierig. Die anderen siehe Liste im Wiki.

Gruss
walter

Bremen wird auch eher eine Ausnahme bleiben. Einige Abweichungen werden wohl immer/lange bleiben, weil z.B. eine Zollstation mit ausländischer PLZ auf deutschem Territorium ist (SH/DK) oder sich aus der Ferne nicht sicher klären lässt. Ein anderer Fall sind Großempfänger PLZ (z.B. 20531 in HH). Die taste ich erstmal nicht mehr an. Bei der Suche der DPAG kann man unter “Großempfänger” im 2. Eingabefeld übrigens prüfen, ob eine PLZ eine Großempfänger-PLZ ist.

38875 Oberharz am Brocken (2. bei Sachsen Anhalt) konnte ich aktuell nicht lösen. Laut Post gibt es nichtmal “Oberharz am Brocken”. Die Adressen die noch “falsch” sind liegen laut Postkarte nicht im 38875er Bereich. “Kalte Tal” oder kaltes Tal? hab ich auch vergeblich in der Postsuche gesucht. Der Betreiber des Tagebaus bzw. Kalkwerkes gibt auf der Homepage 38875 als Postleitzahl an. Wird jemand bei der Sache schlau??

Edit: Kann auch das 4. gewesen sein in der aktuellen Liste also 38889 Blankenburg, Oberharz am Brocken das war vorhin noch mit der alten Liste.

Schaue es mir jetzt an. Oberharz am Brocken (seit 1.1.2010) kennt die Post nicht als Eintrag (die Post ist da eher gemütlich); das ist aber die zugehörige Gemeinde.

EDIT: Die addr:postcode im OT Susenburg stimmten wohl. Ich habe die OT-Grenze angepasst/geraten.
Die OT- und PLZ-Grenze Elbingerode/Rübeland (Straße Mühlental) ist kompliziert. Mir scheint, die Straße “Mühlental” heißt zumindest in OT Elbingerode eigentlich “Altes Mühlental” Kann ich aus der Ferne nicht auflösen.

“Kalte(s) Tal” ist eine Straße und eine Ortsbezeichnung in Nachbargemeinde Blankenburg und/oder in OT Rübeland/Elbingerode. Die richtige Grenze ist unklar.
Die Post führt den Ort als “Kalte Tal (Ortsteil von Rübeland b Blankenburg, Harz)” mit PLZ 38889. Ich vermute leider, dass einige Teile zu Blankenburg und andere zu Oberharz gehören. PLZ jedoch wohl komplett 38889.

Na das sieht doch schonmal ganz anders aus. Zwar bleibt Hamburg auf dem ersten Platz, aber München ist aus dem Stand auf Platz 3 gesprungen.
Auch Hannover und Dresden profitieren mit mehr als der Hälfte nodes als Adressen.

@gehrke: sehe ich das falsch oder ist dieses - durchaus interessantes und wichtiges - Thema hier fehl am Platz?

Gruss
walter

Ja, vielleicht. Ich hatte jedoch On-Topic-Hintergedanken, dann ist es etwas abgedriftet. Zuerst hatte ich nach Gemeinden mit addr:postcode-Elementen gesucht (die brauchen wir ja für eine funktionierende PLZ-Gebiet-Fehlersuche mit den Irrläufern). Weil ja Stimmen (auch von mir) aufkamen, u.a. addr:postcode zu unterlassen bzw. gerade nicht, wollte ich schauen, wie die Adresssituation allgemein ist. Aktuell läuft eine Auswertung, bzgl. addr:country-Verbreitung.

Warum? Gibt es für die GE nicht auch immer eine “normale” der Lokalität zugeordnete PLZ?

Gerade in diesem Wiki-Abschnitt wird darauf hingewiesen, daß die PLZ zur geographischen Zuordnung verwendet werden: "…auch Unternehmen und Organisationen planen ihre räumlichen Aktivitäten mit Hilfe der Postleitzahl. Auf dieser Basis werden in der Privatwirtschaft beispielsweise Lieferzonen, Geschäftsstellenbereiche oder Außendienstgebiete abgegrenzt. "

Das kann nur so gemacht werden, wenn die “räumliche PLZ” dem “Kunden” zugeordnet wird: “Alle Dünnbrett-Bohrer im PLZ-Gebiet 04711 erhalten nächste Woche ein Anschreiben …”

Daher sehe ich für GE-PLZ keinen Platz in OSM - zumindest nicht als addr:postcode (addr → Adresse!)

Gruss
walter

Weil ich nicht auf die Mütze bekommen möchte, dass ich halb-richtige Informationen lösche. Ich kann die GE-PLZ ja nur löschen, wenn es kein Alternativ-Tag gibt.
Wenn es einen breiten Konsens zum Löschen gibt, wunderbar. Bis dahin konzentiere ich mich erstmal auf die gemütlicheren Fälle.

Die Post bildet die GE-PLZ ihrer Kunden offenbar auf die eigentliche Adresse ab, z.B für GE-PLZ 06099.

Ich finde, das spricht nochmals dafür, die GE-PLZ zu ersetzen.

Das Ganze nochmal für Adressen mit street, housenumber und country:
Es gibt von diesem Typ 3.977.445 Einträge in 61 % der Gemeinden. Im Vergleich zu oben sind also 76 % der Adressen mit addr:country markiert. 39 % der Gemeinden sind ohne addr:country. Allzu sehr sollte man sich daher wohl nicht darauf verlassen.

Bei den nodes wäre noch interessant zu unterscheiden zwischen

  • reinen adressennodes (nur addr:* und is_in)
  • entrance=*
  • nodes an den ein shop* oder ein amenity=* etc hängt, das müsste dann der Rest sein.

Dann könnte man vielleicht die Unterschiede zwischen Berlin 4 mal soviele ways wie nodes und Berlin / München (ca. 2 mal soviele nodes wie ways) verstehen.

Hallo,

mich interessiert das Hausnummernthema, ich bin aber nur durch Zufall hierhin geleitet worden und hätte es nicht beim PLZ-thema vermutet. Macht doch bitte einen eigenen Thread dazu auf, dann werden noch mehr Interessierte mitlesen können.

Und die Original Themeninteressiertens freuts auch.

viele Grüße

Dietmar