Pflege der deutschen PLZ-Daten in OSM

Moin,
erst mal ein großes Lob für die tolle Arbeit an den PLZ!
Bei einem Vergleich aller deutschen PLZ mit den OSM-PLZ bei uns wurden lediglich zwei PLZ in OSM nicht gefunden.
24367 Osterby existiert laut deutscher Post und war auch mal in OSM vorhanden. Liegt die deutsche Post falsch oder OSM - weiß jemand Näheres zu der PLZ? Jetzt ist Osterby der 24361 zugeordnet.

Die andere fehlende PLZ ist die 82475 (Schneefernerhaus), die in OSM der PLZ 82467 zugeordnet ist.
Dazu habe ich nur bei der Deutschen Post eine Grenzlinie gefunden.

Gruß,
Detlev

Vielen Dank für die Infos! Ich werde mir die Fälle gleich mal anschauen.

EDIT: 24367 Osterby ist jetzt da (ID 3680231). Das war schonmal da? Welche Relations-ID war das?

Die RelationsID hab ich auch schon erfolglos gesucht… Ich seh nur an der Karte von wambacher das es mal so war.

Gruß
Detlev

Die PLZ ist jetzt auch in OSM (ID 3680329). Den fiktiven Grenzverlauf habe ich anhand geologischer Features geraten. Der von der Post war noch weniger einleuchtend.
Wenn jemand verlässliche Adressdaten für die Hütten dort hat, um die Grenze zu verifizieren, her damit. Insb. Adress-Infos zur Knorrhütte, die noch außerhalb ist aber laut eigner Website auch PLZ 82475 hat, und zur Zugspitz-Bergstation.

82475 war bei den alten Arnulf-Daten (Layer “Alte PLZ-Grenzen” bei Wambachers PLZ-Karte) auch drin. Ist damals wohl nicht in OSM gelandet oder wieder unbemerkt verschwunden.

Nach meiner (Hoch-)Rechnung, die falsch sein kann, dürfte es nur 8201 PLZs in DE geben (plus 4 in Österreich). Wir haben jetzt allerdings 8203.
Daher meine Frage an Detlev (#DWD*): Könnt Ihr sagen, ob OSM PLZ-Relationen enthält, die veraltet sind (also nicht bei der DPAG gelistet)?
Bzw. habt Ihr eine aktuelle DPAG-Referenzliste und wieviele Einträge für Gebiets-PLZ hat diese?

Ich habe eine Liste mit PLZ von einem Kunden bekommen, der unseren auf OSM basierenden Geokoder nutzt. Wir haben diese Liste mit den OSM-Daten verglichen und folgendes Ergebnis bekommen:

2 PLZ aus seiner Liste waren in OSM nicht vorhanden
10 PLZ (verifiziert über die Internetseite der DPAG) fehlten in der Liste des Kunden.
Damit haben die OSM-PLZ-Daten 10:2 gegen einen kommerziellen Datenanbieter gewonnen.

Die tatsächliche Anzahl der PLZ in D kenne ich leider auch nicht, wir haben aber nichts gefunden, was in OSM falsch (veraltet) vorhanden ist.

Danke! Mich würde schon interessieren, welche 10 PLZ das waren… :wink:

04862
06711
06868
08344
24222
24976
98630
99090
99095
99820

:slight_smile:

04862 Fehlte auch lange in OSM (bis vor 2 Monaten). War bei Arnulf 2010 nicht drin. Tauchte in den DPAG-Änderungslisten auch nicht auf. Komisch.
06711 Kam bereits 2010 dazu
06868 Kam bereits 2009 dazu
08344 Gibt es mind. seit 2010, war immer in OSM
24222 Kam bereits 2008 (!) dazu
24976 dito
98630 seit 2012
99090 dito
99095 dito
99820 bereits seit 2010

Wir lernen also: Einmal PLZ-Daten kaufen reicht nicht! Das gilt auch für die Händler von PLZ-Daten und -Websites.

Wie soll das den gehen? Normalerweise ist meine PLZ-Karte relativ aktuell (Lag von 60 Sekunden bis leider einige Stunden).
Oder meinst du meine WIKI-Karte? Das ist ja wirklich ein statisches Bild.

Ansonsten würden mich die beiden PLZ interessieren, die euer Kunde nicht in OSM gefunden hat. Komisch, daß Gehrke die nicht wissen wollte.

Gruss
walter

Hab ich doch schon hinzugefügt. Siehe oben.

Aber die Anzahl 8203 besorgt mich. Die von Detlev vorgelegten Daten geben nur begrenzt Auskunft über veraltete PLZ, die noch in OSM schlummern könnten.

Hatte ich schon mit Link auf Deine Karte gepostet: 24361
PLZ 82467
Ich meinte Deinen Layer “Alte PLZ”, da war eine der beiden fehlenden zu sehen.

Au weia, die hatte ich glatt vergessen. Ja, das sind die Daten, die wir damals “geschenkt” bekommen haben.

Gruss und Danke
Walter, der hoffentlich kein Altersheimer bekommt :wink:

btw: Thüringen 33 → 12 und Hamburg 0 → 62, NRW rennt wohl noch bis Mittag.

NRW hat länger gedauert als geschätzt und dann 6595 → 7519 :frowning:

was ist den da passiert? fast 1000 Miese.

Gruss
walter

Hossa! :open_mouth:

Die zwei wiedergefundenen Bremer Fehler und Hamburg habe ich jetzt um 18:45Z fertig.

In Hessen bin ich inzwischen bis zur Zeile *Offenbach *mit 16 Einträgen gekommen und mache da weiter.

Mir scheint, dass vermutlich jedes Bundesland jede Woche eine neue Auswertung braucht, um bei kleinen Fehlerzahlen zu bleiben.

Franz

Da ist schon was dran, daher lass ich die ja auch nach und nach durchlaufen - nur nicht ganz so oft wie früher, da die Pflege der Wiki-Datei ein wenig lästig ist. Irgendwie müsste man das automatisieren können.

Gruss
walter

hab mal berlin, sachsen anhalt und sh auf die reise geschickt. Timestamp der DB 15:02Z

Hier die Ergebnisse der Nacht:

  • Sachsen-Anhalt 11 → 12
  • Schleswig-Holstein 118 → 182
  • Mecklenburg-Vorpommern 131 → 179
  • Hessen 888 → 467

Gruss
walter

Danke für die Auswertung auch von Hessen - da habe ich ja schon etwa die Hälfte geschafft.

@wambacher: Eins wundert aber trotzdem: Wenn ich mir die ersten 8 Fehlerzeilen (also den ganzen ersten Absatz) der neuen Fehlerliste_Hessen ansehe, habe ich diese am 25.4. zwischen 19:00Z und etwa 20:00Z behoben (Neue PLZ-Grenzen in der letzten Zeile, alles darüber waren Korrekturen von PLZ-Einträgen). Warum sind dann diese Änderungen in Deiner Auswertung mit “timestamp=2014-04-26T03:34:02Z” noch nicht enthalten?

Fragende Grüße,
Franz

Kurz und knapp: weil sie nicht drin sind :frowning:

Lange Version: Heute Nacht war ein heftiges Gewitter in unserer Ecke und ich hab die Kiste ca 2 Minuten vor dem dann tatsächlich erfolgten Stromausfall runtergefahren. Und dann hab ich mich wohl bei dem State-File zum Neustart vertan.

Muss den Import wohl um ca 24 Stunden zurücksetzen und dann alle Auswertungen erneut starten - das Wochenende ist gerettet :frowning:

Gruss
walter

Nachtrag: Da ich beim Update-Prozess inzwischen jeden Pups Schritt logge, hab ich den Mist jetzt ganz genau gesehen:

Dein Edit 21:04Z (23:04 MEZ),
Shutdown 23:51 , gerade aktuelles - aber nicht abgeschlossenes - Diff-File #844526, <— da sind deine Updates drin
Neustart 00:06 mit Diff #844527 - und das war eines zu spät.