Massenedit im Bereich Stuttgart zu addr:

An die DPAG hatte ich - noch - nicht gedacht. Klingt aber interessant. Gibt es da eine legale Referenz? Oder wäre das das PLZ-Verzeichnis?

Die Auswertung läuft noch, hat gestern aber bereits einige erschütternde Ergebnisse gezeigt.

Mehr später.
Walter

ps:


                    wno_asosmlink                               |    liegt in    |      addr:city       | addr:suburb 
----------------------------------------------------------------+----------------+----------------------+-------------
 [url]http://www.openstreetmap.org/browse/node/3559844560[/url] | Schneverdingen | Wintermoor a. d. Ch. | 
 [url]http://www.openstreetmap.org/browse/node/3559844561[/url] | Schneverdingen | Wintermoor a. d. Ch. | 
 [url]http://www.openstreetmap.org/browse/node/3559844562[/url] | Schneverdingen | Wintermoor a. d. Ch. | 
 [url]http://www.openstreetmap.org/browse/node/3559844563[/url] | Schneverdingen | Wintermoor a. d. Ch. | 
 [url]http://www.openstreetmap.org/browse/node/3389560588[/url] | Werther        | Werther (Westf.)     | 
 [url]http://www.openstreetmap.org/browse/node/3559844564[/url] | Schneverdingen | Wintermoor a. d. Ch. | 
 [url]http://www.openstreetmap.org/browse/node/3559844565[/url] | Schneverdingen | Wintermoor a. d. Ch. | 
 [url]http://www.openstreetmap.org/browse/node/3559844566[/url] | Schneverdingen | Wintermoor a. d. Ch. | 
 [url]http://www.openstreetmap.org/browse/node/3389580222[/url] | Werther        | Werther (Westf.)     | 
 [url]http://www.openstreetmap.org/browse/node/3559844567[/url] | Schneverdingen | Wintermoor a. d. Ch. |

die ersten 10 von ~170.000 Nodes

und 10 Rels


                                                      |            liegt in             |         addr:city          | addr:suburb 
------------------------------------------------------+---------------------------------+----------------------------+-------------
 http://www.openstreetmap.org/browse/relation/4154752 | Stolberg                        | Stolberg (Rhld.)           | 
 http://www.openstreetmap.org/browse/relation/3344572 | Euskirchen                      | Billig                     | 
 http://www.openstreetmap.org/browse/relation/4278304 | Sprockhövel                     | S                          | 
 http://www.openstreetmap.org/browse/relation/3692955 | Meißenheim                      | Kürzell                    | 
 http://www.openstreetmap.org/browse/relation/3790973 | Hagen am Teutoburger Wald       | Hagen aTW                  | 
 http://www.openstreetmap.org/browse/relation/3803902 | Sankt Georgen im Schwarzwald    | Langenschiltach            | 
 http://www.openstreetmap.org/browse/relation/2225076 | Rüsselsheim am Main             | Rüsselsheim                | 
 http://www.openstreetmap.org/browse/relation/3509101 | Karlsruhe                       | Karlsruhe-Hohenwettersbach | 
 http://www.openstreetmap.org/browse/relation/2593648 | Frankfurt am Main               | Frankfurt                  | 
 http://www.openstreetmap.org/browse/relation/1126033 | Frankfurt am Main               | Frankfurt                  |

Ein populärer Fehler ist es, den Ortsteil (gibt es auch bei der DPAG) statt “addr:suburb” (oder gar nicht) als “addr:city” einzutragen. Siehe Dein Beispiel Wintermoor als Ortsteil von Schneverdingen.

Korrekt - deine Aussage, nicht das Tagging. :wink:

In der aktuellen Auswertung hab ich die Ortsteile, soweit sie als AL9 erfasst sind, noch nicht berücksichtigt. Mal sehen, ob das später Sinn machen wird.
Und nein: Place-Nodes gelten nicht!

WayneSchlegel war später selbst bei einem späteren Stammtisch anwesend. Dort war dann keine große Ablehnung des Massenedits vorhanden. Verbreitet war eher ein “kann er machen wenn es ihn interessiert”. Ich habe ihn geraten die Diskussion fortzusetzen und das ich nichts gegen die Edits habe.

Meine Meinung: Adressen sind etwas anderes als Postleitzahlengebiete. Wenn es eine offene Datenquelle gäbe dann müssten wir die Postleitzahlengebiete wahrscheinlich nicht in OSM pflegen. Wenn zur Ermittlung der Adresse eines POI eine eigene Datenbank mit spezieller Abfrage notwendig ist dann ist die Verwendung von OSM-Adressdaten unnötig erschwert.

Bevor du die privatrechtliche Post verwendest, such lieber da
https://www.destatis.de/DE/ZahlenFakten/LaenderRegionen/Regionales/Gemeindeverzeichnis/Administrativ/AdministrativeUebersicht.html

Redundanz ist doch was Feines - sie deckt nämlich Unstimmigkeiten auf.

Hier mal eine “kleine” Auswertung der Abweichungen zwischen “addr:city” und der Stadtbezeichnung, die aufgrung der Ortsgrenzen bestimmt wurde:

173133 als Nodes erfassten Adressen in DE, deren addr:city ungleich dem Ortsnamen sind.

city-nodes.txt ca 14.3 MB.

Gründe sind

  • unterschiedliche Schreibweisen mit oder ohne Erweiterungen
  • Angabe des Ortsteiles anstelle der Stadt
  • Vermischung Stadt / Ortsteil
  • Tippfehler
  • Fehlende Korrekturen von Namensänderungen oder “Umgemeindungen”

Dass ich den ‘addr:city’-Tag als überflüssig erachte, sollte jetzt allen klar sein - oder ihr bereinigt das. Dann wäre aber auch eine intensive Benutzung des ‘addr:suburb’-Tags sinnvoll.

Die Ways und Relationen rechnen noch.

Gruss
walter

In Bergisch Gladbach fehlen auch noch viele. Da habe ich vor ein paar Monaten das PLZ Gebiet 51467 bearbeitet.
Habe dann aber aufgehört als ich von einem möglichen Import der Adressdaten gelesen habe.
Von Hand ist das eine Sch… Arbeit die ich eigentlich nicht gerne mache. Falls es aber keinen Import gibt werde ich weiter machen…

Hm, beeindruckend. Oder eher be-drückend :wink:

Habe gleich mal angefangen – da ich ohnehin gerade Hausnummern in einem Teilort erfasse, habe ich mal die paar falschen addr:city dort korrigiert und nebenbei jeweils addr:suburb hinzugefügt. (*1) Da ich den Ort gut kenne und weiß, dass addr:city dort wirklich genau so angegeben wird etc., sollte das hoffentlich kein Problem sein. Aber das scheint mir die Bedingung zu sein – ich meine, dass man den Ort kennt und genau weiß, was man da tut. Sonst haben wir bald die nächsten Diskussionen über unerwünschte und ggf. fehlerhafte Massenedits … :frowning:

(*1) http://www.openstreetmap.org/changeset/34754478

Omg: hier die 534293 Ways und Relationen city_ways_rels.txt ca 43.2 MB.

Soviele hatte ich aber nicht erwartet. :frowning:

Hab zu meiner Sicherheit mal einige Stichproben gemacht und ja, sehr viele Ortsteile sind als addr:city getaggt. Da muß ich erstmal drüber nachdenken. Ein reines Gewissen, was “meine Ecke” angeht, hab ich auch nicht mehr; kann mich an Zeiten erinnern, wo mir das ziemlich unklar und wohl auch egal war.

Gruss
walter

PUH: Schlangenbad hatte nur 1x addr:city falsch und 5 highways mit Adressen/Postcode. Fehlende addr:suburb massenhaft, aber die trage ich nicht nach, da ja mMn die Admin-Grenzen ausreichen - wenn welche da sind.

Ich hatte letztens erst Fälle, da haben sich merkwürdige Unicode-Zeichen in das addr:city eingeschlichen - keine Ahnung, wie die da rein kamen, ich hab es erst gemerkt, als ich die Gegend in iD betrachtete, da dort diese Zeichen sichtbar waren, während sie überall sonst (im Webinterface und auch in JOSM) unsichtbar sind.

wenn du nochmals einen findest, könntest du den melden und unverändert lassen. Würde mich interessieren was da los war.

Gruss
walter

Habe mir die schöne Liste (danke!) mal ein bisschen angesehen und kann nur bestätigen, dass dies eines der häufigsten Probleme ist, ebenso, dass addr:city eine Kombination von Stadt und Ortsteil enthält (z.B. ‘Harsewinkel-Marienfeld’). Auch schlichte Falschschreibungen kommen vor (z.B. sehr viele ‘Ueberlingen’, wo Überlingen am Bodensee gemeint ist). Beides ist ja eigentlich nicht erstaunlich…

Überrascht hat mich aber, dass immer mal wieder der Wert des addr:city-Tags eigentlich OK ist, dafür aber der ermittelte Ortsname (also wohl der an den Admin-Grenzen?) seltsam. Z.B. ist ‘Stötten a.Auerberg’ die amtliche Schreibweise: aber möchten wir so etwas wirklich in unseren Daten haben oder auf einer gerenderten Karte lesen? Die Abkürzung von ‘am’ durch ‘a.’ ist doch lächerlich, sie spart kein Byte/keinen Anschlag, und der Wert des addr:city-Tags ‘Stötten am Auerberg’ kommt mir wesentlich sinnvoller vor. (Dass bei eben diesem Stötten oft auch noch der Ortsteilname an addr:city angehängt ist, ist ein anderes Problem.) Vom gleichen Kaliber ist u.a. ‘Taching a. See’. Bei ‘Weiden i.d.OPf’ fehlt bei der ermittelten Schreibweise der Schlusspunkt, in den addr:city-Tags steht der Punkt korrekt drin. Aber auch hier fände ich es wesentlich verständlicher, in beiden Fällen ‘Weiden in der Oberpfalz’ zu schreiben… Nicht jeder versteht ‘OPf.’

Kurz, nicht immer ist der Wert des addr:city-Tags falsch, manchmal könnte man auch darüber nachdenken, den ermittelten Ortsnamen zu ändern, oder beide.

Was soll das bringen? Da gibt es nur die PLZs für die Adressen der Gemeindeverwaltungen. Das hilft für andere Adressen selten weiter.
Die Post ist nun einmal (leider) die alleinige “Organisation”, die in Deutschland die PLZ inkl. Ortsbezeichnungen bestimmt.

Ich bin der Meinung, der “richtige” Wert für “addr:city” ist die Ortsbezeichnung im PLZ-Verzeichnis der DPAG (Nur so kommt es sicher an.). Ob man Abkürzungen dann ausschreibt, ist eine andere (weniger wichtige) Frage.

Wenn der “name” einer Gemeinde abgekürzt ist (was ich nicht immer falsch finde, wenn es so üblich ist), sollte man bei Änderung auf Langschreibung aber besser auch ein “official_name” mit der amtlichen Schreibung setzen. Auch zu beachten ist ein mögliches “name:suffix”.

P.S.: Wir schweifen hier ab, was den eigentlichen Threadgegenstand angeht.

Ist addr:city=Pinnau hier wirklich ein “Fehler”?

XYZ
Hauptstraße 18
19273 Pinnau

ist ein völlig korrekte Adresse. Sie ist auch eindeutig. https://www.postdirekt.de/plzserver/ wirft sie als Treffer bei der Suche nach “Pinnau” und “Hauptstr.” aus

Angesichts der (wenn ich mich eben nicht verzählt habe) fünf Hauptstraßen im Amt Neuhaus finde ich diese Variante sogar zielführender als (die nach DIN 5008 ebenfalls korrekte) Anschrift

XYZ
Pinnau
Hauptstraße 18
19273 Amt Neuhaus

In diesem Fall genau nicht, weil 19273 Pinnau ein eigener Ortseintrag (nicht Ortsteil) im PLZ-Verzeichnis ist.

Und wie könnte Wambachers Liste das lernen, also bei vorhandenem “Ortseintrag” diesen als addr:city akzeptieren? Ansonsten sind da x Prozent falsche Positive drin.

Automatisch gar nicht, wenn man nicht die Datenbank der DPAG benutzen kann.
Außerdem gibt es ja noch die Einzelfälle, wo Adressen in einem Ortseintrag einer anderen Gemeinde gelistet sind.

Kurz zur Auswertung:

Ich will/wollte keine Fehler anzeigen sondern nur darstellen, dass es Abweichungen gibt.
Was davon als “Fehler” angesehen wird und was nicht, steht ja noch offen. Und erst recht, welche Anpassungen man macht, damit die Addr-tags für City und Suburb zumindest nicht völlig falsch sind.

@gehrke: > wir schweifen ab
bezieht sich das auf Stuttgart? wenn ja, mach ich gerne einen eigenen Thread auf.

Gruss
walter

In der Liste sind einige merkwürdige Unicodes bei Hamm.

Gruß,

Baßtölpel