Adressstatistik

Interessanterweise scheint bei der theoretischen Hausnummerauswertung die Formel zur Berechnung der theoretischen Anzahl an Adressen angepasst worden zu sein. Allerdings nach oben, was die Statistik in vielen Fällen noch unrealistischer macht, als sie es bisher war.

Hallo Prince Kassad,

stimmt, ich habe sie angepasst, gut aufgepasst :wink:

Ich kam bisher mit den Formeln nur auf etwas über 20,2 Mio Adressen, obwohl ich von ADV-Online (die bundesweit die bundesland-Hausnummern zusammenfassen zum zentralen Vertrieb) für 2014 die Zahl von 21.214.355 Adressen für Deutschland bekommen habe. Deshalb habe ich einen Korrekturfaktor von ca. 1,05 verwendet, damit ich zur korrekten Summe komme.

Meine Formeln basieren auf den 49 Hausnumerlisten von Oktober 2014. Die Großstädte sind überproportional vertreten, weil diese am ehesten Hausnummerlisten herausrücken. Bei den mittelgroßen Gemeinden kommen die allermeisten Listen aus NRW, weil dort der OSM-User TheFive von mehreren Kreisen die gesamten Gemeindelisten erhalten hatte. Für kleine Gemeinden haben wir leider nur wenige Listen. Mit den verfügbaren Listen kommt halt nur eine grob passende Auswertung heraus, sorry dafür.

Ich nehme gerne jederzeit weitere Hausnummerlisten entgegen, damit wir mögichst häufig echte Auswertungen haben und nicht auf die theoretische Auswertung angewiesen sind (dies ist ein Aufruf dazu ;).

Auch bessere Formeln würden aber in vielen Fällen daneben liegen, vor allem bei den Großstädten. Ein Beispiel dazu: Bremen hat mit 550.000 Einwohnern genauso 150.000 Adressen wie München mit 1,43 Mio Einwohnern. Das ist ein Extremfall und liegt daran, das es in Bremen Baubestimmungen gibt, die dafür sorgen, das sehr viel mehr kleine Wohneinheiten vorhanden sind. Im Durchschnitt sollte es halt stimmen, aber im Einzelfall ist die theoretische Hausnummerauswertung auch schon mal grob daneben.

Hinweis: die Anpassung der Formeln war ein Vorgriff auf eine Auswertung des Hausnummernstands in OSM im Vergleiche Ende 2015 zu Ende 2014, die will ich in den nächsten Tagen erstellen.

viele Grüße

Dietmar

Ich habe die Liste für Münster jetzt mal angesehen:

Nur was schließe ich daraus?

Gruß Klaus

Das sind nur die reinen Zahlen des aktuellen Standes. Den Schluss will ich Dir nicht vorgeben.
Wenn man sich die Daten regelmäßig anschaut, könnte man z.B. sehen, dass in Münster innerhalb eines Monats über 2.300 und innerhalb der letzten 6 Monate fast 4.500 Adressen hinzugekommen sind. Wer kann und will, darf sich dann auch auf die Schulter klopfen. Man kann sich auch fragen/wundern, warum der größte Fortschritt offenbar allein im Dezember erzielt wurde.

Ich werde den Wert des letzten Monats beim nächsten Mal gerne mit aufführen.

regio-osm verrät, dass es in Münster laut Stadt 61.773 Adressen geben soll. Diese Werte (sofern vorhanden) könnte ich mit aufführen, wenn ich sie als Liste hätte.

Ja, Vergleichszahlen wären auf jeden Fall interessant.

Gruß Klaus

PS: 58469 von 61773 Adressen … das wären 94.65 Prozent. Bedingt durch unser Vorgehensmodell in Münster kommen in der nächsten Zeit sicher noch etliche Adressen hinzu. Die Gebäude dazu sind bereits erfaßt. BTW: Die meisten Karten in der Münsteraner Tageszeitung basieren inzwischen auf OSM-Daten … heute waren das z.B. zwei.

Leider nicht ganz. Der Wert 58469 gibt die vorhandenen Adress-Elemente (N,W,R) in OSM an - nicht die eigentlichen Adressen. Da sind also Duplikate dabei. Die auszuwerten, ist gar nicht so trivial, weil ja Adress-Elemente auch Duplikate sein können, ohne dass alle Adresstags identisch sind (z.B. wenn nur bei einem addr:postcode nicht angegeben ist).

Ich werte das zwar auch aus (bisher allerdings nur für DE gesamt), aber dann kann ich nicht mehr nach Elementtyp zählen (was sich einige gewünscht hatten). Die duplikatfreie Gesamtzahl pro Gemeinde ist also eine ganz eigene Auswertung. Werde das wohl nochmal angehen. Dietmar macht das ja, aber ich bin nicht sicher, wie er Duplikate definiert hat.

Hallo Gehrke,

In Deutschland habe ich für 74 Gemeinden echte Hausnummerlisten. Für die willst Du die Anzahl Adressen haben, nicht für alle die theoretischen Werte, oder?

Falls für die echten 74 Listen: da habe ich die in meine DB eingelesene Anzahl Adressen, die auch auf den Auswerteseiten abzulesen sind. Oder ich kann mir nochmal die Originallisten ansehen und die Zahlen vor dem Import an Dich weitergeben. Während des Imports fallen unvollständige und doppelte Adressen heraus. In einigen Gemeinden, wie Köln, gibt es auch echte mehrfache Adressen, weil es identische Straßen in mehreren Stadtteilen gibt und die sind bisher bei den Importen dann herausgefallen.

viele Grüße

Dietmar

Hallo Gehrke,

Vorab: ich kann noch keine echt mehrfachen Adressen (Straße und Hausnummer) auswerten, also das mehrfache Vorkommen einer Straße mit Hausnummer ist für mich eine Dublette. Alle weiteren Angaben, wie addr:postcode, addr:city, addr:suburb und was sonst noch, werte ich nicht aus (genauer gesagt, in Deutschland nicht).

Bei einem mehrfachen Vorkommen nehme ich dann das Objekt, welche für mich am genauesten die Adresse definitiert, in absteigender Priorität:

  • Adresse mit entrance=yes (Hauseingang)
  • Adresse mit building=* (ob Knoten oder Fläche)
  • POI mit der Adresse, ohne die vorgenannten Angaben
  • purer Adressknoten ohne die vorngeannten Angaben. Darunter fallen auch Adressknoten, die innerhalb eines Gebäudes liegen, weil ich nicht auswerte, ob der Knoten sich in einem building-Objekte befindet.

Von den weiteren Angaben wäre am sinnvollsten addr:postcode auswertbar, weil die PLZ in wenigen Fällen in einer Hausnummerliste mitgeliefert wird.

Wenn ich die anderen addr:-Angaben noch auswerten würde, müsste ich mir überlegen, wie ich die gefundenen Ungereimtheiten bereitstelle, damit Interessierte sich diese Fehler oder Umstimmigkeiten ansehen könnten. Das habe ich bisher noch nicht angepackt. Es gibt mindestens von Christopher Lorenz eine Auswertung (noch nicht frei verfügbar), der in einer Gemeinde die Adressen analysiert, um Unstimmigkeiten oder unvollständige Adressen anzuzeigen. Vielleicht schaffe wir es dieses Jahr, die beiden Auswertungen zu verknüpfen, das würde sicherlich einigen Mehrwert bringen.

viele Grüße Dietmar

Was aber definiert die räumliche Äquivalenz? Ich nehme das Postleitgebiet (boundary=postal_code).

Habe ich jetzt inkl. Differenzwert eingebaut und wird im nächsten Monat ausgeliefert. Gemeindefusionen werde ich aber nicht extra behandeln. Das heißt bei neuem Schlüssel gab es vorher 0 Adressen, bei Eingemeindungen mit gleichem Schlüssel plötzlich alle aus der aufgelösten Gemeinde dazu.

Hier mal eine Vorschau.

Beinhaltet das auch POI wie z.B. Geschäfte bei denen eine vollständige Adresse angegeben ist?

Gruß Klaus

Hallo Gehrke,

ich verwende die Gemeindegrenzen.

viele Grüße Dietmar

Hallo Klaus,

Ja, POIs mit mindestens addr:street und addr:housenumber (ggfs. weitere interessieren mich nicht). Der POI mit Adresse wird aber nur verwendet, wenn nicht ein höher priorisiertes Objekt mit der selben Adresse vorhanden ist.

viele Grüße Dietmar

Dumme Zwischenfrage: akzeptierst Du statt addr:street + addr:housenumber auch addr:place + addr:housenumber? So wie ich die Definition von addr:place verstehe, kann es ja gerade auch für Weiler/Einzelgehöfte/etc. verwendet werden, die keine Straßennamen haben (also für Adressen wie ‘Gerstenäckerhöfe 3, 74906 Bad Rappenau’; ‘Gerstenäckerhöfe’ ist hier mMn ein addr:place, kein Straßenname, es gibt auch kein Straßennamensschild).

Hallo Chrysopras,

sie ist berechtigt, nicht dumm :wink:

Ich berücksichtige addr:place, wenn addr:street fehlt. In der Kartendarstellung für die theoretische Hausnummerabdeckung [1] gibt es u.a. den Layer “absolute Anzahl mit addr:place Tags”, um geografisch die Nutzung dieses Tags zu sehen.

Nach dem Klick auf eine Gemeinde wird in dem Popup-Fenster auch nochmal die “Anzahl Adressen mit addr:place” angegeben.

viele Grüße Dietmar

[1] http://www.regio-osm.de/hausnummerauswertung/maptheoevaluation.html

In Deutschland verfügt OSM jetzt über 10.011.025 Adress-Einträge (Definition und Details siehe bei mir im Wiki). Das sind 192.424 mehr als im Vormonat (6.207 zusätzlich pro Tag). Allerdings sind 238.805 Adressen als Duplikate von der Gesamtanzahl abzuziehen. 10 Mio. sind demnach noch nicht erreicht.

74,7 % der Adressen sind als ways definiert. Vor einem Jahr waren es noch 72,5 %.

Ich habe eine Liste für alle Gemeinden zusammengestellt und als CSV bereitgestellt. Mit dabei ist jetzt auch der Vergleich zum Vormonat - absteigend hiernach sortiert.

Ich habe auch die Auswertung “Hausnummern ohne Straße je Kreis” aktualisiert. Es sind 16.097 Fälle - vor allem im Regionalverband Saarbrücken (1.141).

Den Überblick der Statistiken habe ich auch als Karte visualisiert.

Ich habe meine monatliche theoretische Hausnummerauswertung für die Adressen laufen lassen [1] und komme auf 10.250.432 Adressen, um Dubletten bereinigt.

Einsamer Spitzenreiter beim absoluten Zuwachs ist Duisburg mit 21.437 Adressen, gefolgt von Unna mit 6.635 Adressen [2].

viele Grüße

Dietmar

[1] http://www.regio-osm.de/hausnummerauswertung/maptheoevaluation.html?zoom=6&lat=51.41152&lon=12.35008&layers=B00TFFFFFFFFFF
[2] http://www.regio-osm.de/hausnummerauswertung/theoretische_auswertung_anzeigen

edit: falsche Zahl 9.875.261 korrigiert.

Die Auswertung ist aber mächtig in die Hose gegangen. Viele Städte fehlen komplett, u. a. Hamburg, Bayreuth, oder auch Landau in der Pfalz.

Hallo Prince Kassad,

vielen Dank für Deinen Hinweis!

Die Gemeinden liefen alle durch, aber die mit mehr als einem Polygon erzeugten einen Fehler beim Gesamtpolygon berechnen und wurden falscht ausgewertet und nicht angezeigt.

Ich habe die fehlerhaften Auswertungen neu berechnet und entprechend die Anzahl der Hausnummern in OSM korrigiert. Wir haben jetzt über 10 Mio Adressen in OSM für Deutschland.

viele Grüße

Dietmar

Meine Hochrechnung (vom 1.11.15) war nicht schlecht.