Das stimmt zwar, aber dies für eine Einschätzung der Datenqualität auf Gemeindeebene anzuwenden, ist statistisch für mich ein falscher Ansatz. Das würde ich noch nicht einmal für einen Vergleich der Bundesländer machen, da auch in diesen die Wohnsituation und die Gewerbeansiedlung zu unterschiedlich sind, um nur zwei Faktoren zu nennen, die auf die Einwohner je Adresse Einfluss haben. Ein weiterer Faktor wäre z.B. eine hohe Anzahl von Studenten in einer kleinen oder mittleren Stadt, was die Einwohnerdichte gegenüber ähnlichen Stadtgrößen ohne Studenten deutlich nach oben drückt.
daür habe ich meine Sonderauswertung [1] erstellt. Im Gemeindeverzeichnis von Destatis gibt es auch die Einwohner und die Gemeindeart (städtisch, “halb-städtisch”, ländlich) und auf Basis der ersten 26 erhaltenen Hausnummerlisten in Deutschland hatte ich mal Formeln erstellt, siehe mein Blogeintrag [2].
Meine aktuellen Formeln sind
WHEN gliederungstadtland = 1 THEN round(bevoelkerungszahl / (0.0012641972 * bevoelkerungszahl/flaechekm2 + 3.6186831727))
WHEN gliederungstadtland = 2 THEN round(bevoelkerungszahl / (0.0009526399 * bevoelkerungszahl/flaechekm2 + 3.3248473106))
WHEN gliederungstadtland = 3 THEN round(bevoelkerungszahl / (0.0009829255 * bevoelkerungszahl/flaechekm2 + 3.1276968459))
Ich hatte diese theoretische Berechnung für ganz Deutschland in meinem SOTM-EU Beitrag [3] nur in den Präsentationsfolien [4] dargestellt, aber nicht vorgetragen aus Zeitgründen.
Damals kam ich mit diesen Berechnungen auf 19,3 Mio Hausnummern für ganz Deutschland. Die Website [6] spricht von “über 21 Mio” und die müsste es wissen.
Das ganze passt natürlich nur im gemittelt für ganz Deutschland und auch dann noch grob. Es zeigt aber in der Kartendarstellung [5] Hotspots, wo in größeren Gebiete schon viele Hausnummern erfasst wurden und ländliche Gebiete (z.B. Rheinland-Pfalz, Mecklenburg-Vorpommern, Teile in Thüringen), wo noch viele Gemeinden ohne Adressen vorkommen. Rheinland-Pfalz sticht da mit über 1.000 Gemeinden ohne Hausnummer hervor, aber die dortigen Gemeinden sind auch extrem klein gegliedert.
Die Daten in der Karte sind Stand Ende August.
Da hast Du meine Absicht missverstanden. Ich kenne ja Dietmars Zahlen (9,2 bis 3,1). Es ging mir nur um die Verdeutlichung, was insgesamt noch fehlt und dass 4000 Einwohner pro Adresse ca. um Faktor 1000 zu viel ist.
Ergo: Größenordnungen nicht statistisches Maß für alle Gemeinden.
Aber als Couch-Mapper wäre es extrem hilfreich zu wissen, in welchem Bundesland die Gemeinde liegt. Wenn das mit aufgelistet würde, könnte ich mir leicht welche herauspicken, wo es vernünftige legale Overlays für Adressen gibt (z.B. Alk für NRW)
EDIT: Ist UTF-8 und zumindest Windows 7 ist zu doof, das in Wordpad ohne BOM anzuzeigen. Wenn Du das für UTF-8 optionale BOM als “” an den Anfang der Datei einfügst, geht es. Mache dann wohl das nächste mal wieder ISO-8859-1.
von mir gibt es eine neue Auswertung der theoretischen Hausnummerabdeckung, also in welchen Gemeinden sind wieviel % der theoretischen Hausnummern bereits in OSM erfasst.
Die Auswertung hat am Mi 1.10. begonnen und wird vorauss. bis Sonntag fertig sein.
Aktualisierte Kartendarstellung mit 10/2014 Daten
Die Kartendarstellung gibt es wie bisher bei [1]. Dort enthält der direkt sichtbare Layer die Daten von 10/2014. Im Layer-Menü direkt darunter ist die vorherige Auswertung von Ende August verfügbar, nach der damaligen Wochenaufgabe der Hausnummer-Vervollständigung.
Die weiteren Layer (Nutzung der associatedStreet-Relationen und der unvollständigen Hausnummern) muss ich für 10/2014 noch ergänzen, bitte den Datumstand bei jedem Layer-Eintrag beachten.
Tabellarischer Vergleich 10/2014 vs. 08/2014
Zusätzlich gibt es jetzt eine tabellarische Ausgabe je Gemeinde und dort auch den direkten Vergleich zwischen der Anzahl OSM Hausnummer in 10/2014 vs. 08/2014 [2].
Dort kann man am einfachsten die Zuwächse der letzten 2 Monate sehen, dazu die Spaltenüberschrift “Diff. Anz. OSM Adressen” anklicken zum sortieren.
Die Auswertung ist zwar bei weitem noch nicht fertig, aber jetzt ist schon erkennbar, das in NRW die stärksten Zuwächse sind (dem NRW-Atlas Layer geschuldet!?).
Aktualisierte Formeln und Gesamtzahl Deutschland-Hausnummern
Bei der Gelegenheit habe ich meine Formeln für die theoretische Hausnummerabdeckung angepasst. Zum einen gibt es mittlerweile für 47 deutsche Gemeinden eine Hausnummerliste (bei der vorherigen Berechnung waren es noch 26) und zum andern habe ich die Berechnung genauer unterteilt und die Gliederung Stadt/Land weggelassen und nehme die Einwohnerzahlen.
Mit den neuen Formeln komme ich auf 20,9 Mio theoretische Hausnummern, was der Angabe auf adv-online.de von “über 21 Mio” nahekommt (früher hatte ich nur 19,3 Mio erreicht[3]).
Sowohl der neue Layer für die 10/2014 Auswertung als auch die 08/2014 wurden bzgl. der neuen Formeln angepasst.
Hier die Formeln:
WHEN flaechekm2 > 0 AND bevoelkerungszahl > 0 AND bevoelkerungszahl <= 5000 THEN round(bevoelkerungszahl / (0.000920645 * bevoelkerungszahl/flaechekm2 + 3.002091115))
WHEN flaechekm2 > 0 AND bevoelkerungszahl > 5000 AND bevoelkerungszahl <= 20000 THEN round(bevoelkerungszahl / (0.000509945 * bevoelkerungszahl/flaechekm2 + 3.086196323))
WHEN flaechekm2 > 0 AND bevoelkerungszahl > 20000 AND bevoelkerungszahl <= 100000 THEN round(bevoelkerungszahl / (0.000865691 * bevoelkerungszahl/flaechekm2 + 3.490431037))
WHEN flaechekm2 > 0 AND bevoelkerungszahl > 100000 AND bevoelkerungszahl <= 250000 THEN round(bevoelkerungszahl / (0.000728235 * bevoelkerungszahl/flaechekm2 + 3.394332878))
WHEN flaechekm2 > 0 AND bevoelkerungszahl > 250000 THEN round(bevoelkerungszahl / (0.001400991 * bevoelkerungszahl/flaechekm2 + 3.46995551))
Mit den Formeln wird bei vorhandener Anzahl Einwohner und Fläche einer Gemeinde die theoreetische Anzahl Hausnummern der Gemeinde berechnet.
Bei Excel kann helfen, die Datei komplett aus Wordpad mit Copy&paste in ein leeres Sheet einzufügen. Dann kann man noch allerlei einstellen, auch das Encoding, glaube ich.