Adressstatistik

Ich hatte im PLZ-Thread vor einigen Tagen mal einige Daten zur Häufigkeit und Struktur von Adressdaten in Deutschland je Gemeinde angegeben.
Inzwischen (Datenstand 2014-03-20) habe ich die Auswertung wiederholt (und auch einen Fehler entfernt).
Die Übersicht gibt es vorerst als Auszug bei mir im Wiki (vollständige Daten folgen noch):

https://wiki.openstreetmap.org/wiki/User:Gehrke#Adressstatistik_Deutschland

Für addr:street und addr:housenumber gibt es in DE 5.242.846 Adressen. Seit der letzten Auswertung (Datenstand 2014-03-04) sind 105.455 Adressen hinzugekommen. Top-Städte sind, wie zu erwarten, Berlin, Hamburg und München. Heraus ragen relativ zur Einwohnerzahl auch Dortmund und Bielefeld.

74 % der Adressen sind explizit vollständig, haben also zusätzlich auch addr:postcode, addr:city und addr:country (suburb und state ignoriere ich).

Dieser Thread is dazu gedacht, Einzelheiten und Fortschritte bei der Adresserfassung in Deutschland zu diskutierten und zu berichten.

Nodes vs. Ways:

Bei Ways (also in aller Regel buildings) hat Hamburg mit 112.766 Adressen klar die Nase vorn. Bei Nodes führt Berlin (89.756 Adressen) vor München (72.635).
Es scheint als sei in den größeren Städten stets eine Mappingart deutlich vorherrschend.

Insgesamt sind ca. 70% der Adressen als Ways erfasst.

Zählt ein Eingang eigentlich als Node oder Way? Node, oder?

Bzw. könntest ja entrance= mal mit auswerten.

Ja, als Node (so wie es in der DB steht). Mal schauen, viell. mach ich mal ne Stichprobe für die Großstädte.

Mal vorsichtig gefragt: Ist es denn erstrebenswert, dass neben Straße und Hausnummer auch addr:postcode, addr:city und addr:country an jedem Adressnode/Gebäude vorhanden sind?

So lange die Daten korrekt sind, stört es natürlich auch nicht, wenn sie redundant sind. Leider stolpere ich aber gerade bei den Postleitzahlen häufig über Fehler, und die zu korrigieren ist über die Nodes/Gebäude sehr viel aufwändiger als über die entsprechenden Relationen.

Das ist ein leidiges gern diskutiertes Thema hier. Ehrlich gesagt war Dein Gedanke ursprünglich mein Grund für die Aufstellung der Statistik. Ich wollte sehen, wie verbreitet denn das “vollständige” Tagging überhaupt ist. Einige sagten ja, es sei ein Problem, wenn man nicht alle addr-Tags setzt, weil man mit den Adressdaten dann in einigen Usescases nichts mehr anfangen könne.

Meine Auswertung ergibt, das nur 74% der Adressen überhaupt “vollständig” sind und sogar nur 61 % der deutschen Gemeinden über Adressen dieses Schemas verfügen. Für mich heißt das, im Zweifel muss man die Informationen eh aus den Relationen/Polygonen herleiten. Ich setze deswegen z.B. kein addr:city|country und meist auch kein addr:postcode mehr. Löschen tue ich es aber auch nicht. Wenn es falsch ist, wird es wohl oder übel korrigiert.

An vielen Eingängen hängt aber noch das veraltete building=entrance, das jemand weltweit in entrance=yes korrigiert hatte, aber das wegen Massenedit wieder reverted wurde.

Mir hat der Eintrag addr:postcode an den Gebäude-Adressen beim Reparieren (Zurechtrücken) der PLZ-Grenzen in Hamburg sehr geholfen.

Franz

Um Fehler zu finden, ist addr:postcode in der Tat sehr hilfreich (gewesen). Der Sinn der Irrläufer-Aktion ist ja, die PLZ-Grenzen mit Hilfe von addr:postcode (und DPAG!) zu optimieren. In Zukunft kann, nach meiner Meinung, in den meisten Fällen/Gemeinden auf das Tag verzichten werden bzw. man braucht es nur für ausgewählte Marker setzen.

Auf jeden Fall sollte man es nur setzen, wenn man sich wirklich zu 100% sicher ist. In vielen Fällen war das offenbar nicht so (bzw. der Mapper war sich zu schnell zu 100% sicher). Man sollte auch bedenken, dass sich PLZ öfter ändern als man gemeinhin denkt. Bei einer Änderung müssen dann alle Adressen einzeln korrigiert werden (Massenedit ist ja allerstrengstens verboten!), anstatt nur die Relation zu ändern.

http://osm.lyrk.de/address/#14/48.3535/10.8391

Ist übrigens ganz nett, wenn man sich das nur für ein kleines Gebiet anschauen will.

Kann man eigentlich irgendwie abschätzen, wieviele Adressen es in einer Stadt geben müsste (je nach Einwohnerzahl)? Ich nehme mal an, das ist nicht streng proportional zur Einwohnerzahl. Durch große Mietshäuser wird die Anzahl Einwohner je Adresse in Großstädten höher sein. Referenzwerte wären sicher nicht schlecht.

Bielefeld hat als sehr gut erfasste mittlere Großstadt mit 328.314 Einwohnern und 63.931 OSM-Adressen übrigens eine Quote von 5,1 Personen pro Adresse. In Dortmund sind es 5,9 Personen pro Adresse. Wäre das in Berlin genauso (wovon ich nicht ausgehe), müsste es in Berlin 578.829 Adressen geben. In OSM sind es nur 136.455.

Berlin ist nicht mal annähernd vollständig. Ich kann jetzt nur die Situation in Prenzlauer Berg beurteilen und da fehlen noch viele, viele Hausnummern, häufig wird noch interpolation benutzt. Außerdem sind viele Häuser sehr ungenau eingezeichnet, das geht besser.

Hallo Gehrke,

es gibt in Berlin 385000 Adressen, dort gibt eine OpenData Hausnummernliste, die ich in meiner Hausnummerauswertung drin habe [1]. Wegen einiger Ungereimtheiten sind davon aktuell nur 375.000 in meiner Auswertung aktiv.

Aufgrund der bisher 11 vorhandenen städtischen und dörflichen Hausnummerliste habe ich versucht, Faktoren Einwohner/Adresse zu erstellen, siehe [2] (dort Abschnitt “Städtische und ländlische Hausnummer/Einwohnerzahlen”).

viele Grüße

Dietmar

[1] http://regio-osm.de/hausnummerauswertung/auswertung_auswahldetails?stadt=Berlin
[2] http://www.openstreetmap.org/user/okilimu/diary/20960

Hallo Dietmar,

vielen Dank für Erinnerung und Link. Wusste ich doch, dass ich dazu etwas gelesen hatte.

Viele Grüße
Jan

Dietmar,

kannst Du mir sagen, wie viele Adressen es z.B. in Augsburg gibt? Ich finde auf Deiner Seite dafür keine explizite Angabe.

Meine Auswertung zählt dort nämlich schon 42.325 Adressen (Straße + Hausnummer). Ich werte aber nicht aus, ob Adressen doppelt erfasst sind (z.B. Geschäft mit Adresse in Gebäude mit Adresse).

Hallo Gehrke,

es sind in der offiziellen Liste 41.622 Hausnummern vorhanden. Wenn Du eine Stadt, z.B. augsburg auswählst [2] und dort den oberesten Eintrag (den Stadtnamen selbst) auswählst, bekommst Du die Stadt-Gesamtzauswertung und am Tabellenende die Abdeckung und u.a. auch die soll-Anzahl. Bei Augsburg kommen da unten Soll 41387 Hausnummern an, weil die Hausnummern, die wir definitiv nicht finden, ausschließen und unten nicht mit gezählt werden (die soll-anzahl reduziert). Die Zahl am Absatzanfang ist die richtige.

Deine Zahl ist schon zu hoch und darin enthalten sinnd auch in Augsburg 419 Hausnummern, die nur in OSM vorliegen. Das sind zum einen neue Adressen und einige sich noch einige Fehlerfassungen.

Die Soll-Zahlen der anderen Städte kriegst Du über die gleiche Vorgehensweise am Tabellenende.

viele Grüße

Dietmar

[1] http://wiki.openstreetmap.org/wiki/Augsburg/Status-Details
[2] http://regio-osm.de/hausnummerauswertung/auswertung_auswahldetails?stadt=Augsburg

Ich finde, die Mapper in Berlin sollten sich mal ein bisschen ins Zeug legen und Hamburg bzgl. Adressen abhängen. :wink:

Hier mein Zählstand (2014-03-24T21:55:02Z) für die Millionenstädte (für Straße+Hausnummer):


Gemeinde 	Ways 	Nodes 	Gesamt
---------------------------------------
Hamburg 	113119 	23964 	137083
Berlin		 46736 	89789 	136525
München 	 36702 	72640 	109342 
Köln		 83215 	10871 	 94086 

Das ist nun passiert: Berlin hat nun 139.546 Adressen vor Hamburg mit 137.902. Sonst hat sich im Städte-Ranking nicht viel getan.
Insgesamt zähle ich (2014-04-01) 5.325.822 Adressen in DE (65.376 mehr als vor 10 Tagen). Noch immer gibt es 2.543 Gemeinden ohne eine einzige Adresse.

Übersicht: https://wiki.openstreetmap.org/wiki/User:Gehrke#Adressen_mit_Angaben_f.C3.BCr_Stra.C3.9Fe_und_Hausnummer

Wir sollten das mal alles auf openstreetmap.de packen so als motivation ;D

Ich habe die Adressstatistik für vollständiges Tagging (inkl. country, city, postcode) aktualisiert. Das Städteranking ist kaum verändert. Nur Bochum hat seit der letzten Auswertung vom 2014-03-21 einen Satz nach oben gemacht (+5040 Adressen). Insgesamt haben wir in DE 3.943.609 dieser Adressen. Das sind 58.715 mehr als beim letzten Mal. Die Quote im Verhältnis zum sparsamen Tagging “Straße + Hausnummer” ist weiterhin bei 74%.

Mehr Daten im Wiki: https://wiki.openstreetmap.org/wiki/User:Gehrke#Adressen_mit_Angaben_f.C3.BCr_Stra.C3.9Fe.2C_Hausnummer.2C_Ort.2C_Land_und_PLZ

Nach längerer Zeit mal wieder eine Adresstatistik (Anzahl Adressen mit Hausnummer und Straße) für alle Gemeinden in DE: In den 43 Tagen seit der letzten Auswertung sind 367.158 Einträge hinzugekommen (> 8.500 pro Tag).
Im Städteranking hat sich Berlin mit vielen neuen Adressen deutlich vor Hamburg behauptet. Ein hoher Neueinsteiger in der Hitparade ist Essen mit insgesamt 52.929 Adressen.

49,0 % der Gemeinden haben weniger als 10 Adressen, 21,6 % sogar gar keine.

Übersicht im Wiki: https://wiki.openstreetmap.org/wiki/User:Gehrke#Adressen_mit_Angaben_f.C3.BCr_Stra.C3.9Fe_und_Hausnummer