Alle deutschen Straßen inkl. PLZ extrahieren

Hallo zusammen,

ich versuch gerade alle deutschen Straßen plus Postleitzahlen zu extrahieren. Ich habe dazu folgende Schritte ausgeführt

1.) Deutschland heruntergeladen (http://download.geofabrik.de/europe/germany-latest.osm.pbf)
2.) Umgewandelt in o5m: osmconvert germany-latest.osm.pbf -o=germany.o5m
3.) Filter auf Straßen angewendet: osmfilter.exe gemany.o5m --keep=“addr:city= and addr:postcode= and addr:street=” -o=germ-street.o5m
4.) CSV erstellt: osmconvert.exe germ-street.o5m --csv=“addr:postcode addr:city addr:street” --csv-headline --csv-separator=; -o=streets-germ.csv
5.) CSV mit einem eigenen Programm gecleaned um unique Einträge zu erhalten

Ich erhalte damit 801.399 Einträge. Aus anderen Quellen hab ich die Info, dass Deutschland ca. 1,1 Mio. Straßen hat und ich hab auch einige Tests mit kleineren Seitenstraßen gemacht (an denen Häuser stehen), welche nicht in meiner Liste auftauchen.

Weiß jemand, wie ich den Straßen-Filter verbessern kann, um eine möglichst volle Abdeckung zu erhalten?

du musst nach dem tag filtern der die Straßen beschreibt, bisher ist es Zufall ob bei Deinem Query überhaupt Straßen dabei sind

Also was du machst ist das du ja gar keine Straßen holst sondern Adressen bzw Objekte die Addresstags tragen.

Jetzt ist es leider so das

a) OSM noch nicht so geil vollständig ist was Adressen angeht. Speziell in Bundesländern die eher restriktiv mit Daten umgehen
b) Es in einigen Regionen total unüblich ist vollständige Adressen zu tagge. Da gibt es alle kombinationen von nur Hausnummer, Hausnummer und Straße, manchmal mit Stadt und/oder PLZ und entsprechende Kombinationen.

Meist wird leider mit “Datensparsamkeit” argumentiert. Problematisch ist das man eben auch nicht gegen evtl vorhandene Polygone Validieren kann.

Adressen bleiben viel Arbeit bei OSM.

Flo

Wie müsste ich die Query denn anpassen, um effektiver die Adressen (Straßen mit Hausnummern und PLZ) zu selektieren? Habt ihr da vielleicht Vorschläge?