Adressstatistik

Nahmd,

Oops, ich ging fälschlicherweise davon aus, dass der Ausdruck implizit mit “^” und “$” geankert ist. Denn ohne Ankerung ist das “." am Ende im "081150.” überflüssig.

Gruß Wolf

Bedeutet “.*” nicht mindestens 1 beliebiges Zeichen?

Nahmd,

. = beliebiges Zeichen außer Zeilentrenner

  • = Ausdruck davor zwischen 0 mal und beliebig oft.

Gruß Wolf

Wieso ist die Straße “Ant kruse Bömken” sage und schreibe 8 mal in der Liste drin? :sunglasses:

Link: http://regio-osm.de/hausnummerauswertung/auswertung_anzeigen?job_ids=2534&ausgabefarbig=true&linktyp=osmkartevoll&unterdrueckfertigestrassen=nein&unterdrueckspalten=nein&land=Bundesrepublik+Deutschland&stadt=S%C3%BCdlohn

Nahmd,

Meine Kristallkugel sagt: weil der Straßennamen-Sortierer die Groß/kleinschreibung ignoriert, der Darstellungszusammenfasser aber nicht.

Gruß Wolf

War auch meine 1. Vermutung, ich sehe allerdings nur 2 Schreibweisen. :wink:

Nahmd,

Groß/kleinschreibung ignoriert (ignoriert = sortiertechnisch identisch, ergo zufällige Sortierung oder bei stabilem Sortierverfahren die Reihenfolge, in der die Schnipsel reingekommen sind.

klein
klein
groß
groß
groß
klein
groß
groß
klein
klein
klein

Wenn ich da aufeinanderfolgende gleiche zusammensortiere, kommt genau das Ergebnis auf der Seite raus.

Ich hab vor kurzen zur Vorberitung einer Suchfunktion die OSM-Wegeschnipsel je Straßenname und Gemeinde zusammenfassen wollen (man will ja nicht die einzelnen OSM-Ways im Suchergebnis haben), und hab depperterweise zuerst zusammengefasst (die nach Quad sortierten Schnipsel) und erst danach nach Straßenname und Gemeinde sortiert. Gibt auch ein überraschendes Ergebnis: unglaublich, wieviele Hauptstraßen es in einer einzelnen Gemeinde geben kann. :sunglasses:

Gruß Wolf

Hallo chris66,

die nachfolgenden Poster haben recht, das ist eine falsche Sortierung und ich beachte die Groß-/Kleinschreibweise.

Die verlinkte Version ist von OSM. Wie wird denn die Straße korrekt geschrieben?

Wenn es die offizielle Schreibweise ist, dann in OSM an den Hausnummerobjekten addr:street korrigieren.
Ansonsten hier angeben oder mir eine Mail schreiben, dann muß ich die offizielle Variante in der DB direkt korrigieren.

viele Grüße

Dietmar

Also in den NRW-ATLAS wms-Layern ist es Groß geschrieben (Ant Kruse Bömken).

Monatsupdate Dezember und Jahresendabrechnung zu meiner Adressstatistik:

Kurzfassung: Es gab am 31.12.2014 7.668.547 Adressen (Definition siehe Wiki). Das sind +228.989 im Vergleich zum Vormonat (ca. 7.387 pro Tag). Seit meiner ersten Messung am 26.06.2014 sind beachtliche 1.570.323 Adressen hinzugekommen (ca. 8350 pro Tag).

1.992 Gemeinden und gem.fr. Gebiete verbleiben ohne eine einzige Adresse (-66 zum Vormonat).

Auch noch das Update für Adressen ohne Straßenangabe als CSV-Datei (Latin1).

Gleich importiert.

http://thefive.sabic.uberspace.de/osmcount/table.html?lok=2&period=month&measure=AddrWOStreet&sortdown=Diff

Die Overpass Abfrage, die ich am 26.12 (Tagesansicht) habe loslaufen lassen, erzeugt aber noch andere Zahlen, die Zählung sollte ich vielleicht einfach rauswerfen.

Christoph

Wenn Ihr Bedarf an einem Update der Google Calc Tabellen habt so sagt bitte kurz Bescheid.

Christoph
Edit: Ganze Sätze sollten ausserhalb von Twitter nicht aus der Mode kommen.

Wie könnte man das erklären? Meine Zahlen haben als Zeitstempel ca. 21:00 Uhr.

Vermute einfach, das die Abfrage: (JavaScript Source, ##### ist ein Platzhalter).

AddrWOStreet: '[out:json][timeout:900];area[type=boundary]["de:regionalschluessel"="######"]->.boundaryarea; \
rel(area.boundaryarea)[type=associatedStreet]->.associatedStreet; \
 \
way(area.boundaryarea)["addr:housenumber"]["addr:street"!~"."]["addr:place"!~"."]->.allHousesWay; \
way(r.associatedStreet:"house")->.asHouseWay; \
(.allHousesWay; - .asHouseWay); out ids; \
 \
node(area.boundaryarea)["addr:housenumber"]["addr:street"!~"."]["addr:place"!~"."]->.allHousesNode; \
node(r.associatedStreet:"house")->.asHouseNode; \
(.allHousesNode; - .asHouseNode);out ids; \
 \
rel(area.boundaryarea)["addr:housenumber"]["addr:street"!~"."]["addr:place"!~"."]->.allHousesRel; \
rel(r.associatedStreet:"house")->.asHouseRel; \
(.allHousesRel; - .asHouseRel);out ids;'

Nicht richtig ist, alternativ besteht die Gefahr, das ich “Datenverluste” zu beklagen habe (fehlenden Transaktionen in MongoDB). Aber ich habe versucht, in typischen Fehlersituationen die Daten korrekt wieder herzustellen, was mir bei meinen Checks auch gelungen ist.

Christoph

Edit: Vielleicht ist auch mein Regionalschlüsselansatz falsch, und ich muss auf den Gemeindeschlüssel wechseln.

Die Auswertung ist einfach anders, Details stehen auch auf der Wiki-Seite. Weiterhin fehlt ein Bezugszeitpunkt: wenn da mehrere Tausend Queries über ein paar Stunden hinweg laufen, hat jede Query ihren eigenen Zeitstempel. Da müsste man wohl noch am Anfang ein [date:“2015-01-01T00:00:00Z”] oder sowas einbauen, damit alle Queries mit gleichen Zeitstempel arbeiten.

Danke, der Hinweis mit dem Zeitstempel ist ganz praktisch. Ich habe auch noch vor, die gezählten Objekte eventuell, die Zeitstempel der Abfragen in jedem Fall anzeigbar zu machen.

Ich glaube aber der grössere Unterschied ist im wiki erklärt.

Ich sollte die Daten einfach nicht mischen, und das Projekt an der möglichen neuen Wochenaufgabe “reifen” lassen.

Christoph

Nee, das sollte egal sein, solange Du nicht nach Verwaltungsgemeinschaften aggregieren möchtest.

Moins,

zum Vergleich (und zur weiteren Verwirrung):

http://geo.netzwolf.info/csv/housenumbers_wo_street_de_8_stat.csv.bz2

Definiert so: alle OSM-Objekte (Nodes, Ways und Relationen) zum Zeitpunkt 00:00 mit Hausnummer, aber ohne Straße, Place und auch nicht Mitglied einer accociatedStreet-Relation innerhalb der DE-BBox, sodann für alle Admin-Areas die Objekte innerhalb der Area gezählt.

Gruß Wolf

Edit: URL

Stand gestern gibt es in OSM für DE 8.139.861 Adressen. Die 8-Mio-Schwelle wurde Mitte februar überschritten.

Ich hatte und habe leider keine Zeit mehr, hier für Updates in regelmäßigem Abstand zu sorgen. Könnte im April/Mai wieder besser werden.

Kurze Query: 7338972 PLZ in DE, Stand heute Nacht. Da ist also auch noch was zu tun.

Gruss
walter