Wie ist Deine Äquivalenzklasse definiert? Hausnummer, Straße, Gemeinde/50m-Umkreis geographisch?
Komplette Übereinstimmung aller “addr:*”-Werte würde die Anzahl ja auch überschätzen.
Das ist gar nicht so einfach/schnell, wenn man es genau machen will.
Ich habe als Kriterium für die Äquivalenzklasse mal (street, housenumber, PLZ-Gebiet - als Relation und nicht ‘addr:postcode’) definiert.
Damit komme ich (Stand gestern) auf 166.847 Klassen/Adressen, für die es Duplikate gibt.
374.146 OSM-Elemente sind danach betroffen. Ergo hätte ich hiernach 207.299 Adressen zu viel.
Das wäre bei der Annahme das die Adressen alle “nur” doppelt vorkommen.
Ich habe keine Ahnung welche Datenbank du benutzt, aber wäre es nicht denkbar erst GROUP BY und danach COUNT in einer aufbauenden Abfrage anzuwenden?
Naja, ich bin erst seit Mitte 2014 dabei. Schwerpunktmäßig mappe ich im Kasseler Süden Hausnummern und hätte schon gerne eine Zahl, die mir sagt, wie fleißig ich war
Keiner was Aktuelles?
http://hdyc.neis-one.org/
Was etwas blöd ist. Wenn Du Straße und Hausnummer mappst und danach ergänzt jemand add:city oder änder sonst was, wird Dein Beitrag nicht mehr gezählt.
In Deutschland verfügt OSM jetzt über 9.123.219 Adressen (Definition und Details siehe bei mir im Wiki).
Das sind 182.497 mehr als im Juli (5.887 zusätzlich pro Tag). Ca. 209.000 Adressen sind als Duplikate von der Gesamtanzahl abzuziehen.
73,9 % der Adressen sind als ways definiert. Vor einem Jahr waren es noch 70,2 %.
In Deutschland verfügt OSM jetzt über 9.273.077 Adressen (Definition und Details siehe bei mir im Wiki).
Das sind 149.858 mehr als im Vormonat (4.995 zusätzlich pro Tag). Erstmals mitgezählt wurden auch die paar Adressen an Relationen (nur 5.290). 215.719 Adressen sind als Duplikate von der Gesamtanzahl abzuziehen.
74,1 % der Adressen sind als ways definiert. Vor einem Jahr waren es noch 70,2 %.
Das Wording ist dort noch schlecht. Gemeint ist eine Adresse, die ich als solche in meiner Auswertung auch zähle (mind. Straße + Hausnummer) - im Gegensatz zu Adressen ohne Angabe von Straße bzw. place.
Mich überrascht es, dass der am schlechtesten gemappte Kreis nicht etwa irgendwo im Osten ist, sondern der Saarpfalz-Kreis im Saarland mit nur 8 Adressen pro 1000 Einwohner. Dicht gefolgt vom Landkreis Freyung-Grafenau mit 9 Adressen und dem Landkreis Altenkirchen mit 10 Adressen .