Population: OSM vs Wikidata in Baden-Württemberg

Aufgrund der doch recht theoretischen Diskussion wollte ich mal schauen, wie es in den Daten aussieht. Für das Rendern des place= ist es in der Tat in BW vorteilhafter, wenn man die in OSM vorhandenen Daten nutzt (76% Abdeckung vs 44% mit Wikidata). Wobei hier noch die Frage im Raum steht, ob die am place Node hinterlegte Einwohnerzahl die der Stadt oder einer eventuell größeren administrativen Einheit ist. Die Vermutung wird dadurch unterstützt, dass bei den Relationen wesentlich mehr Daten von Wikidata verfügbar sind.

Doppelt gezählte Relationen, da sowohl boundary = administrative als auch place = *
57968, 57969, 57970, 57971, 57972, 57975, 58625, 409705, 1231975, 1631737, 1691239, 1691254, 1691279, 1691293, 2750469, 3412852

Komplette Liste: https://www.codegeo.de/wd/

Wie man verlinkten Tabelle sieht, steht es um meine html Kenntnisse nicht zum besten.

Technisch werden Relationen mit boundary=* und Nodes mit place=*, die gleichzeitig eine Wikidata ID hinterlegt haben innerhalb einer bounding box von der Overpass API abgefragt. Falls boundary=administrative oder place = city, village oder town ist, werden die bei Wikidata hinterlegten deutschen Labels und falls vorhanden Bevölkerung (Property:P1082) abgeglichen und mit OSM Daten verglichen.

Für ein komplettes Bild müsste man bei der Overpass API noch schauen, wieviele Nodes mit place = city, village oder town und Relationen mit boundary=administrative es gibt, die keine Wikidata ID hinterlegt haben. Die benutzte BBox ist bbox = ‘47.5338000528,7.5113934084,49.7913749328,10.4918239143’

vielleicht sollte man eher in größenklassen die tags in osm versehen als die wirkliche bevölkerungszahl jährlich korrigieren zu müssen

Diesmal auch mit Objekten ohne wikidata= tag.
Mich hat es gewurmt, dass ich das übersehen hatte und deshalb habe ich alles nochmal gemacht. Jetzt sieht man, dass zwar weltweit mehr Daten über Wikidata bezogen werden können (lt. Taginfo), aber in BaWü das Gegenteil gilt. :confused:

Liste: https://www.codegeo.de/wd/index1.html

OSM IDs der doppelt gezählten Objekte (boundary und place Tag zugleich) 57968, 57969, 57970, 57971, 57972, 57975, 58625, 409705, 1231975, 1631639, 1631641, 1631737, 1631738, 1631786, 1631787, 1691239, 1691254, 1691279, 1691293, 2750469, 2890615, 2890641, 2890642, 2890729, 2890730, 2890760, 2890761, 2890795, 3412852, 8420274

Genau so wäre es ja auch im Wiki für den Population-Tag vorgesehen

und auch im angenommen Proposal von 2006 steht

gut das wir nicht für den Renderer mappen :wink:

so meinte ich es nicht, sondern komplett vom tag bevölkerungsgröße weg und eher eine “größenklasse”: tag blabla=1 (1 = 1000 einwohner)

ich kann zu den wikidata bevölkerungszahlen auch noch sagen, das dort noch nicht so viele drin sind weil wikipedia, zumindest die deutsche version, die zahlen fü die infoboxen nicht aus wikidata zieht, und deswegen wenig leute die zahlen in wikidata einpflegen. vielleicht könnte man von osm seite mal druck machen. haben doch schon einige großeprojekte hinter uns (plz grenzen; wikidata an jede grenz-relation)

zu empfehlen https://www.youtube.com/watch?v=bUpJN4IklJ8