Population

Ist Wikidata denn so gut? Darauf müssten wir uns ja verlassen, wenn wir komplette Abdeckung wollen. Sämtliche statistischen Ämter aller Staaten und Provinzen abzufragen dürfte nicht so leicht sein.

Mangels Einblick in die Updateprozesse kann ich dazu nichs sagen. Bei den üblichen Renderern stelle ichs mir schwierig vor, gerade wenn sie aktuell sein wollen. Die genauso gut gehende Alternative hätte ich gerne gesehen…

Im Zweifel können die das besser als OSM. Wie gut die das machen ist vermutlich so wie die Frage, wie gut OSM ist. Daten vorhalten ist deren einziger (?) Existenzzweck. Gut genug um die Infoboxen bei Wikipedia zu füllen, scheinen sie ja zu sein.

Eben, warum sollten wir uns das dann nochmal antun?

Weil wir den Auswertern eine für sich allein auch schon auswertbare Datenbank liefern wollen. Vieles in unserer Datenbank wäre mit einem Link auf Wikidata hinreichend und vielleicht besser beschrieben, Koordinaten müssten wir halt noch pflegen.

Ob man nun Wikidata oder die amtlichen Quellen nutzt (die wahrscheinlich auch von Wikidata genutzt werden), sei jedem selbst überlassen. Auf jeden Fall hat man bei diesen Quellen eine gewisse Sicherheit auf Vollständigkeit. Bei Wikidata gibt es diese Sicherheit natürlich auch nicht, ist aber wahrscheinlicher als bei OSM.

Wer eine garantierte Abdeckung haben möchte, muss auf die amtlichen Quellen zurückgreifen.

Edit:

Eine Lösung kann doch sein, dass man bei den administrative boundaries den Wikidata-Link (z.B. Berlin) taggt. Dann kann man sich damit den [population]-Wert und auch andere ziehen.
Wenn das einmal gemacht wurde, muss das auch nicht mehr gepflegt werden, da sich darum ja Wikidata kümmert. Wäre dann also eine einmalige Aktion.

Jo, den wikidata=-Eintrag finde ich gut. Und wir sollten ein paar Dinge selbst in der Datenbank haben. name= z.B. ist vermutlich unstrittig und ich finde population=* gehört auch dazu. Zur Frage, ob man nicht name:??=* daraus holen kann, gabs schonmal ne Diskusion, glaube ich.

Und genau deswegen wurde das ja auch gemacht :slight_smile: und der Wikidata-Link ergänzt
https://www.openstreetmap.org/relation/62422

In OSM steht population = 3440441, bei Wikidata 3,611,222.

Netterweise steht bei Wikidata die Quelle und auch der Zeitpunkt (30.11.2017), auf das sich der Wert bezieht, dran https://www.statistik-berlin-brandenburg.de/

Der Wert aus OSM lässt sich in einer XLS Datei bei www.destatis.de wiederfinden und bezieht sich auf das erste Quartal 2010.

Wenn wir nichtmal bei der Bundeshauptstadt die Bevölkerung halbwegs aktuell halten können, sehe ich für den Rest der Welt schwarz

+1

Beim Chaosradio gibt es eine hörenswerte Folge über Wikidata https://chaosradio.ccc.de/cr240.html. Google hat seine Faktendatenbank Freebase zugunsten Wikidata geschlossen und nutzt jetzt Wikidata. Wer mehr dazu wissen möchte, voila https://ai.google/research/pubs/pub44818
Mal schauen wann wir das über Google Maps sagen können :slight_smile:

Beim Durchschauen des Wikidata-Items für Berlin ist mir aufgefallen, dass Wikidata auch eine “Rückreferenz” zu OSM hat: OSM relation ID (P402). Ich denke mal, dass die das dann für die Infobox-Karte in Wikipedia nutzen können.
Wenn man also die Wikidata-ID bei der boundary relation hinzufügt, kann man auch gleich bei Wikidata die entsprechende OSM-Relation-ID für P402 setzen.

Edit: Das sollte natürlich auch für Naturschutzgebiete etc. möglich sein.

Ich hab jetzt mal bei wikidata für meine Heimatstadt Traunreut geschaut. Dort stammt der letzte Eintrag bei population von 1987. Bei den anderen drei Städten im Landkreis Traunstein sowie beim Landkreis selbst ist es nicht anders.

Zensus 2011: Traunreut sagt 19,941 für den 09.05.2011. Kannst du ja dann bei Wikidata eintragen/aktualisieren.

Das weiß ich, und wie bereits geschrieben gibt es die Fortschreibung jedes Jahr. Ich wollte aber zeigen, dass der Datenbestand bei Wikidata nicht besser als bei OSM ist.

Für Traunreut gibt noch nicht einmal einen population-Eintrag. Würde jetzt nicht sagen, dass das besser ist. :wink:

Wikidata/Wikipedia hat das gleiche Prinzip wie OSM. Wenn sich jemand aus der Community drum kümmert, bleibt es aktuell - wenn nicht, dann nicht. Aber ich gehe stark davon aus, dass Einwohnerzahlen bei Wikidata erheblich besser gepflegt werden als bei OSM.

Das population-Tag ist essentiell. Und zwar um den ganzen Nasen, die immer wieder isolated_dwelling oder hamlet in village umwandeln, den Wind aus den Segeln zu nehmen. :roll_eyes:

Da die Daten im Prinzip immer aus Fremdquellen stammen und durch Mappe praktisch nicht zu erfassen sind wäre die einzige Lösung ein automatischer Import von amtlichen Daten sobald diese Veröffentlicht werden mit zeitgleichem Sperren des Tags für manuelle Bearbeitung.
Ich glaube aber nicht, das so etwas jemals passieren wird.

Einfacher und intressanter wäre wenn die Auswerter auf Fremdquellen zugreifen könnten, was durch Gegenseitiges taggen mit Wikidata / Wikipedia möglich werden könnte.

Und dafür ist es auch unerheblich, ob da population=9 oder population=11 eingetragen ist. Für OSM bzw. die Nutzer der OSM-Daten (Renderer, Router,…) würde es auch ausreichen, wenn dort population=10 als Ergebnis einer Schätzung durch einen lokalen Mapper eingetragen wäre. Genauso wie bei Berlin “etwa 3.5 Miillionen” ausreicht. OSM ist kein Ersatz für den großen Brockhaus.

Oh weia,

mir scheint, hier sollte noch mal erklärt werden, was Überprüfbarkeit (Verifiability) in OSM bedeutet. Das bedeutet nicht, dass Zahlenwerte bei der Überprüfung auf die fünfte Nachkommastelle exakt übereinstimmen müssen. Wenn also einer die Einwohnerzahl mit 3.4 Millionen, ein anderer mit 3.6 Millionen bestimmt ist das völlig OK.

Es geht beim Tagging von population nicht um exakte Zahlenwerte, es geht um die Größenordnung. Ob ein Ort eher 1000 oder 10000 Einwohner hat lässt sich durchaus recht klar für den Mapper bestimmen. Wem das schwer fällt, der kann sich ein paar Links zu Luft/Satellitenbildern von Orten mit bekannter Einwohnerzahl zusammenstellen und dann einen unbekannten Ort damit vergleichen und einordnen. Und das Ergebnis könnte gelegentlich sogar deutlich genauer sein als was man in Wikipedia findet.

population ist auf jeden Fall besser verifizierbar als die Klassifikation city/town/village/hamlet - einem Tausend-Einwohner-Kaff im Norden Kanadas den city-Status anzudichten fällt viel leichter, als da mal ein paar hunderttausend Einwohner herbeizufabulieren.

Ich glaube Du bringst da einiges durcheinander.

  1. Ging es bei der Diskussion um die Frage, ob die Angabe der Bevölkerung bei OSM oder besser bei einem Dritten, bspw Wikidata aufgehoben ist.
  2. Hat niemand im Thread von einer Genauigkeit von 5 Nachkommastellen gesprochen. Warum die Polemik?
  3. Es ging bei dem Berlin Beispiel von mir darum, dass wir in unserer Hauptstadt einen 7 Jahre alten Wert drin haben. Das mag für Berlin unproblematisch sein, aber in anderen, weniger OSM aktiven Gegenden wachsen Städte in 7 Jahren erheblich. Das ist eine Frage der Wartbarkeit, nicht der mathematischen Genauigkeit.
  4. Egal was Du vorhast, wenn Du die Bevölkerung benötigst, bist Du besser dran, diese über Wikidata zu ermitteln. 33% der Städte in OSM haben einen population Tag, 44% eine Wikidata-ID. Und die Bevölkerung wird schon wesentlich länger erfasst als Wikidata-IDs

Ich bin auch ein starker Befürworter davon, die Daten zur Einwohnerzahl in OSM zu erfassen. Die OSM-Datenbank sollte für sich alleine schon nutzbar sein und nicht noch die Verknüpfung mit anderen Datenquellen erfordern. Wir sollten uns nicht zu sehr von Wikidata abhängig machen. Außerdem ist es für die Auswertung deutlich einfacher, wenn die Daten direkt in OSM enthalten sind.

Das Argument, die Einwohnerzahlen nicht in OSM zu erfassen, weil sie kaum aktuell gehalten werden können, kann ich so nicht nachvollziehen. Das ist kein Problem, was es speziell bei den Einwohnerzahlen gibt, das betrifft im Grunde alle Daten in OSM, manche mehr, manche weniger. Öffnungszeiten oder Telefonnummern von POIs können ebenso schnell veralten, werden aber auch erfasst. Das Hauptproblem bei solchen Daten ist derzeit, dass falsche/veraltete Daten kaum auffallen, im Gegensatz zu Objekten, die auf der Karte gerendert werden und wo Fehler sofort ins Auge springen. Hier mangelt es meiner Meinung einfach an Qualitätssicherungstools, die die Mapper auf potentiell veraltete Daten hinweisen. Speziell für die Einwohnerzahlen daher mal ein Vorschlag:

Zur Qualitätssicherung der Daten würde ich das Tag population:check_date=* vorschlagen. Dort trägt man den Stichtag ein, auf den sich die Einwohnerzahl bezieht. Mit dieser Information kann man Auswertungen bauen und gezielt die Angaben auf dem neuesten Stand halten (“gib mit alle Städte, bei denen die Einwohnerzahl mehr als zwei Jahre alt ist”).

EDIT: Ich sehe gerade, dass population:date=* schon etabliert ist: https://taginfo.openstreetmap.org//search?q=population

In diesem Zusammenhang wüsste ich aber gerne noch einmal, welche Quellen für die Erfassung dieser Daten in OSM erlaubt sind. Vermutlich wurden die meisten population-Werte in OSM aus Wikipedia oder Wikidata übernommen, doch das ist ja wegen der Lizenzen eigentlich nicht erlaubt. Da die Angaben dort auch nicht unbedingt aktuell sein müssen oder Fehler enthalten können, würde ich ohnehin . Dürfte ich die Daten aber einfach von Behördenseiten übernehmen, zum Beispiel https://www.neuss.de/wirtschaft/statistiken/bezirke/bezirkstabelle?

P.S.: Vielleicht was für eine Wochenaktion? Fehlende Einwohnerzahlen in Deutschland vervollständigen und gleich ein population:date=* ergänzen, wo es fehlt?

Darum ging es mir hier aber überhaupt nicht und die Frage ist hier in einem OSM-Forum auch etwas fehl am Platze - das müssen die Wikipedianer diskutieren (wegen ‘original research’ und so).

Mir ging es um die Frage, ob Ermittlungen/Schätzungen von Bevölkerungszahlen, insbesondere solche aus Primärdaten (Beobachtungen vor Ort, Luft- und Satellitenbilder) in OSM als überprüfbare Informationen dokumentiert werden können.

Bei Dingen, die in OSM nicht verifizierbar erfasst werden können, auf Wikidata als Alternative zu verweisen, ist völlig in Ordnung (so geschehen kürzlich zum Beispiel beim Thema Übersetzungen von Namen). Jedoch auch in den Fällen, wo eine überprüfbare Erfassung in OSM möglich ist, auf Wikidata zu verweisen, ist nicht angemessen denn es läuft darauf hinaus, OSM als eigenständiges Projekt mit eigenen Werten und Regeln zu untergraben.

Und was die rechtliche Problematik der Übernahme von Zahlenwerten angeht - da ist man, wenn man keine exakten Zahlenwerte übernimmt, im Grunde auf der sicheren Seite. Und der exakte Wert einer Erhebung ist sowieso ziemlich belanglos weil die Ungenauigkeit der Ermittlung in jedem Fall erheblich ist. Also wenn man für Berlin population=3500000 erfasst (zwei statt sieben signifikante Stellen), weil verschiedenen Quellen alle Werte in diesem Bereich nennen, ist das rechtlich einwandfrei und auch besser, als einfach den nächstbesten vermeintlich präzisen Wert abzuschreiben, den man finden kann.