Wikidata-Links

@mmd, I didn’t say remove them from the download dump :wink: One option could be to dynamically merge useful values from Wikidata. We could have the “pure OSM” and “augmented with extra sources” downloads. The population data is more likely to be up to date in Wikidata, because of constant monitoring by bots. I think OSM should use the “override” model, rather than “we are the only source, if we don’t have it, write your own software”. If OSM has a value, it overrides the Wikidata value.

I just compared some population numbers in OSM and Wikidata - seems like there are a lot of mismatches: http://tinyurl.com/ydg4evlc which might be an argument to use both systems. The number of people in London clearly should not be based on “personal observation”, but instead should have a verifiable source. But when we are talking about some tiny 5 person village, things may be different.

For example, according to Canadian Census, Mistissini village (node 107364956) has population of zero, but OSM has 3,285, without giving the source. 3,285 is a large number to count by hand, so clearly it came from some source, and can be easily added to Wikidata too.

I know this is a heated and debatable topic at the moment - these are just ideas, not “call to action”, so lets keep theorizing - maybe we can come up with a better solution. :slight_smile:

Naja - die ganze Diskussion hat zumindest das Ergebnis, dass jetzt allmählich die Masken fallen und klar wird, dass es letztendlich im Wesentlichen um eine Kolonialisierung von OpenStreetMap aus dem Wikipedia/Wikidata-Dunstkreis geht.

Ginge es tatsächlich generell um die Interkonnektivität zwischen OSM und anderen Datenbanken mit geographischen Informationen, dann wären die Schwerpunkte der Diskussion völlig anders. Dann könnte man das Ganze auf die Frage der dauerhaften Identifikation bestimmter Objekte in der OSM-Datenbank reduzieren, was man nicht nur vollkommen unabhängig von konkreten Anwendungfällen sicherstellen könnte, sondern es vor allem auch sollte. Die Befürworter einer engen Verknüpfung von Wikidata und OSM sollten sich klar manchen, dass wenn sie keine generische Lösung anstreben, sie hier langfristig der Idee offener Daten einen Bärendienst erweisen und sich de facto für eine Dominanz von Wikidata in der Welt der Geo-Datenbanken einsetzen.

Durch die Collective Database Guideline sind die Möglichkeiten, dass sich OSM auf rechtlicher Ebene über die Lizenz gegen eine solche Kolonialisierung wehrt, mittlerweise sehr begrenzt, denn der Datennutzer kann darüber ohne Lizenz-Probleme beliebige Attribute durch entsprechende Attribute aus anderen Datenbanken ersetzen (und bei Wikidata läuft das sowieso weitgehend ins Leere).

Der Weg, OSM als eigenständiges Projekt mit eigenen kulturellen Prinzipien zu erhalten wäre, von Seiten von OSM permanente Identifikationen für Objekte einzuführen und diese anderen Projekten (wie Wikidata) als Möglichkeit der Interkonnektivität anzubieten - gleichzeitig aber externe Identifikatioren wie die Wikidata-IDs, die zwangsläufig bestimmte Projekte und Ihre kulturellen Ideen gegenüber anderen bevorzugen, strikt abzulehnen. Für den Datennutzer, der einfach nur verschiedene Datenbanken verknüpfen möchte ohne tiefergehende politische Interessen, wäre das sogar besser als die Wikidata-IDs, da es auf andere Datenbanken genauso anwendbar wäre.

Ich weiss, dass die Idee permanenter Identifikationen für Objekte in OSM schon öfters diskutiert wurde und meist als schwer umsetzbar angesehen wird. Ich denke, dass dies jedoch oft an der mangelnden unmittelbaren praktischen Notwendigkeit lag. Die Einbindung von Wikidata-IDs in großem Umfang zeigt jedoch eigentlich, dass dies praktisch durchaus machbar ist. Eine in OSM frei vergebene ID wäre im Grunde für Mapper viel einfacher zu handhaben, als Wikidata-IDs, denn man braucht ja kein existierendes Wikidata-Objekt dafür (sprich: jede McDonalds-Filiale erhielte selbstverständlich ihre eigene ID).

Denkbare praktische Ansätze wären eine vom Editor vergebene UUID oder eine von der API erzeugte fortlaufende Nummer. Im letzteren Fall würde der Mapper im Editor ein leeres permanent_id-Tag erzeugen, was dann von der API gefüllt würde. In beiden Fällen würde der Mapper (mit Unterstützung des Editors) dafür verantwortlich sein, die ID zu übertragen, wenn das selbe Objekt in der realen Welt durch eine neue Geometrie in OSM repräsentiert wird (zum Beispiel, wenn vom Mapping als Node auf ein Mapping als Way/Area gewechselt wird). Das ist das selbe wie bei der Wikidata-ID und es gibt keinen Grund, weshalb das nicht auch funktionieren sollte, wenn die Community dahinter steht.

Man sollte nicht den Fehler machen, die langfristige politische Dimension des Ganzen zu unterschätzen. Wir werden in der Zukunft eine Menge verschiedener neuer Geodatenbanken und Geodatensätze sehen, vor allem aus den Bereichen Satellitenbild-Auswertung und “Big-Data”-Techniken. Es ist klar, dass der Aufgabe, solche Daten zu verknüpfen, eine enorme wirtschaftliche und politische Bedeutung zukommt. Wer da bei OSM seinen Fuß in die Tür bekommt, hat eine sehr gute Ausgangsbasis, generell den Markt zu dominieren. Und für viele Akteure ist hier die Dominanz von Wikidata aufgrund der Lizenz (was hier weniger das share-alike als die Quellen-Nennung betrifft) und der weniger einschränkenden Regeln (kein Überprüfbarkeits-Kriterium), gleichzeitig aber einer eindeutigeren Prägung durch “westliche” kulturelle Sichtweisen wesentlich reizvoller, als die Dominanz einer von OSM erzeugten Identifikation.

Ahem. Sounds a lot like a typical Conspiracy Theory and World Domination… Or it could be the Google translate…?

All I care about is Knowledge, available to everyone, free of charge, with a good community to maintain it. The knowledge that allows the world to benefit and move forward. OSM is a huge part of that knowledge - the knowledge about the planet we all live on. So is Wikidata. So is Wikipedia. So is the whole FLOSS ecosystem, that makes it possible to use that knowledge, and make great things from it.

Are you saying that OSM is a special thing that shouldn’t mix with the other “bad projects”? Are you saying that if I donate my time to one project, i can no longer donate my time to another project? Are you saying that OSM data should never mix with Wikipedia data by data consumers? Do we want to create fences just for the sake of having fences, because we are so insecure in our own project?

I think by now OSM has proven that it is stable, mature, and successful. Its growth is a clear indicator. Yes, there are many companies that benefit financially from it. Same applies to Wikipedia & Wikidata & FLOSS. That doesn’t mean we should make software closed source, just in case Facebook or Google might use it to make more money. Or should we?

Das stimmt so nicht. Prinzipiell ist es Ziel der Wikipedia, “Das Wissen der Welt” zu sammeln und neutral darzustellen und zwar in allen Sprachversionen (mal naiv angenommen das wäre ohne weiteres möglich). Wenn also z.B. ein Artikel in der deutschsprachigen Wikipedia nur den Zustand in Deutschland beschreibt ist das ein Mangel und wenn er so tut, als gäbe es nur diesen deutschen Zustand sogar ein Fehler, was in der Regel auch so angeprangert wird (Stichwort “deutschlandlastig”). Das sich die Sprachversionen divers entwickeln liegt in erster Linie daran. dass unterschiedliche Sprachen für viele Menschen nach wie vor große Hürden bei der Zusammenarbeit darstellen und sich daher zwangsweise eine gewisse geografische Korrelation einstellt. Das Sprache gleichbedeutend mit (nationaler) Kultur ist, ist aber alleine schon für die deutschsprachige Wikipedia (z.B. mit Österreich und der Schweiz) unzutreffend und erst recht für Sprachen wie Englisch, Spanisch und Französisch. Das da gewisse Sichtweisen der Mehrheitsmutterspreachler überrepräsentiert sind ist in der Praxis schwer vermeidbar aber ungewollt.

Bei Wikidata sehe ich in der Tat die Schwierigkeit darin, dass man vermeiden sollte, ungleiches gleich zu setzen oder zu versuchen Dinge in fremde Odnungsschemata zu pressen. Das Problem hat man aber auch schon, wenn man in der Wikipedia unterschiedliche Sprachversionen verlinkt. Mir fällt das z.B. bei Eisenbahnthemen oft auf, dass die Definition was ein Bahnhof ist je nach Blickwinkel (Reisender oder Infrastrukturbetreiber, deutsch oder Niederländisch) sehr unterschiedliche Dinge bezeichnet. Aber es sagt ja auch niemand dass alles was Bahnhof, station oder ähnlich heißt, das selbe Wikidata-Item sein muss. Hier sehe ich sogar die Chance mal Sprachübergreifend zu diskutieren was gleich ist und was nicht bzw. was das essentielle hinter einem Konzept wie z.B. “Bar” oder “Bahnhof” ist. Ich sehe hier gerade die Chance mal über den Tellerrand zu schauen und die eigene kulturzentrierte Sichtweise zu überwinden. In dem Punkt habe ich recht große Hoffungen in Wikidata gesetzt, da es die Benutzer zwingt, sich genzübergreifend zu koordinieren und auszutauschen. Ob das gelingt wird sich zeigen.

Sorry aber spätestens hier wird es lächerlich. Wenn wir jetzt anfangen, dem Gegenüber eine versteckte Agenda als Hauptmotiv für ihr Handeln zu unterstellen, ist das der Tod jeder sachlichen Diskussion und jedem offenen Austausch. Was die finanziellen Interessen angeht: Die Wikimedia Foundation verfügt insgesamt über ein Budget in der Größenordnung von dem von Greenpeace Deutschland. Davon geht nur ein sehr geringer Teil in die Entwicklung und betrieb von Wikidata. Vergleich das mal z.B. mit Google. Die würde ich eher als Konkurrenz beim Aufbau einer Datanbank sehen und die sind nicht frei und offen.

Also bitte mal den Alu-Hut absetzen.

Well said, thank you! It is a sad reality that instead of having 1 Wikipedia, we created 300, making it very hard to share content and collaborate across language barriers. In OSM we had 1 world from the start, and yet we manage to break it into pieces, and claim “this is my territory, don’t come here”. We should communicate about the difference in perception. The word “bread” has very different meaning in France, Germany, and USA, but we can discuss and document those differences. Think about it - we are able to have a conversation in two languages - I (sadly) don’t speak a word of German, yet we (mostly) understand each other, thanks to translation tools. I’m sure we can figure out cultural differences using projects like Wikidata.

Nein, der Tod jeder sachlichen Diskussion ist es, wenn eine Diskussions-Seite sich beharrlich weigert, auf die zentralen Fragen überhaupt einzugehen, und bei solchen Fragen immer das Thema wechselt oder versucht, den Gegenüber durch unsachliche Unterstellungen (die beliebtesten Ansätze sind in diesem Fall anscheinend Paranoia und reaktionäre Weltanschauungen) zu diskreditieren. Ich empfehle hierzu auch nicht nur hier im Forum die Diskussion zu lesen, sondern auch auf der talk-Mailingliste - dort lässt sich weitgehend das selbe Schema beobachten. Dass erst jetzt hier nebenbei die Idee geäußert wird, dass *X:wikidata=nicht nur ergänzend getaggt werden soll, sondern dass man ja dann auch gleich auf die redundante Information in der OSM-Datenbank verzichten könnte, unterstreicht dies nur - auf OSM-talk im Thread Fixing wiki → brand:wiki (der sich ansonsten eigentlich genau mit diesem Thema beschäftigt hat) wurde das so weit ich weiss nirgendwo erwähnt.

Ich habe hier nur meine sachliche Analyse der Situation eingebracht. Da kann man selbstverständlich anderer Meinung sein. Ich bin dann gerne bereit, meine Sichtweise durch weitere Argumente zu untermauern und auf Gegenargumente einzugehen, aber dafür muss man sich erstmal auf eine sachliche Diskussion zum Thema einlassen. Und solange die Diskussion auf der sachlichen Ebene ergebnisoffen und auf Grundlage von Argumenten erfolgt ist es mir auch vollkommen egal, was für eine Agenda bei der Gegenseite im Hintergrund existiert.

Während ich hier relativ grundsätzlich das Thema Wikidata in OSM analysiert habe, ist auf OSM-talk eine kompakte Liste von konkreteren praktischen Fragen zu finden, deren Klärung ich für das Thema für essentiell halte. Diese - wie auch eine Vielzahl von ähnlichen Fragen anderer sind, soweit ich das sehen kann, bis jetzt noch nicht von den Befürwortern einer Integration von Wikidata und OSM thematisiert worden. Mir vor diesem Hintergrund mangelnden Willen zur sachlichen Diskussion vorzuwerfen ist - ich drücke es mal vorsichtig aus - ein wenig schwer nachzuvollziehen.

Die Argumente sind ja auch nicht alle verkehrt. Aber wer einerseits “unsachliche Unterstellungen” kritisiert, sollte sich selber mit Begriffen wie “die Masken fallen [lassen]” und “Kolonialisierung” zurückhalten.

Was ich mit die Masken fallen lassen meine habe ich ja schon am Beispiel der Idee, Tags wie brand=* nicht nur durch brand:wikidata=* zu ergänzen, sondern letztendlich auch zu ersetzen, erläutert. Das ist ja klar erkennbar keine vollkommen neue Idee die jemandem ad hoc mal ebenso gekommen ist sondern basiert auf dem grundlegenden Verständnis von OpenStreetMap nicht als eigenständigem sozialem Projekt mit eigener Identität, sondern als Datenlieferant in einem Netzwerk verknüpfter und voneinander abhängiger offener Datenprojekte unter einer gemeinsamen Ägide, die letztendlich de facto von Wikidata ausgeht (im Beispiel definiert Wikidata zentral, was “brand” bedeutet).

Und das ist meiner Ansicht schon fast die Definition von Kolonialismus.

Ich unterstelle hier auch niemandem, dass er oder sie eine Kolonialisierung von OSM durch Wikipedia/Wikidata gezielt verfolgt. Aber ich denke, dass wenn die Entwicklung in die Richtung läuft, dass dann das langfristige Ergebnis eine Kolonialisierung ist.

Erst mal danke für die versachlichung der Diskussion.

Naja wenn an einer Tankstelle vorher brand=Shell dran steht, und nachher brand:wikidata=Q154950 dann ist das die selbe Aussage. Wikidata definiert dann vielleicht was “Shell” ist aber was “brand” ist definiert immer noch der, der das tag hinzufügt, genau so wie die ganze Aussage. Anders wäre es nur, wenn man die ganze Aussage brand:wikidata=Q154950 aus der Wikidata importieren würde aber dazu müsste die Tankstelle ja ein eigenes Wikidata-Item haben was nie geschehen wird. Wir sind uns wahrscheinlich auch alle weitgehend einig, dass Objekte die einen eigenes Wikidata Item haben maximal dieses Wikidata-Tag bekommen sollen und kein Wikidata:=. Ich persönlich finde auch nicht, dass die Wikidata tags bestehende Tags ersetzen sollen, außer vielleicht der Wikipedia-Tags.

Ich wehre mich etwas gegen den Begriff, weil er meines erachtens ein “Wir” gegen “Die” Verhältnis suggeriert. Letzendlich sind aber sowohl OSM als auch Wikidata freie, offene kollaborative Projekte ohne zentrale diktatorische Machtinstanz. Ich arbeite in beiden Projekten mit (wobei ich historisch aus der deutschsprachigen Wikipedia komme). Daher kann ich der OSM vs. Wikidata Perspektive wenig abgewinnen. Ich sehe beide als Mittel um Freies Wissen zu sammeln und zu verbreiten mit unterschiedlichem Schwerpunkt und unterschiedlichen Stärken und Schwächen und gerade in der Kombination viel Potential. Ich denke gerade mit dem strukturieten Datenmodell bietet Wikidata viele Vorteile bei Daten wo es hier immer wieder Diskussionen gibt ob die in OSM gehören wie Telefonnummern, Homepages usw. Ich selber will dabei niemanden davon abhalten solche Daten in OSM einzutragen, sehe aber auch das Problem, dass die da niemand konsistent und aktuell halten kann und will. Aber soll doch von mir aus beides parallel existieren, dann werden sich die Anwendungsentwickler schon das holen, was sie für brauchbarer halten.

Ok, dann versuche ich mal einen Anfang zu machen.

“How stable is the identity of what can be found under a certain
Wikidata ID…” Also zunächst mal werden Wikidata IDs nie umbenannt. sie werden höchstens “deaktiviert” wenn sich herausstellt, dass sie das selbe beschreiben. In dem Fall bleibt aber immer noch eine gültige Weiterleitung übrig. Es ist gerade nicht wie bei OSM-IDs oder Wikipedia-Artikel-Namen, dass einem jemand einen funktionierenden Link “unter dem Hintern wegziehen” kann. Es mag sein, dass sich die genaue Abgrenzung eines Wikidata-Items mit der Zeit noch leicht ausdifferenziert und sich daher auch im Extremfall IDs aufspalten können. IDs werden aber nie recycled im Sinne von “wieder neu vergeben” Das ist aber halt so bei sich entwickelnden Prozessen mit Community. Wikidata-IDs sind in jedem Fall sehr viel stabiler als alles was wir alternativ haben und zum Teil auch nutzen.

Beim Beantworten der Frage fällt mir auf, dass das Konzept deiner Fragen vielleicht so gar nicht funktioniert. Der Punkt ist ja, dass es bei Wikidata als Community-Projekt genau so wie bei OSM keine zentrale Machtinstanz gibt die sagen könnte “Es ist so und so und wird immer so sein”. Alles ist in Entwicklung und Teil eines Prozesses bei dem jeder eigene Absichten verfolgt. Meine Beantwortung kann daher auch nur meine Sicht auf die Dinge darstellen. Ich werde aber trotzdem versuchen auch andere der Fragen zu beantworten, aber soviel erstmal heute.

Ich fühle mich bei dieser Diskussion ein bisschen zwischen den Stühlen.

Einerseits finde ich die aktuellen Wikidata-Importe (und iD-Features) viel zu überstürzt. Man sollte der OSM-Community erst mal die Zeit lassen, sich darüber klar zu werden, was in welcher Form in OSM soll und was nicht – was überwiegend durch händisches Mapping, das Entstehen realer Anwendungen für Wikidata-Tags etc. geschieht.

Andererseits finde ich die hier vorgetragene Ablehnung etwas zu radikal, denn ich sehe auch viel Potential in der Nutzung von Wikidata an den Grenzen von “Geo”: OSM ist eben keine Datenbank für alles, sondern hat das relativ klar umrissene Tätigkeitsfeld Geodaten. Klar sollten wir in unserem Kernbereich eigenständig nutzbar bleiben, und ich finde es gut, dass wir darauf Acht geben. Aber wollten wir denn jemals z.B. eine Datenbank von Architekten sein? Inwiefern sind dann Tags wie architect:wikidata eine Gefahr für OSM? Diese Daten wären ja sowieso entweder überhaupt nicht oder nur in nicht sehr minimalistischer Form in OSM gewesen, so dass sich hier aus der Kooperation mit Wikidata durchaus ein Gewinn ergibt. Letztlich kann OSM allein ja auch nicht mit der geschlossenen Konkurrenz mithalten – Zusammenarbeit zwischen freien Projekten finde ich da sehr wichtig und wünschenswert.

Damit das nicht falsch verstanden wird: Die Diskussion als solche finde ich durchaus wichtig, um auszuloten, wo die Grenze zwischen “das wollen wir selber machen” und “da verlinken wir auf andere” verläuft. Aber die aufgeheizte Stimmung finde ich dabei eher hinderlich.

Nicht aus Perspektive des Mappers. Wenn irgendwo in Hintertupfingen ein Kneipenwirt in den Nachbarorten weitere Kneipen eröffnet und diese alle unter dem Namen seiner Frau als “Chez Elisabeth” bewirbt, dann ist das brand=Chez Elisabeth. Aber um da brand:wikidata zu taggen müsste der Mapper dann erstmal irgendwas in Wikidata eintragen - kein Ahnung, wie er das machen soll und ob dafür irgendwelche formellen Anforderungen bestehen.

Auch bezieht sich Q154950 auf das Unternehmen Royal Dutch Shell und nicht auf die Marke. Ist brand:wikidata=Q154950 überhaupt korrekt? Was ist, wenn Royal Dutch Shell auch eine Billigmarke ‘Shelly’ started und Discount-Tankstellen unter diesem Namen aufmacht? Ist das dann auch brand:wikidata=Q154950 auch wenn das brand=Shelly ist? Was wenn Shell die Verwendung der Marke an andere Unternehmen lizenziert? Ist das dann brand:wikidata=Q154950 auch wenn es nicht operator=Royal Dutch Shell ist? Und wie kann ich all das als Mapper herausbekommen?

Das hatte ich schon fast vermutet. Viele, die hier für eine starke Verpflechtung von OSM und Wikidata plädieren, scheinen primär in Wikipedia sozialisiert worden zu sein und legen den Schwerpunkt in der Argumentation sehr stark auf die Daten und wenig auf den Prozess und die sozialen Mechanismen, mit denen die Daten erfasst werden.

Ich glaube, dass das einen Großteil der Verständnis-Probleme ausmacht, denn viele der Argumente, die ich gegen eine starke Verzahnung sehe, haben mit den sozialen Prozessen in OpenStreetMap zu tun und deren Bedeutung für die Fähigkeit von OpenStreetMap, die globale Vielfalt neutral und unvoreingenommen abzubilden.

Was geschieht also, falls Lübeck in Wikidata (Q2843) wie in OSM in getrennte Konzepte von place=city und boundary=administrative umgewandelt wird? Hört dann Q2843 auf zu existieren? Oder wird Q2843 in eines von beiden umgewandelt?

Und wie wird so eine Entscheidung getroffen?

Im Fall von Bremen gibt es getrennte Wikidata-Objekte für die Gemeinde + Stadt (wie bei Lübeck, Q24879) und das Bundesland (Q1209) - ist irgendwo festgelegt, dass Grenzen mit admin_level=4 ein separates Objekt bekommen, solche mit admin_level=6 aber nicht?

Das verstehe ich, aber die Idee, Wikidata-IDs in OSM zu speichern sollte ja schon irgendeine Basis haben. Wie Frederik schon vielfach erläutert hat, geht das eigentlich gegen die Prinzipien von OSM (keine Überprüfbarkeit vor Ort). Das ist auch der Hintergrund meiner Frage danach, was Wikidata dafür qualifiziert, dass OSM die Wikidata-IDs gegenüber den IDs von anderen Open-Data-Projekten besonders unterstützt?

Das hätte ich so gemappt:


architect=Josep Vilaseca i Casanovas
architect:wikidata=Q517127
artist:wikidata=Q4493323
artist_name=Manuel Fuxà i Leal
artwork_subject=Josep Anselm Clavé i Camps
artwork_type=statue
historic=monument
name=Monument a Anselm Clavé
subject:wikidata=Q2335557
tourism=artwork
wikipedia=ca:Monument a Josep Anselm Clavé
wikidata=Q18004983

Ich finde das interessant daß es so möglich wird alle Künstwerke von Manuel Fuxà i Leal zu finden über artist:wikidata=Q4493323, auch wenn seine Name vielleicht irgendwo anders als Manuel Fuxà oder Manuel Fuxa oder Manuel Fuxà y Leal geschrieben wurde.

Mit den dedication:wikidata/patron_saint:wikidata ist das noch mehr so (schade daß die Tags schon auseinanderwachsen, nah gut)

Mit name:etymology:wikidata für Namen die auf eine Europäische Stadt in ein Land mit 3 Sprachen verweisen ist das noch wichtiger.

https://de.wikipedia.org/wiki/L%C3%B6wen#Einzelnachweise

Ich bin davon überzeugt wikidata Tags sind eine Verreicherung für OpenStreetMap, nicht was manche hier angeblich fürchten; eine Übernahme von OSM durch Wikimedia.

Polyglot

I believe there’s quite a number of challenges with such an approach. Obviously Mapbox is running such a merging process inhouse for their multilingual maps, though they don’t provide the raw merged data to the outside world anymore. Even this scenario might cause some issues for map users, as they have no idea, where and how to fix potential issues. (and asking Mapbox to fix issues seems a bit difficult these days (see link)).

Let’s take a look at the general process. Other data consumers don’t only rely on Planet dumps, but also apply minutely diffs to keep their distributed databases up to date (you’ve been through this already…). Mappers also use such distributed mirror databases to download parts of the OSM data, hopefully do some improvements to the data and then upload it again to OSM.

If we were to inject some data from wikidata (say the population, or an elevation tag, or maybe some tag which no longer is kept around in OSM) at some point in this process, it very quickly becomes quite messy: Once the replicated data hits such a database mirror, you have no idea where the data originates from anymore. On the other hand, people expect those tags (e,g, population / elevation) to be in OSM, so you won’t have much fun running a “pure OSM” version.

Bottom line: Keeping that clear cut distinction between “OSM only” and “augmented version” is something I consider not feasible in real life day to day usage of the data. And those are only the technical issues…

Population is an interesting topic. First of all, I noticed that your query somehow gives random results when multiple population tags at different points in time are available. Somehow this should be restricted to those valid at the current date. Apart from that it’s probably worthwhile looking into more details:

I noticed several cities in Australia, where population figure were copied to Wikidata from a more recent government source, while OSM still has data that is about 5 years older. However, on closer inspection it looks like the OSM value is still somewhere around 20000 inhabitants, while Wikidata had only 19. Unlikely that a population sees such a sharp decline in Western Australia in such a short timeframe.

For sure this requires further manual checking, and it’s even possible that the government figures are currently completely off due to some error in their process. Cross checking OSM vs. Wikidata could reveal such very strange discrepancies.

Other issues I noticed were caused by different definitions and interpretations of respective city boundaries (I know this sounds pretty weird). Again, a query to identify such cases adds a lot of value. Fixing issues requires further manual work. After all, both OSM and Wikidata might be wrong, and you cannot tell just by looking at the number itself.

@mmd, thanks, could you give me an example of a place with multiple population values that produces strange results? I used wdt:P1082 - the “t” in “wdt” stands for “truthy” - should (in theory) use the latest value, but I need to double check.

Minute data could also be generated with wikidata extra fields.

For augmented data, we could standardize on some magical key value, e.g. *wikidata:population=NNN, to indicate that it came from an external database.

Re Mapbox - I am much more hopeful towards the OpenMapTiles project, and will try to invest some time there :slight_smile:

Re general population - thanks for looking into it, yes, it should be a manual process, luckly we can run some analysis now and try to figure it out. Once we solve many other issues that we found, especially now that I think the OSM+Wikidata service hanging issue has been solved.

Thanks!

Hallo,

ich habe die Wikidata-Diskussion bislang eher von außen betrachtet und eher die Verstöße gegen die Richtlinie für mechanische Bearbeitungen bekämpft (kleinere mechanische Edits von nyuriks revertiert).

Das täte mich auch interessieren. Wenn Wikidata eines Tages Verwaltungseinheiten und Siedlungsknoten aufteilt, wird dann die ID gelöscht und zwei neue angelegt? Oder haben wir dann dasselbe Problem, das wir jetzt schon mit wikipedia=*-Tags haben, welche plötzlich auf etwas anderes zeigen können, weil Artikel umbenannt oder umgeschrieben (aufgeteilt) werden?

Das Problem der fehlenden Trennung zwischen zwei Objektklassen, für die bei OSM getrennte Objekte existieren, bei Wikidata aber nicht, gibt es nicht nur bei kreisfreien Städten, sondern auch bei Städten und Gemeinden, die bei Gemeindereformen durch Aufnahme neuer Ortsteile gewachsen sind, aber den Namen des Hauptorts tragen.

Ich denke, dass man das Ergänzen von Wikidata-Tags in OSM kritisch hinterfragen sollte, wenn das zu verlinkende Wikidata-Objekt anders definiert ist als das OSM-Objekt und nicht klar ist, was sich auf was bezieht. Bezieht sich die Einwohnerzahl am Place-Node auf den Hauptort oder die Gesamtgemeinde? Bezieht sich die Einwohnerzahl in Wikidata auf die Gesamtgemeinde oder den Hauptort? Wenn wir Wikidata-Tags ergänzen, laden wir Datennutzer dazu ein, OSM-Informationen durch Wikidata-Informationen in ihrer abgeleiteten Datenbank zu ersetzen, weil sie annehmen, dass beide Projekte dasselbe meinen.

Noch meine persönliche Meinung zum Thema :wikidata= bzw. wikidata:=:

Wenn irgendeine Firma/Organisation herkommt und vorschlägt, eine externe Referenz in OSM zu erfassen, fragen wir auch kritisch nach. Während Haltestellennummern der eindeutigen Identifikation dienen, dienen Wikidata-IDs der Verknüpfung mit externen Datenbanken. Wenn jemand vorschlagen würde, an POIs die Referenznummern einer proprietären Datenbank zu taggen, würde man ihm den Vorschlag um die Ohren schlagen. Diese Reaktion würde erfolgen, weil die Drittdatenbank unfrei ist. Folglicherweise ist die Lizenz der Drittdatenbank für die Entscheidung mit ausschlaggebend.

Die Wikimedia Foundation behauptet, Wikidata sei unter der CC-0, da sie selbst behauptet, dass Fakten frei seien. Das ist leider nicht in der EU hundertprozentig der Fall. Wie schon von anderen Leuten in diversen Wikidata-Diskussionen in den letzten Tagen und Wochen aufgezeigt, wimmelt es in Wikidata an Informationen aus nicht CC-0-Datenbanken. Durch das Ergänzen von Wikidata-Tags laden wir einerseits unsere eigenen Mitwirkenden zur Übernahme von Daten aus einem Projekt ein, das unseren eigenen rechtlichen Ansprüchen nicht genügt. Andererseits geben wir eine rechtlich nicht bedeutsame, aber symbolisch relevante Aussage über die rechtliche Nutzbarkeit der Drittdatenbank ab.

Links zu Wikimedia Commons sind ein Beispiel für Links zu einer freien Sammlung. Und ja, auch Links zu Mapillary sind frei, da die Bilder frei sind. In beiden Fällen garantiert die Freiheit der Werke jedoch nicht den unbegrenzten Zugriff, API-Nutzungsbedingungen limitieren ihn.

Ich war in den letzten drei Jahren ein Befürworter von operator:wikidata=* an allem aus dem Bereich des öffentlichen Verkehrs, weil es eine aufgeheizte Diskussion über die Schreibweise und Abkürzung von Namen in OSM vermeidet, an der ich leidenschaftlich beteiligt war/bin. Mittlerweile bin ich anderer Meinung. Je mehr Fremdschlüssel wir in OSM einführen, desto schwieriger sind unsere Daten für Gelegenheitsmapper zu bearbeiten. Ich würde es daher begrüßen, wenn das Wikidata-Projekt seine eigenen Geodaten pflegen würde und Datennutzer nach eigenen Kriterien [4] OSM-Objekte mit Wikidata-Objekten verknüpfen könnten. Da Wikidata gewisse Relevanzkriterien hat, erwarte ich nicht, dass dort jedes einzelne Gebäude, jeder einzelne Weg und jeder POI erfasst werden wird. Eine parallele Führung zweier Geodatenbanken erwarte ich nicht.

name:etymology:wikidata=* scheint ja ein Anwendungsfeld zu sein, das von einigen Wikidata-Anhängern vorangetrieben wird. Wenn die Namensherkunft jedoch ziemlich eindeutig ist (z.B. Kurt-Georg-Kiesinger-Straße), sollte das Ergänzen in OSM unterbleiben, da die Herleitung dann auch automatisch erfolgen kann. Bei mehrdeutigen Namen [1] kann ich mit der Erfassung der Namensherkunft an den OSM-Objekten leben, wenn die Namensherkunft vor Ort auch so angegeben ist [2]. Wenn der Namen mehrdeutig ist und die Herkunft vor Ort nicht angegeben ist, ist die Herkunft nicht eindeutig belegt [3] und die Voraussetzungen für eine Erfassung in OSM sind nicht gegeben.

Die Frage, ob Architekten/Künstler/Bauherrn als Wikidata-ID erfasst werden sollten, beantworte ich mit Nein. Das Führen mehrere externer Schlüssel ein und derselben Drittdatenbank an einem OSM-Objekt sollte unterbleiben. Stattdessen sollte in der Drittdatenbank für das Objekt ein Objekt angelegt werden und maximal eine externe Referenz in OSM geführt werden.

Viele Grüße

Michael

[1] Der Entwurf dieses Beitrags wollte “Helmut-Kohl-Straße” als Beispiel verwenden, aber für den Namen gibt es zwei Wikipedia-Artikel – einen Bundeskanzler und einen Schiedsrichter.
[2] z.B. als kleines Schildchen unter dem Straßenschild, das Geburts- und Sterbedaten der Person sowie ihre Rolle in der Gesellschaft nennt (“1930–2017, Ministerpräsident von Rheinland-Pfalz und Bundeskanzler”)
[3] Belege sind bei OSM ortsfest und vor Ort überprüfbar.
[4] oder sie kaufen den gematchten Datensatz einfach bei einem Dienstleister, der für sie denkt und entscheidet

Sure: http://tinyurl.com/y92mvstm

https://www.wikidata.org/wiki/Q223177 → Population “40” refers to the value which was valid in 1880. OSM has 52089, which is quite close to 55316 (of 2010) in Wikidata.

osmnode:151700975 edit wd:Q223177 52089 40

Edit: in fact we get all the values for each valid from date (see http://tinyurl.com/y8wngrod)), but we don’t know which one is which.

  • Q2843 will never be deleted - that’s against the whole idea of Wikidata. It could be converted into a redirect to another ID.
  • Q2843 represents all of the Wikipedia, Wikivoyage, and Wikisource pages about the city, not a more specific city or admin, so as long as we want to link to the Wikipedia pages, we should use it for wikidata. Or we can set wikipedia=Q2843 and set wikidata=Qxxx to the more specific value? Changing the meaning of the wikipedia tag is kinda bad, but at least we will be explicit that its a link to Wikipedia, not Wikidata. Just an idea.
  • Q2843 could have multiple P31 (instance of) values. So this object could be both a city AND an administrative boundary.
  • In theory, we could create two more specific Wikidata values, one for each sub-concept, and have some links from Q2843 to them. I’m sure the Wikidata community has been actively discussing such issues. Organizing and classifying information is always a process, so these corner cases will keep changing how Wikidata represents the data about the world. We should help with our local knowledge.

Hallo,

In einer anderen Diskussion hast du als Argument für die Ergänzung von wikipedia=-Tags um ihr “äquivalentes” wikidata=-Tags, dass damit das Problem der Weiterleitungen behoben sei. Damit holen wir uns doch bloß neue Probleme in’s Haus?

Der Verweis von OSM zur Wikipedia hat nicht das Ziel, weitere maschinenlesbare Datenquellen zu erschließen. Die Wikipedia-Autoren sind sicherlich im Stande, in ihren Werken den Leser erkennen zu lassen, was sich worauf bezieht, wenn ein W*-Objekt mehreren OSM-Objekten entspricht.

Wenn Wikidata noch so jung und dynamisch ist, wäre es IMHO eine gute Idee, noch ein bis zwei Jahre zu warten und währenddessen nicht automatisiert, halbautomatisch oder organisiert Wikidata-Verweise in OSM zu erfassen, oder?

Viele Grüße

Michael