Wikidata-Links

Sorry aber spätestens hier wird es lächerlich. Wenn wir jetzt anfangen, dem Gegenüber eine versteckte Agenda als Hauptmotiv für ihr Handeln zu unterstellen, ist das der Tod jeder sachlichen Diskussion und jedem offenen Austausch. Was die finanziellen Interessen angeht: Die Wikimedia Foundation verfügt insgesamt über ein Budget in der Größenordnung von dem von Greenpeace Deutschland. Davon geht nur ein sehr geringer Teil in die Entwicklung und betrieb von Wikidata. Vergleich das mal z.B. mit Google. Die würde ich eher als Konkurrenz beim Aufbau einer Datanbank sehen und die sind nicht frei und offen.

Also bitte mal den Alu-Hut absetzen.

Well said, thank you! It is a sad reality that instead of having 1 Wikipedia, we created 300, making it very hard to share content and collaborate across language barriers. In OSM we had 1 world from the start, and yet we manage to break it into pieces, and claim “this is my territory, don’t come here”. We should communicate about the difference in perception. The word “bread” has very different meaning in France, Germany, and USA, but we can discuss and document those differences. Think about it - we are able to have a conversation in two languages - I (sadly) don’t speak a word of German, yet we (mostly) understand each other, thanks to translation tools. I’m sure we can figure out cultural differences using projects like Wikidata.

Nein, der Tod jeder sachlichen Diskussion ist es, wenn eine Diskussions-Seite sich beharrlich weigert, auf die zentralen Fragen überhaupt einzugehen, und bei solchen Fragen immer das Thema wechselt oder versucht, den Gegenüber durch unsachliche Unterstellungen (die beliebtesten Ansätze sind in diesem Fall anscheinend Paranoia und reaktionäre Weltanschauungen) zu diskreditieren. Ich empfehle hierzu auch nicht nur hier im Forum die Diskussion zu lesen, sondern auch auf der talk-Mailingliste - dort lässt sich weitgehend das selbe Schema beobachten. Dass erst jetzt hier nebenbei die Idee geäußert wird, dass *X:wikidata=nicht nur ergänzend getaggt werden soll, sondern dass man ja dann auch gleich auf die redundante Information in der OSM-Datenbank verzichten könnte, unterstreicht dies nur - auf OSM-talk im Thread Fixing wiki → brand:wiki (der sich ansonsten eigentlich genau mit diesem Thema beschäftigt hat) wurde das so weit ich weiss nirgendwo erwähnt.

Ich habe hier nur meine sachliche Analyse der Situation eingebracht. Da kann man selbstverständlich anderer Meinung sein. Ich bin dann gerne bereit, meine Sichtweise durch weitere Argumente zu untermauern und auf Gegenargumente einzugehen, aber dafür muss man sich erstmal auf eine sachliche Diskussion zum Thema einlassen. Und solange die Diskussion auf der sachlichen Ebene ergebnisoffen und auf Grundlage von Argumenten erfolgt ist es mir auch vollkommen egal, was für eine Agenda bei der Gegenseite im Hintergrund existiert.

Während ich hier relativ grundsätzlich das Thema Wikidata in OSM analysiert habe, ist auf OSM-talk eine kompakte Liste von konkreteren praktischen Fragen zu finden, deren Klärung ich für das Thema für essentiell halte. Diese - wie auch eine Vielzahl von ähnlichen Fragen anderer sind, soweit ich das sehen kann, bis jetzt noch nicht von den Befürwortern einer Integration von Wikidata und OSM thematisiert worden. Mir vor diesem Hintergrund mangelnden Willen zur sachlichen Diskussion vorzuwerfen ist - ich drücke es mal vorsichtig aus - ein wenig schwer nachzuvollziehen.

Die Argumente sind ja auch nicht alle verkehrt. Aber wer einerseits “unsachliche Unterstellungen” kritisiert, sollte sich selber mit Begriffen wie “die Masken fallen [lassen]” und “Kolonialisierung” zurückhalten.

Was ich mit die Masken fallen lassen meine habe ich ja schon am Beispiel der Idee, Tags wie brand=* nicht nur durch brand:wikidata=* zu ergänzen, sondern letztendlich auch zu ersetzen, erläutert. Das ist ja klar erkennbar keine vollkommen neue Idee die jemandem ad hoc mal ebenso gekommen ist sondern basiert auf dem grundlegenden Verständnis von OpenStreetMap nicht als eigenständigem sozialem Projekt mit eigener Identität, sondern als Datenlieferant in einem Netzwerk verknüpfter und voneinander abhängiger offener Datenprojekte unter einer gemeinsamen Ägide, die letztendlich de facto von Wikidata ausgeht (im Beispiel definiert Wikidata zentral, was “brand” bedeutet).

Und das ist meiner Ansicht schon fast die Definition von Kolonialismus.

Ich unterstelle hier auch niemandem, dass er oder sie eine Kolonialisierung von OSM durch Wikipedia/Wikidata gezielt verfolgt. Aber ich denke, dass wenn die Entwicklung in die Richtung läuft, dass dann das langfristige Ergebnis eine Kolonialisierung ist.

Erst mal danke für die versachlichung der Diskussion.

Naja wenn an einer Tankstelle vorher brand=Shell dran steht, und nachher brand:wikidata=Q154950 dann ist das die selbe Aussage. Wikidata definiert dann vielleicht was “Shell” ist aber was “brand” ist definiert immer noch der, der das tag hinzufügt, genau so wie die ganze Aussage. Anders wäre es nur, wenn man die ganze Aussage brand:wikidata=Q154950 aus der Wikidata importieren würde aber dazu müsste die Tankstelle ja ein eigenes Wikidata-Item haben was nie geschehen wird. Wir sind uns wahrscheinlich auch alle weitgehend einig, dass Objekte die einen eigenes Wikidata Item haben maximal dieses Wikidata-Tag bekommen sollen und kein Wikidata:=. Ich persönlich finde auch nicht, dass die Wikidata tags bestehende Tags ersetzen sollen, außer vielleicht der Wikipedia-Tags.

Ich wehre mich etwas gegen den Begriff, weil er meines erachtens ein “Wir” gegen “Die” Verhältnis suggeriert. Letzendlich sind aber sowohl OSM als auch Wikidata freie, offene kollaborative Projekte ohne zentrale diktatorische Machtinstanz. Ich arbeite in beiden Projekten mit (wobei ich historisch aus der deutschsprachigen Wikipedia komme). Daher kann ich der OSM vs. Wikidata Perspektive wenig abgewinnen. Ich sehe beide als Mittel um Freies Wissen zu sammeln und zu verbreiten mit unterschiedlichem Schwerpunkt und unterschiedlichen Stärken und Schwächen und gerade in der Kombination viel Potential. Ich denke gerade mit dem strukturieten Datenmodell bietet Wikidata viele Vorteile bei Daten wo es hier immer wieder Diskussionen gibt ob die in OSM gehören wie Telefonnummern, Homepages usw. Ich selber will dabei niemanden davon abhalten solche Daten in OSM einzutragen, sehe aber auch das Problem, dass die da niemand konsistent und aktuell halten kann und will. Aber soll doch von mir aus beides parallel existieren, dann werden sich die Anwendungsentwickler schon das holen, was sie für brauchbarer halten.

Ok, dann versuche ich mal einen Anfang zu machen.

“How stable is the identity of what can be found under a certain
Wikidata ID…” Also zunächst mal werden Wikidata IDs nie umbenannt. sie werden höchstens “deaktiviert” wenn sich herausstellt, dass sie das selbe beschreiben. In dem Fall bleibt aber immer noch eine gültige Weiterleitung übrig. Es ist gerade nicht wie bei OSM-IDs oder Wikipedia-Artikel-Namen, dass einem jemand einen funktionierenden Link “unter dem Hintern wegziehen” kann. Es mag sein, dass sich die genaue Abgrenzung eines Wikidata-Items mit der Zeit noch leicht ausdifferenziert und sich daher auch im Extremfall IDs aufspalten können. IDs werden aber nie recycled im Sinne von “wieder neu vergeben” Das ist aber halt so bei sich entwickelnden Prozessen mit Community. Wikidata-IDs sind in jedem Fall sehr viel stabiler als alles was wir alternativ haben und zum Teil auch nutzen.

Beim Beantworten der Frage fällt mir auf, dass das Konzept deiner Fragen vielleicht so gar nicht funktioniert. Der Punkt ist ja, dass es bei Wikidata als Community-Projekt genau so wie bei OSM keine zentrale Machtinstanz gibt die sagen könnte “Es ist so und so und wird immer so sein”. Alles ist in Entwicklung und Teil eines Prozesses bei dem jeder eigene Absichten verfolgt. Meine Beantwortung kann daher auch nur meine Sicht auf die Dinge darstellen. Ich werde aber trotzdem versuchen auch andere der Fragen zu beantworten, aber soviel erstmal heute.

Ich fühle mich bei dieser Diskussion ein bisschen zwischen den Stühlen.

Einerseits finde ich die aktuellen Wikidata-Importe (und iD-Features) viel zu überstürzt. Man sollte der OSM-Community erst mal die Zeit lassen, sich darüber klar zu werden, was in welcher Form in OSM soll und was nicht – was überwiegend durch händisches Mapping, das Entstehen realer Anwendungen für Wikidata-Tags etc. geschieht.

Andererseits finde ich die hier vorgetragene Ablehnung etwas zu radikal, denn ich sehe auch viel Potential in der Nutzung von Wikidata an den Grenzen von “Geo”: OSM ist eben keine Datenbank für alles, sondern hat das relativ klar umrissene Tätigkeitsfeld Geodaten. Klar sollten wir in unserem Kernbereich eigenständig nutzbar bleiben, und ich finde es gut, dass wir darauf Acht geben. Aber wollten wir denn jemals z.B. eine Datenbank von Architekten sein? Inwiefern sind dann Tags wie architect:wikidata eine Gefahr für OSM? Diese Daten wären ja sowieso entweder überhaupt nicht oder nur in nicht sehr minimalistischer Form in OSM gewesen, so dass sich hier aus der Kooperation mit Wikidata durchaus ein Gewinn ergibt. Letztlich kann OSM allein ja auch nicht mit der geschlossenen Konkurrenz mithalten – Zusammenarbeit zwischen freien Projekten finde ich da sehr wichtig und wünschenswert.

Damit das nicht falsch verstanden wird: Die Diskussion als solche finde ich durchaus wichtig, um auszuloten, wo die Grenze zwischen “das wollen wir selber machen” und “da verlinken wir auf andere” verläuft. Aber die aufgeheizte Stimmung finde ich dabei eher hinderlich.

Nicht aus Perspektive des Mappers. Wenn irgendwo in Hintertupfingen ein Kneipenwirt in den Nachbarorten weitere Kneipen eröffnet und diese alle unter dem Namen seiner Frau als “Chez Elisabeth” bewirbt, dann ist das brand=Chez Elisabeth. Aber um da brand:wikidata zu taggen müsste der Mapper dann erstmal irgendwas in Wikidata eintragen - kein Ahnung, wie er das machen soll und ob dafür irgendwelche formellen Anforderungen bestehen.

Auch bezieht sich Q154950 auf das Unternehmen Royal Dutch Shell und nicht auf die Marke. Ist brand:wikidata=Q154950 überhaupt korrekt? Was ist, wenn Royal Dutch Shell auch eine Billigmarke ‘Shelly’ started und Discount-Tankstellen unter diesem Namen aufmacht? Ist das dann auch brand:wikidata=Q154950 auch wenn das brand=Shelly ist? Was wenn Shell die Verwendung der Marke an andere Unternehmen lizenziert? Ist das dann brand:wikidata=Q154950 auch wenn es nicht operator=Royal Dutch Shell ist? Und wie kann ich all das als Mapper herausbekommen?

Das hatte ich schon fast vermutet. Viele, die hier für eine starke Verpflechtung von OSM und Wikidata plädieren, scheinen primär in Wikipedia sozialisiert worden zu sein und legen den Schwerpunkt in der Argumentation sehr stark auf die Daten und wenig auf den Prozess und die sozialen Mechanismen, mit denen die Daten erfasst werden.

Ich glaube, dass das einen Großteil der Verständnis-Probleme ausmacht, denn viele der Argumente, die ich gegen eine starke Verzahnung sehe, haben mit den sozialen Prozessen in OpenStreetMap zu tun und deren Bedeutung für die Fähigkeit von OpenStreetMap, die globale Vielfalt neutral und unvoreingenommen abzubilden.

Was geschieht also, falls Lübeck in Wikidata (Q2843) wie in OSM in getrennte Konzepte von place=city und boundary=administrative umgewandelt wird? Hört dann Q2843 auf zu existieren? Oder wird Q2843 in eines von beiden umgewandelt?

Und wie wird so eine Entscheidung getroffen?

Im Fall von Bremen gibt es getrennte Wikidata-Objekte für die Gemeinde + Stadt (wie bei Lübeck, Q24879) und das Bundesland (Q1209) - ist irgendwo festgelegt, dass Grenzen mit admin_level=4 ein separates Objekt bekommen, solche mit admin_level=6 aber nicht?

Das verstehe ich, aber die Idee, Wikidata-IDs in OSM zu speichern sollte ja schon irgendeine Basis haben. Wie Frederik schon vielfach erläutert hat, geht das eigentlich gegen die Prinzipien von OSM (keine Überprüfbarkeit vor Ort). Das ist auch der Hintergrund meiner Frage danach, was Wikidata dafür qualifiziert, dass OSM die Wikidata-IDs gegenüber den IDs von anderen Open-Data-Projekten besonders unterstützt?

Das hätte ich so gemappt:


architect=Josep Vilaseca i Casanovas
architect:wikidata=Q517127
artist:wikidata=Q4493323
artist_name=Manuel Fuxà i Leal
artwork_subject=Josep Anselm Clavé i Camps
artwork_type=statue
historic=monument
name=Monument a Anselm Clavé
subject:wikidata=Q2335557
tourism=artwork
wikipedia=ca:Monument a Josep Anselm Clavé
wikidata=Q18004983

Ich finde das interessant daß es so möglich wird alle Künstwerke von Manuel Fuxà i Leal zu finden über artist:wikidata=Q4493323, auch wenn seine Name vielleicht irgendwo anders als Manuel Fuxà oder Manuel Fuxa oder Manuel Fuxà y Leal geschrieben wurde.

Mit den dedication:wikidata/patron_saint:wikidata ist das noch mehr so (schade daß die Tags schon auseinanderwachsen, nah gut)

Mit name:etymology:wikidata für Namen die auf eine Europäische Stadt in ein Land mit 3 Sprachen verweisen ist das noch wichtiger.

https://de.wikipedia.org/wiki/L%C3%B6wen#Einzelnachweise

Ich bin davon überzeugt wikidata Tags sind eine Verreicherung für OpenStreetMap, nicht was manche hier angeblich fürchten; eine Übernahme von OSM durch Wikimedia.

Polyglot

I believe there’s quite a number of challenges with such an approach. Obviously Mapbox is running such a merging process inhouse for their multilingual maps, though they don’t provide the raw merged data to the outside world anymore. Even this scenario might cause some issues for map users, as they have no idea, where and how to fix potential issues. (and asking Mapbox to fix issues seems a bit difficult these days (see link)).

Let’s take a look at the general process. Other data consumers don’t only rely on Planet dumps, but also apply minutely diffs to keep their distributed databases up to date (you’ve been through this already…). Mappers also use such distributed mirror databases to download parts of the OSM data, hopefully do some improvements to the data and then upload it again to OSM.

If we were to inject some data from wikidata (say the population, or an elevation tag, or maybe some tag which no longer is kept around in OSM) at some point in this process, it very quickly becomes quite messy: Once the replicated data hits such a database mirror, you have no idea where the data originates from anymore. On the other hand, people expect those tags (e,g, population / elevation) to be in OSM, so you won’t have much fun running a “pure OSM” version.

Bottom line: Keeping that clear cut distinction between “OSM only” and “augmented version” is something I consider not feasible in real life day to day usage of the data. And those are only the technical issues…

Population is an interesting topic. First of all, I noticed that your query somehow gives random results when multiple population tags at different points in time are available. Somehow this should be restricted to those valid at the current date. Apart from that it’s probably worthwhile looking into more details:

I noticed several cities in Australia, where population figure were copied to Wikidata from a more recent government source, while OSM still has data that is about 5 years older. However, on closer inspection it looks like the OSM value is still somewhere around 20000 inhabitants, while Wikidata had only 19. Unlikely that a population sees such a sharp decline in Western Australia in such a short timeframe.

For sure this requires further manual checking, and it’s even possible that the government figures are currently completely off due to some error in their process. Cross checking OSM vs. Wikidata could reveal such very strange discrepancies.

Other issues I noticed were caused by different definitions and interpretations of respective city boundaries (I know this sounds pretty weird). Again, a query to identify such cases adds a lot of value. Fixing issues requires further manual work. After all, both OSM and Wikidata might be wrong, and you cannot tell just by looking at the number itself.

@mmd, thanks, could you give me an example of a place with multiple population values that produces strange results? I used wdt:P1082 - the “t” in “wdt” stands for “truthy” - should (in theory) use the latest value, but I need to double check.

Minute data could also be generated with wikidata extra fields.

For augmented data, we could standardize on some magical key value, e.g. *wikidata:population=NNN, to indicate that it came from an external database.

Re Mapbox - I am much more hopeful towards the OpenMapTiles project, and will try to invest some time there :slight_smile:

Re general population - thanks for looking into it, yes, it should be a manual process, luckly we can run some analysis now and try to figure it out. Once we solve many other issues that we found, especially now that I think the OSM+Wikidata service hanging issue has been solved.

Thanks!

Hallo,

ich habe die Wikidata-Diskussion bislang eher von außen betrachtet und eher die Verstöße gegen die Richtlinie für mechanische Bearbeitungen bekämpft (kleinere mechanische Edits von nyuriks revertiert).

Das täte mich auch interessieren. Wenn Wikidata eines Tages Verwaltungseinheiten und Siedlungsknoten aufteilt, wird dann die ID gelöscht und zwei neue angelegt? Oder haben wir dann dasselbe Problem, das wir jetzt schon mit wikipedia=*-Tags haben, welche plötzlich auf etwas anderes zeigen können, weil Artikel umbenannt oder umgeschrieben (aufgeteilt) werden?

Das Problem der fehlenden Trennung zwischen zwei Objektklassen, für die bei OSM getrennte Objekte existieren, bei Wikidata aber nicht, gibt es nicht nur bei kreisfreien Städten, sondern auch bei Städten und Gemeinden, die bei Gemeindereformen durch Aufnahme neuer Ortsteile gewachsen sind, aber den Namen des Hauptorts tragen.

Ich denke, dass man das Ergänzen von Wikidata-Tags in OSM kritisch hinterfragen sollte, wenn das zu verlinkende Wikidata-Objekt anders definiert ist als das OSM-Objekt und nicht klar ist, was sich auf was bezieht. Bezieht sich die Einwohnerzahl am Place-Node auf den Hauptort oder die Gesamtgemeinde? Bezieht sich die Einwohnerzahl in Wikidata auf die Gesamtgemeinde oder den Hauptort? Wenn wir Wikidata-Tags ergänzen, laden wir Datennutzer dazu ein, OSM-Informationen durch Wikidata-Informationen in ihrer abgeleiteten Datenbank zu ersetzen, weil sie annehmen, dass beide Projekte dasselbe meinen.

Noch meine persönliche Meinung zum Thema :wikidata= bzw. wikidata:=:

Wenn irgendeine Firma/Organisation herkommt und vorschlägt, eine externe Referenz in OSM zu erfassen, fragen wir auch kritisch nach. Während Haltestellennummern der eindeutigen Identifikation dienen, dienen Wikidata-IDs der Verknüpfung mit externen Datenbanken. Wenn jemand vorschlagen würde, an POIs die Referenznummern einer proprietären Datenbank zu taggen, würde man ihm den Vorschlag um die Ohren schlagen. Diese Reaktion würde erfolgen, weil die Drittdatenbank unfrei ist. Folglicherweise ist die Lizenz der Drittdatenbank für die Entscheidung mit ausschlaggebend.

Die Wikimedia Foundation behauptet, Wikidata sei unter der CC-0, da sie selbst behauptet, dass Fakten frei seien. Das ist leider nicht in der EU hundertprozentig der Fall. Wie schon von anderen Leuten in diversen Wikidata-Diskussionen in den letzten Tagen und Wochen aufgezeigt, wimmelt es in Wikidata an Informationen aus nicht CC-0-Datenbanken. Durch das Ergänzen von Wikidata-Tags laden wir einerseits unsere eigenen Mitwirkenden zur Übernahme von Daten aus einem Projekt ein, das unseren eigenen rechtlichen Ansprüchen nicht genügt. Andererseits geben wir eine rechtlich nicht bedeutsame, aber symbolisch relevante Aussage über die rechtliche Nutzbarkeit der Drittdatenbank ab.

Links zu Wikimedia Commons sind ein Beispiel für Links zu einer freien Sammlung. Und ja, auch Links zu Mapillary sind frei, da die Bilder frei sind. In beiden Fällen garantiert die Freiheit der Werke jedoch nicht den unbegrenzten Zugriff, API-Nutzungsbedingungen limitieren ihn.

Ich war in den letzten drei Jahren ein Befürworter von operator:wikidata=* an allem aus dem Bereich des öffentlichen Verkehrs, weil es eine aufgeheizte Diskussion über die Schreibweise und Abkürzung von Namen in OSM vermeidet, an der ich leidenschaftlich beteiligt war/bin. Mittlerweile bin ich anderer Meinung. Je mehr Fremdschlüssel wir in OSM einführen, desto schwieriger sind unsere Daten für Gelegenheitsmapper zu bearbeiten. Ich würde es daher begrüßen, wenn das Wikidata-Projekt seine eigenen Geodaten pflegen würde und Datennutzer nach eigenen Kriterien [4] OSM-Objekte mit Wikidata-Objekten verknüpfen könnten. Da Wikidata gewisse Relevanzkriterien hat, erwarte ich nicht, dass dort jedes einzelne Gebäude, jeder einzelne Weg und jeder POI erfasst werden wird. Eine parallele Führung zweier Geodatenbanken erwarte ich nicht.

name:etymology:wikidata=* scheint ja ein Anwendungsfeld zu sein, das von einigen Wikidata-Anhängern vorangetrieben wird. Wenn die Namensherkunft jedoch ziemlich eindeutig ist (z.B. Kurt-Georg-Kiesinger-Straße), sollte das Ergänzen in OSM unterbleiben, da die Herleitung dann auch automatisch erfolgen kann. Bei mehrdeutigen Namen [1] kann ich mit der Erfassung der Namensherkunft an den OSM-Objekten leben, wenn die Namensherkunft vor Ort auch so angegeben ist [2]. Wenn der Namen mehrdeutig ist und die Herkunft vor Ort nicht angegeben ist, ist die Herkunft nicht eindeutig belegt [3] und die Voraussetzungen für eine Erfassung in OSM sind nicht gegeben.

Die Frage, ob Architekten/Künstler/Bauherrn als Wikidata-ID erfasst werden sollten, beantworte ich mit Nein. Das Führen mehrere externer Schlüssel ein und derselben Drittdatenbank an einem OSM-Objekt sollte unterbleiben. Stattdessen sollte in der Drittdatenbank für das Objekt ein Objekt angelegt werden und maximal eine externe Referenz in OSM geführt werden.

Viele Grüße

Michael

[1] Der Entwurf dieses Beitrags wollte “Helmut-Kohl-Straße” als Beispiel verwenden, aber für den Namen gibt es zwei Wikipedia-Artikel – einen Bundeskanzler und einen Schiedsrichter.
[2] z.B. als kleines Schildchen unter dem Straßenschild, das Geburts- und Sterbedaten der Person sowie ihre Rolle in der Gesellschaft nennt (“1930–2017, Ministerpräsident von Rheinland-Pfalz und Bundeskanzler”)
[3] Belege sind bei OSM ortsfest und vor Ort überprüfbar.
[4] oder sie kaufen den gematchten Datensatz einfach bei einem Dienstleister, der für sie denkt und entscheidet

Sure: http://tinyurl.com/y92mvstm

https://www.wikidata.org/wiki/Q223177 → Population “40” refers to the value which was valid in 1880. OSM has 52089, which is quite close to 55316 (of 2010) in Wikidata.

osmnode:151700975 edit wd:Q223177 52089 40

Edit: in fact we get all the values for each valid from date (see http://tinyurl.com/y8wngrod)), but we don’t know which one is which.

  • Q2843 will never be deleted - that’s against the whole idea of Wikidata. It could be converted into a redirect to another ID.
  • Q2843 represents all of the Wikipedia, Wikivoyage, and Wikisource pages about the city, not a more specific city or admin, so as long as we want to link to the Wikipedia pages, we should use it for wikidata. Or we can set wikipedia=Q2843 and set wikidata=Qxxx to the more specific value? Changing the meaning of the wikipedia tag is kinda bad, but at least we will be explicit that its a link to Wikipedia, not Wikidata. Just an idea.
  • Q2843 could have multiple P31 (instance of) values. So this object could be both a city AND an administrative boundary.
  • In theory, we could create two more specific Wikidata values, one for each sub-concept, and have some links from Q2843 to them. I’m sure the Wikidata community has been actively discussing such issues. Organizing and classifying information is always a process, so these corner cases will keep changing how Wikidata represents the data about the world. We should help with our local knowledge.

Hallo,

In einer anderen Diskussion hast du als Argument für die Ergänzung von wikipedia=-Tags um ihr “äquivalentes” wikidata=-Tags, dass damit das Problem der Weiterleitungen behoben sei. Damit holen wir uns doch bloß neue Probleme in’s Haus?

Der Verweis von OSM zur Wikipedia hat nicht das Ziel, weitere maschinenlesbare Datenquellen zu erschließen. Die Wikipedia-Autoren sind sicherlich im Stande, in ihren Werken den Leser erkennen zu lassen, was sich worauf bezieht, wenn ein W*-Objekt mehreren OSM-Objekten entspricht.

Wenn Wikidata noch so jung und dynamisch ist, wäre es IMHO eine gute Idee, noch ein bis zwei Jahre zu warten und währenddessen nicht automatisiert, halbautomatisch oder organisiert Wikidata-Verweise in OSM zu erfassen, oder?

Viele Grüße

Michael

@mmd, apparently this was a problem with Q223177 – one value should have been set to “prefered” rank. See this diff.

update: I filed a bot task at Wikidata to fix the “preferred” status. Apparently there are over 10,000 items that haven’t been set.

Prinzipiell kann jeder angemeldete Benutzer bei Wikidata mit einem klick ein neues Item erstellen, dem er in diesem Fall den deutschsprachigen Namen “Chez Elisabeth” und die deutsche Beschreibung “lokale Kneipen-Kette” hinzufügen kann. Damit wäre nur erst mal wenig gewonnen. Ohne entsprechende Statements ist das Item wenig wert und ob es so bestehen bleiben wird, wag ich zu bezweifeln.

Was die Kriterien für ein Item angeht, so gibt es auf Wikidata verschiedene Projekte zu einzelnen Themengebieten, die jeweils Regeln ausarbeiten was ein Item aus dem Bereich (hier wohl Organisation) für Statements haben kann und sollte. In dem fall z.B. “ist eine Gemeinschaft mit beschränkter Haftung” siehe auch https://www.wikidata.org/wiki/Wikidata:WikiProject_Companies/de. Letztendlich sollte Statements aber auch belegt werden können, was in diesem Fall wohl schwierig würde womit wir zum dritten Aspekt der Relevanz kommen.

Relevanz wird in Wikidata nicht so streng wie in der Wikipedia aber es gibt auch Kriterien. In diesem Fall https://www.wikidata.org/wiki/Wikidata:Notability/de
Spätestens hier würde es mit “Chez Elisabeth” wohl scheitern, da die “Minikette” weder für sich genommen relevant ist, noch einen Eintrag in einem Wikimedia-Projekt hat noch für eine geschlossene Systematik benötig wind.

Meines Erachtens kann es nicht Sinn der Sache sein, nur für einen OSM-Verweis ein neues Wikidata Item anzulegen wenn der gegenstand selber keine Relevanz besitzt. Ich glaube aber auch nicht dass das jemand momentan so handhaben möchte.

Vermutlich nicht. Das Beispiel war in 5 Sekunden selber zusammengesucht und offenbar schlecht gewählt.

Ich denke es würde dann ein neues Item geben. Was aber “brand” oder “operator” konzeptionell ist, ist erst mal Sache von OSM. Wikidata kennt diese Tags nicht.Hier könnte man höchstens ein Mapping definieren, aber wozu ist das nötig?

Das stimmt nicht. Gerade diese Diskussionen gibt es auch in der deutschsprachigen Wikipedia und sogar zum teil deutlich heftiger als hier. Gerade so Fragen wie “Ist es ok, Daten automatisch aus Wikidata zu übernehmen”, “Sollen dafür lokale Daten entfernt werden” beschäftigen die Leute da auch sehr. Gerade für Alt-Wikipedianer ist Wikidata neu und fremd. Da gibt es auch einen große Gruppe von Leuten die dem sehr skeptisch bis ablehnend gegenüber stehen, wobei gerade die deutschsprachige Wikipedia da sehr konservativ ist im Gegensatz z.B. zu der englischsprachigen.

Ich glaube da hatte nyuriks schon einiges gesagt hier nur noch das: Was ein Item bekommt und wo diese aufgespaltet werden müssen, entscheiden wohl Prinzipiell die zuständigen Projekte anhand der erarbeiteten Regeln. Im Komkreten Fall macht dann jemand dass, was er für richtig hält und jemand andere sagt dann vieleicht “Ist so nicht ok ich mache das rückgängig” oder auch nicht. Ähnlich wie in OSM oder der Wikipedia

Ich plädiere dafür, da Wikidata so etwas wie eine Meta-Datenbank ist die andere Datenbanken verknüpft und zu anderen universell ist und natürlich frei. Was gibt es vergleichbares. Wit dem Wikidata-Item hat man direkt auch alle anderen Datenbank IDs wie z.B. "Gemeinsame Normdatei, “Welterbe-Referenznummer” usw. die Wikidata-ID ist damit der minimale “Einsprungpunkt” in die Welt der verknüpften, strukturierten Daten. Das leistet keine andere Datenbank und es gibt auch keine, die dieses Ziel verfolgen würde.

Zweites Argument ist, das wir mit der Wikipedia-Tag schon einen Funktionierende Verknüpfung zur Wikipedia haben die vielfach und mit großem Nutzen verwendet wird (zumindest von Seiten der Wikipedia). Die Wikidata-Links könnte man also als verbesserte Wikipedia-Links sehen, die sprachunabhängig und stabiler sind.

Damit ist denke ich klar bewiesen, dass brand=* nicht funktional gleichwertig ist mit brand:wikidata=. Allein die Tatsache, dass zur Verwendung von brand:wikidata= für etwas, wo es keinen Eintrag in Wikidata für gibt, eine Anmeldung und Vertrautheit mit Wikidata notwendig ist, ganz zu schweigen von einer vermutlichen Zustimmung zu Contributor terms, ist meiner Meinung nach eine inakzeptable Hürde. Aber selbst wenn man das nicht so sieht, bricht die Notability der Sache ganz eindeutig das Genick.

Und wie soll ein Mapper jetzt überprüfen, ob ein bestimmter Wert von brand:wikidata=* oder operator:wikidata=* richtig oder falsch ist? Q154950 scheint ja jetzt definitiv kein zulässiger Wert für brand:wikidata zu sein, aber was macht eine Wikidata-ID zu einem richtigen Wert dafür?

Tut mir leid falls das für Wikipedianer offensichtlich ist, aber was sind “die zuständigen Projekte” und “[die] erarbeiteten Regeln”? Aber grundsätzlich geht es mir hier mehr um die formelle Verfahrensweise mit den IDs - also nochmal meine (bis jetzt noch nicht wirklich beantwortete) Frage:

Das mit der Umleitung hab ich verstanden (ist aber zum ersten Mal, dass ich höre, dass es in Wikidata für die IDs Umleitungen gibt und damit die IDs nicht mehr unbedingt eindeutig sind - es also ggf. mehrere gültige IDs für das selbe Objekt gibt). Aber Wie wird entschieden, ob Q2843 dann auf die administrative Einheit oder die Siedlung umleitet? Ist das dann die freie Entscheidung von demjenigen, der die Änderung vornimmt oder gibt es da Regeln?

Aber ich habe doch gerade oben demonstriert, dass genau dies im Moment nicht der Fall ist, denn das Notability-Prinzip definiert, was enthalten sein kann und was nicht. Und es schließt einen Großteil der in OSM gemappten Dinge damit eindeutig aus. Wikidata ist also nicht als Meta-Datenbank geeignet, um OSM und alle darin enthaltenen Daten mit anderen Datenbanken zu verknüpfen. Schlimmer sogar: Die Auswahl, was in Wikidata eine ID bekommen kann und was nicht basiert primär auf der Existenz von Sekundärquellen und widerspricht damit dem Kernprinzip von OSM, der Überprüfbarkeit vor Ort.

Offene Geo-Datenbanken, die einen Teil der Objekte in OSM auch in irgendeiner Form repräsentieren und somit mit OSM verknüpft werden könnten, gibt es in großer Zahl. Und bei vielen von diesen erfolgt die Auswahl der Objekte, die enthalten sind, nach deutlich klareren und besser nachvollziehbaren Kriterien als bei Wikidata. Die Frage, was Wikidata besonders qualifiziert, dass seine IDs in OSM gespeichert werden sollen, ist also denke ich nach wie vor nicht zufriedenstellend beantwortet.

@Trockennasenaffe
“Die Wikidata-Links könnte man also als verbesserte Wikipedia-Links sehen, die sprachunabhängig und stabiler sind.”

Naja, aus meinem aktuellen Projekt:
wikipedia: https://de.wikipedia.org/wiki/Fuldaaue_(Kassel)
wikidata: https://www.wikidata.org/wiki/Q1473482
Das wikidata-Item behauptet, die Fuldaaue sei ein Naturschutzgebiet,
tatsächlich ist nur ein kleiner Teilbereich NSG - steht alles so auch korrekt im Wikipedia-Artikel.
Derartiges dürfte kein Einzelfall sein, wenn versucht wird Fließtext und komplexe Zusammenhänge auf Datenbank-Stichworte einzudampfen.

Der Vorteil eines Wikipedia-Links - aus OSM heraus - liegt für mich gerade darin,
dieses Datenbank-Stichwort-Korsett zu verlassen,
und komplexe Zusammenhänge auch adäquat darstellen bzw. dem Interessierten anbieten zu können.
Was wikidata da leisten soll kann sich mir bisher nicht wirklich erschließen,
und das sage ich als jemand der viel von OSM aus in Wikimedia-Projekte (Wikipedia + Commons) verlinkt.