Wikidata-Links

Das ist natürlich ein Punkt.
Es wird beim Mappen aber immer den Punkt geben, wo eine Information in die Karte eingefügt wird. Ob das jetzt der Wikidata-Tag ist oder ein Name - Fakt ist, irgend eine Information muss irgendwann mal eingefügt werden. Wir reden ja nicht davon, OSM-Daten durch Wikidata-Daten zu ersetzen, sondern zu ergänzen. Wikidata-Tags finden nicht von selbst die passenden Objekte auf der Karte, so wie der Wikipedia-Tag auch. Den gibt es jetzt schon seit so langer Zeit, und trotzdem ist längst nicht jedes OSM-Objekt, für das einen Wiki-Artikel gäbe, auch tatsächlich mit diesem Artikel verlinkt. Dass das Szenario eintritt, welches du beschreibst kann ich mir eigentlich nur vorstellen, wenn große kommerzielle Anbieter das OSM-Projekt mit Massenedits kapern, mit dem mutwilligen Ziel den name-tag durch Wikidata zu ersetzen.

Zumal es z.B. auch verschiedene Möglichkeiten gibt, die Beziehung “patron_saint:wikidata=Q12345” verbal auszudrücken; Josefskirche, Sankt-Josefs-Kirche, Kirche Sankt Josef, Joseph statt Josef, etc. Und völlig unabhängig davon kann etwas ja noch eine Kirche, Kathedrale, Kapelle, Basilika, etc sein. Der Name-tag wird also nicht obsolet.

Aber selbst wenn dem so kommen sollte. Prinzipiell könnte man diese Daten dann auch in OSM reinholen, sprich ein Bot/automatisch würde dann das amenity:wikidata=Q9876 zu amenity=place_of_worship gemacht werden. Aber ich glaube nun auch wieder nicht, dass das überhaupt passieren wird, nur als Hinweis für die Apokalyptiker… :wink:

Es gibt dann ja scheinbar auch noch brand:wikidata oder operator:wikidata oder so (warum findet man da nichts auf der Wiki-Seite?). Das finde ich dann teilweise schon gut. OSM hatte ja eigentlich genug Zeit sich da intern was einfallen zu lassen (sprich bspw. eine einzigartige ID für eine Ladenkette), damit das bspw. sauber ausgewertet werden kann. Das über Wikidata zu machen halte ich nicht für verkehrt. Ich denke OSM und Wikidata können sich da sehr gut ergänzen und OSM kann da auch sehr profitieren. Allein weil die Wikidata-Community vermutlich auch nicht allzu klein ist, aber vor allem weil sie internationaler ist als bspw. dieses Germany-Forum und OSM ja darauf abzielt eine weltweite Kartendatenbank zu erstellen (also Tagging-Schemen die überall anwendbar sind) und nicht nur für eine kleine Region.

Das ist etwas, was ich bei Wikidata noch nicht so ganz verstanden habe. Bei Wikipedia achtet man streng darauf, dass jeder Sprachraum seine eigene “Kultur” hat; ein deutschsprachiger Artikel ist in der Regel nicht einfach die Übersetzung des englischen oder umgekehrt, sondern kann durchaus andere Akzente zum gleichen Thema haben oder sogar eine widersprüchliche Definition. Das ist auch so gewollt, weil keine Kultur zu einem Thema “autoritativ” sein soll.

Bei Wikidata geht das aber nicht, da muss man sich auf eins festlegen. Und da sehe ich durchaus Probleme; Stichwort: in einer amenity=bar in Italien gibt es morgens Espresso und Cornetto, in einer amenity=bar in Deutschland gibt es morgens nur die Müllsäcke und den Zigarettenrauch vom Vorabend.

Ich habe die Sorge, dass uns bei OSM die Zügel aus der Hand genommen werden von Leuten, die keine Ahnung von und kein Interesse an OSM haben, die dann anfangen, bei uns Zeugs zu editieren, damit es besser zur Wikidata-Welt passt.

In der Diskussion auf der Talk-Mailingliste wurde auf viele mögliche Probleme hingewiesen, unter anderem auch darauf, dass bei Wikidata grundsätzlich eine andere Mentalität vorherrsche, nämlich die gleiche wie in Wikipedia, dass man erfasst, was man in Sekundärquellen findet, während wir bei OSM erfassen, was wir vor Ort sehen. Oder darauf, dass Wikidata sich einen feuchten Kehricht um Datenbankrechte Dritter schert und munter (zum Beispiel) Koordinaten von Google abkupfert.

Ich will das auch alles gar nicht kategorisch ablehnen; anfangs war ich sogar begeistert von der Idee, dass Leute endlich aufhören würden, in weltumspannenden Changesets anhand seltsamer Drittquellen 2000 Städten einen Namen in einer obskuren Sprache zu verpassen, weil man das ja alles in Wikidata findet. (Stichwort “on the ground” Mapping - ich wohne in Karlsruhe, aber ich hätte keine Chance, anhand der Beschilderung festzustellen, ob z.B. name:az=Karlsruye richtig ist…) Bloss habe ich inzwischen das Gefühl, dass hier von einigen wenigen mit ziemlich schnellen Schritten in eine Richtung marschiert wird, die keinem so richtig klar ist. Mir wäre wohler, wenn man sich da mal ein paar gründliche Gedanken machen würde, auch zu der Frage: Was ist, wenn demnächst das Konkurrenzprojekt zu Wikidata startet? Unterstützen wir dann beide - patron_saint:wikidata=Q1234, patron_saint:datawiki=#AABBCC, …? Welche Anforderungen muss eine Fremd-Datenbank erfüllen, um integraler Bestandteil von OSM werden zu dürfen?

Bye
Frederik

Ich finde den undokumentierten :wiki Wildwuchs auch schrecklich. Wenns gut gemacht wäre, wäre es auch nutzbar. Ich denke aber da wird nur Kraut und Rüben raus kommen, leider. Werd mich vorerst nicht dran beteiligen.

Zu dem Punkt mit Wikipedia: Jein. Es stimmt dass viele Artikel je nach Sprachversion teils gravierende Unterschiede aufweisen. Das ist hauptsächlich bei politischen und historischen Themen der Fall und ist nicht explizit so gewollt. Es liegt einfach daran, dass Sprecher einer bestimmten Sprache oft zu bestimmten Standpunkten tendieren. Ein arabischer Muttersprachler sieht den Nahostkonflikt anders als ein hebräischer Muttersprachler. Die ukrainische Wikipedia spricht von den Separatisten in der Ostukraine als Terroristen, die russische Wikipedia von nicht allgemein anerkannten Staaten. Idealerweise basiert ein Wikipedia-Artikel aber nur auf Fakten und ist neutral.

Ich denke es geht beim Einsatz von Wikidata auf OSM nicht darum, möglichst alles mit einer Wikidata-Referenz zu versehen. Zum automatischen Übersetzen oder gar als Ersatz für einen Nametag taugt das ohnehin nicht. In einigen Fällen halte ich die Benutzung von Wikidata aber durchaus für eine sehr gute Ergänzung um interessante oder nützliche Zusatzinformationen zu erfassen.

I’m using Google translate, and quoting accordingly. My apologies if the translation was not very accurate and made me misunderstand things.

I agree that different cultures (not just languages!) sometimes present slightly different description in Wikipedia. But we (OSM) use wikipedia/wikidata tags as links to Wikipedia, not as sources. If it was a source, we should use “source:wikipedia” or something similar. When a village X has a wikipedia/wikidata tag, it means “This OSM object has a corresponding page in Wikipedia, so you may want to read-up about it there”. Moreover, any data consumer who may wish to show Wikipedia page to a user would ignore the language you specify - because most users would want to read Wikipedia article in their language, and they will simply use Wikidata to lookup that page in another language. Also, this sounds very theoretical. Have you actually seen any problems like this? How substantial is this problem?

I am concerned that you might be seriously offending people with this statement. Most people participating in OSM discussion care deeply about OSM. Please don’t accuse just because you don’t like the position of others, this is very inappropriate. I myself have met some of the active proponents of using Wikidata at OSM conferences.

This is true that each language in Wikipedia, as well as Wikidata, have different set of rules. Google Translate amusingly translated your expression as “gets a wet rubbish around database rights”, and I take it to mean that Wikipedia simply ignores the laws. I don’t think this is accurate - Wikipedia has a large number of very diligent lawyers who might have a somewhat different interpretation of the laws, especially in how they relate to US, and the community is extremely careful with the copyright law. But again, this is irrelevant. We are not copying data from Wikipedia or Wikidata. We are discussing linking to it.
If I, as a user, want to read more about a place, I will click on the link to Wikipedia. If I don’t care, I ignore it. This is identical to a “url” or “website” tag. We are not discussing if the content of that site is violating database right or has other issues, right?

I think you are exaggerating. This whole thing started after I added a few thousand wikidata tags to the objects that already had wikipedia tags. Same way as iD editor did it automatically for hundreds of thousands, often without any oversight. The number of wikidata tags in the past few years have been used for all sorts of things, there is no new development. You could say it has reached critical mass and enough people started noticing it. But you don’t have to use them - noone is removing “brand”, or “subject”, or any other tags. These are additional tags - for those who need them - and again, there are a lot of data consumers who really do want them.
To answer your question - if someone creates another such project - great. But I seriously doubt it will happen. Google had a similar project called Freebase for a while, and with all their resources, they gave up - and moved all their data to Wikidata. For a very simple reason - it is very easy for a few developers to create a new project. It is extremely hard to build a large community around it, especially when something similar already exists and has a huge community and resources. But regardless - if someone creates it, and people find it useful, i see no problem for community to start adding new tags. Who am I to tell others what new information they should or shouldn’t add?

Deshalb sollten wir uns bemühen, das Wikidata seine Koordinaten von uns bekommt.

Übrigens ist es mit wikidata so wie mit jedem anderen key/value, nur weil es existiert, muß es nicht an jedem Objekt geklebt werden.
Verbieten wir tracktype, nur weil es bei gefühlten 20% nicht der Realität entspricht?
Nochwas, wikidata und wikipedia sind sogenante Sekundärtags, wer diese nicht braucht, wertet sie einfach nicht aus.
Will ich einfach nur eine MBT Karte rendern, brauch ich die vermutlich nicht.
Für die Zukunft von OSM bieten sie ein großes Feld.
Und eins ist sicher, alles fließt, auch OSM wird sich weiterentwickeln…

Grüße von Lutz

Ich dachte, das funktioniert in diese Richtung nicht wg. inkompatibler Lizenzen? Nur Wikidata → OSM ist ok, ganz unabhängig von der Fragestellung, wie es mit der Datenqualität aussieht.

Prinzipiell ok, wenn andere Tags dann nicht mehr in OSM erfasst werden, die dort eigentlich auch hingehören, weil sie ja eh über den Umweg wikidata ableitbar sind, funktioniert diese Logik nicht mehr.

Danke für den Hinweiß, das war mir jetzt gar nicht bewußt.
Deshalb schrieb ich ja “Sekundärtags”, sie sollen eine zusätzliche Info sein.
Die Angst, das alles mal nur noch über “wikidata” gemappt wird ist reine Spekulation und unbegründet.
Selbst wenn dahingehend Tendenzen erkennbar werden, läßt sich das schnell über Editor-, oder Datenbankbeschränkungen regeln…

Grüße von Lutz

Die kluge Else ? I was fascinated by that story as a kid…
update apparently i was replying to an older post on this thread. Still relevant, but less so now :slight_smile:

Hierzu mal eine dumme und naive Frage. Gibt es bei OpenStreetMap eine Instanz die zumindest für jeden Punkt, für jede Linie und für jede Fläche in der Datenbank eine eineindeutige ID vergibt? Bekommt man eine Lösung Deines Problems unter Verwendung dieser ID’s hin?

edit: Problem => Problems

Ja, jeder Node, Way und jede Relation bekommt eine eindeutige ID. Das macht die API beim hochladen in die Datenbank. Allerdings hilft das nichts, diese ID ist nicht garantiert dauerhaft das gleiche Ding in der echten Welt.

Wenn ich heute z.B. einen Brunnen als Node eintrage, könntest Du morgen diesen Brunnen schöner als Fläche mappen und dabei meinen Node löschen oder in einen Eckpunkt Deiner Fläche verwandeln. Du könntest ihn sogar ganz woanders hin verschieben, alle Tags löschen, neue Tags eintragen und einen Baum draus machen.

Und hier ein weiteres Klasse Beispiel


architect=Josep Vilaseca i Casanovas
architect:wikidata=Q517127
architect:wikipedia=ca:Josep Vilaseca i Casanovas
artist:wikidata=Q4493323
artist:wikipedia=ca:Manuel Fuxà i Leal
artist_name=Manuel Fuxà i Leal
artwork_subject=Josep Anselm Clavé i Camps
artwork_type=statue
historic=monument
name=Monument a Anselm Clavé
subject:wikidata=Q2335557
subject:wikipedia=ca:Josep Anselm Clavé i Camps
tourism=artwork
wikipedia=ca:Monument a Josep Anselm Clavé
wikipedia:wikidata=Q18004983

also wikipedia:wikidata find ich dann den absoluten Knaller :smiley:

Es sollte gelten:

so viel Wikidata/-pedia wie nötig, aber
so wenig Wikidata/-pedia wie möglich.

Ein wikidata=Q18004983 ist sicherlich sinnvoll, um für das Monument eine Datenbrücke in die Wikipedia-Welt zu bauen. Aber der ganze Rest wie Architekt, Künstler, Bild(er), … benötigt keine weiteren Wikidata-Tags, denn diese sind bereits alle bei Q18004983 vorhanden.

Wenn ein OSM-Objekt kein entsprechendes Pendant in Wikidata hat, kann es u.U. sinnvoll sein, bei Besonderheiten wie Architekt, Künstler oder Namensgeber einen Wikidata-Link zu setzen. Gerade mehrdeutige oder sprachlich unterschiedliche Namen lassen sich so für wissenschaftliche Zwecke exakt darstellen. Massen-Discounter gehören jedoch bestimmt nicht zu diesen Besonderheiten.

Ein Wildwuchs wie das weiter oben erwähnte patron_saint:wikidata (einmal vorhanden) ist jedoch einzudämmen, dafür gibt das bereits 18.500 mal vorhandene name:etymology:wikidata

Genau, Wikidata ist noch sehr jung.
Aber für die Zukunft auch für OSM von unschätzbaren Wert!
Ich denke auch, irgendwann braucht es nur ein wikidata=* ,
die ganzen :wikidata= werden nach und nach aus der Datenbank verschwinden.

Grüße von Lutz

I doubt “brand:wikidata=Q38076” will disappear. I don’t think there will be a Wikidata entry for every McDonalds in the world. On the other hand, yes, having all these tags duplicating Wikidata is silly. We should at some point decide the fate of other tags like “should there be a population tag in OSM?” Population is rarely “the ground truth”. Instead, it is usually copied from some government source.

Klar, wenn ich dann sowas lese:

Removing the population tag would break a few projects: https://taginfo.openstreetmap.org/keys/population#projects - yes, the Mapnik standard map on osm.org would of course also be affected, in case you wonder.

I’m not sure if those project would really be happy to pull in a Wikidata dump in addition to an OSM Planet file. I seriously doubt it.

Don’t forget that tags in OSM are there for a reason. Removing them because they’re “redundant” to what wikidata has to offer is a big no go. That’s pretty much opening Pandora’s box.

@mmd, I didn’t say remove them from the download dump :wink: One option could be to dynamically merge useful values from Wikidata. We could have the “pure OSM” and “augmented with extra sources” downloads. The population data is more likely to be up to date in Wikidata, because of constant monitoring by bots. I think OSM should use the “override” model, rather than “we are the only source, if we don’t have it, write your own software”. If OSM has a value, it overrides the Wikidata value.

I just compared some population numbers in OSM and Wikidata - seems like there are a lot of mismatches: http://tinyurl.com/ydg4evlc which might be an argument to use both systems. The number of people in London clearly should not be based on “personal observation”, but instead should have a verifiable source. But when we are talking about some tiny 5 person village, things may be different.

For example, according to Canadian Census, Mistissini village (node 107364956) has population of zero, but OSM has 3,285, without giving the source. 3,285 is a large number to count by hand, so clearly it came from some source, and can be easily added to Wikidata too.

I know this is a heated and debatable topic at the moment - these are just ideas, not “call to action”, so lets keep theorizing - maybe we can come up with a better solution. :slight_smile:

Naja - die ganze Diskussion hat zumindest das Ergebnis, dass jetzt allmählich die Masken fallen und klar wird, dass es letztendlich im Wesentlichen um eine Kolonialisierung von OpenStreetMap aus dem Wikipedia/Wikidata-Dunstkreis geht.

Ginge es tatsächlich generell um die Interkonnektivität zwischen OSM und anderen Datenbanken mit geographischen Informationen, dann wären die Schwerpunkte der Diskussion völlig anders. Dann könnte man das Ganze auf die Frage der dauerhaften Identifikation bestimmter Objekte in der OSM-Datenbank reduzieren, was man nicht nur vollkommen unabhängig von konkreten Anwendungfällen sicherstellen könnte, sondern es vor allem auch sollte. Die Befürworter einer engen Verknüpfung von Wikidata und OSM sollten sich klar manchen, dass wenn sie keine generische Lösung anstreben, sie hier langfristig der Idee offener Daten einen Bärendienst erweisen und sich de facto für eine Dominanz von Wikidata in der Welt der Geo-Datenbanken einsetzen.

Durch die Collective Database Guideline sind die Möglichkeiten, dass sich OSM auf rechtlicher Ebene über die Lizenz gegen eine solche Kolonialisierung wehrt, mittlerweise sehr begrenzt, denn der Datennutzer kann darüber ohne Lizenz-Probleme beliebige Attribute durch entsprechende Attribute aus anderen Datenbanken ersetzen (und bei Wikidata läuft das sowieso weitgehend ins Leere).

Der Weg, OSM als eigenständiges Projekt mit eigenen kulturellen Prinzipien zu erhalten wäre, von Seiten von OSM permanente Identifikationen für Objekte einzuführen und diese anderen Projekten (wie Wikidata) als Möglichkeit der Interkonnektivität anzubieten - gleichzeitig aber externe Identifikatioren wie die Wikidata-IDs, die zwangsläufig bestimmte Projekte und Ihre kulturellen Ideen gegenüber anderen bevorzugen, strikt abzulehnen. Für den Datennutzer, der einfach nur verschiedene Datenbanken verknüpfen möchte ohne tiefergehende politische Interessen, wäre das sogar besser als die Wikidata-IDs, da es auf andere Datenbanken genauso anwendbar wäre.

Ich weiss, dass die Idee permanenter Identifikationen für Objekte in OSM schon öfters diskutiert wurde und meist als schwer umsetzbar angesehen wird. Ich denke, dass dies jedoch oft an der mangelnden unmittelbaren praktischen Notwendigkeit lag. Die Einbindung von Wikidata-IDs in großem Umfang zeigt jedoch eigentlich, dass dies praktisch durchaus machbar ist. Eine in OSM frei vergebene ID wäre im Grunde für Mapper viel einfacher zu handhaben, als Wikidata-IDs, denn man braucht ja kein existierendes Wikidata-Objekt dafür (sprich: jede McDonalds-Filiale erhielte selbstverständlich ihre eigene ID).

Denkbare praktische Ansätze wären eine vom Editor vergebene UUID oder eine von der API erzeugte fortlaufende Nummer. Im letzteren Fall würde der Mapper im Editor ein leeres permanent_id-Tag erzeugen, was dann von der API gefüllt würde. In beiden Fällen würde der Mapper (mit Unterstützung des Editors) dafür verantwortlich sein, die ID zu übertragen, wenn das selbe Objekt in der realen Welt durch eine neue Geometrie in OSM repräsentiert wird (zum Beispiel, wenn vom Mapping als Node auf ein Mapping als Way/Area gewechselt wird). Das ist das selbe wie bei der Wikidata-ID und es gibt keinen Grund, weshalb das nicht auch funktionieren sollte, wenn die Community dahinter steht.

Man sollte nicht den Fehler machen, die langfristige politische Dimension des Ganzen zu unterschätzen. Wir werden in der Zukunft eine Menge verschiedener neuer Geodatenbanken und Geodatensätze sehen, vor allem aus den Bereichen Satellitenbild-Auswertung und “Big-Data”-Techniken. Es ist klar, dass der Aufgabe, solche Daten zu verknüpfen, eine enorme wirtschaftliche und politische Bedeutung zukommt. Wer da bei OSM seinen Fuß in die Tür bekommt, hat eine sehr gute Ausgangsbasis, generell den Markt zu dominieren. Und für viele Akteure ist hier die Dominanz von Wikidata aufgrund der Lizenz (was hier weniger das share-alike als die Quellen-Nennung betrifft) und der weniger einschränkenden Regeln (kein Überprüfbarkeits-Kriterium), gleichzeitig aber einer eindeutigeren Prägung durch “westliche” kulturelle Sichtweisen wesentlich reizvoller, als die Dominanz einer von OSM erzeugten Identifikation.

Ahem. Sounds a lot like a typical Conspiracy Theory and World Domination… Or it could be the Google translate…?

All I care about is Knowledge, available to everyone, free of charge, with a good community to maintain it. The knowledge that allows the world to benefit and move forward. OSM is a huge part of that knowledge - the knowledge about the planet we all live on. So is Wikidata. So is Wikipedia. So is the whole FLOSS ecosystem, that makes it possible to use that knowledge, and make great things from it.

Are you saying that OSM is a special thing that shouldn’t mix with the other “bad projects”? Are you saying that if I donate my time to one project, i can no longer donate my time to another project? Are you saying that OSM data should never mix with Wikipedia data by data consumers? Do we want to create fences just for the sake of having fences, because we are so insecure in our own project?

I think by now OSM has proven that it is stable, mature, and successful. Its growth is a clear indicator. Yes, there are many companies that benefit financially from it. Same applies to Wikipedia & Wikidata & FLOSS. That doesn’t mean we should make software closed source, just in case Facebook or Google might use it to make more money. Or should we?