wikipedia- (und wikidata)-Verweise in OSM-Datenbank behalten?

Wollte gerne einmal, (oder nochmal?) besprechen, warum die wikipedia-Verweise in OSM-Datenbank behalten werden sollten?
Gibt es dazu ein Proposal?

Argumente dagegen:

  • vor Ort im allgemeinen nicht nachprüfbar
  • wikipedia verwendet (meines derzeitigen Wissens) Sekundärquellen, weil Primärquellen nicht verwendet werden dürfen
  • sind weitere Argumente dagegen bekannt?

Argumente dafür:

?

(1) „vor Ort im allgemeinen nicht nachprüfbar“: inwiefern? Das verstehe ich jetzt nicht.

Beispiel: Ich stehe vor dem Goethehaus in Weimar. Entweder gucke ich jetzt auf das Schild und lese „Goethehaus“. Oder ich schaue das Haus an und weiß, dass dies das Goethehaus ist (soll ja vorkommen, dass jemand ein kleines bisschen gebildet ist). Oder ich frage jemanden (zuverlässigen), z.B. das Aufsichtspersonal. Egal. Jedenfalls weiß ich jetzt mit für Alltagszwecke hinreichender Gewissheit: dieses Ding = Goethehaus. Jetzt schaue ich in die OSM-Daten und lese: wikipedia=de:Goethes Wohnhaus. Ggf. sehe ich mir den zugehörigen Wikipedia-Artikel an, um Missverständnisse zu vermeiden. Jup, da sind Bildchen drin, das ist ja genau das Ding, vor dem ich stehe. (Und da ja jedermann ein tolles Smartphone hat, kann man dieses Nachsehen durchaus vor Ort erledigen.) Also „vor Ort […] nachprüfbar“.

Und genauso läuft das mit vielen andren Dingen. Ort: Ortschilder angucken, WP-Artikel ansehen, „Das ist derselbe Ort, genau, der Kirchturm ist grün“ denken, feddich. Oder aber: Nee, das stimmt nit, die Schreibweise ist nicht gleich, die Koordinaten sind anders, der Kirchturm ist blau … ergo Zweifel haben.

Natürlich gibt es problematische Fälle, klar, aber die gibt es auch bei anderen Mapping-Themen. Aber was ist da jetzt „vor Ort im allgemeinen nicht nachprüfbar“?

(2) „wikipedia verwendet (meines derzeitigen Wissens) Sekundärquellen, weil Primärquellen nicht verwendet werden dürfen“. Ja, aber das ist null problemo für das Verlinken eines WP-Artikels aus OSM. Das sind zweierlei Dinge, der unterschiedliche Umgang mit Sekundärliteratur ist den unterschiedlichen Medien, Rechtslagen und Lizenzformen geschuldet, und daher gibt es weder ein Problem, WP aus OSM zu verlinken, noch, OSM aus WP zu verlinken. Jedenfalls nicht wegen des unterschiedlichen Umgangs mit Quellen. :wink:

(3) Und „Argumente dafür“? Na, es funktioniert halt. Ist nützlich. Etc. Das ist doch mehr als genug, oder? Wir können meinetwegen auch vollends auf die (ausschließliche?) Verwendung von wikidata-IDs umsteigen, gerne, aber bis dahin ist mMn das *wikipedia=**-Tag eines der nützlicheren und problemloseren auf dieser Welt.

Generell: Ich finde die Tonlage der Frage etwas seltsam:

„warum … behalten werden sollten“ klingt fast so, als ob der Rauswurf des Tags schon halb ausgemacht wäre. Das finde ich bei einem wohletablierten Tag mit über 900.000 Vorkommen etwas befremdlich. Ein Proposal gibt es zu vielen etablierten Tags nicht. Das wikipedia-Tag funktioniert, und die einzige mir bekannte sachliche Diskussion dazu ist, ob, wie und wann wir stattdessen (ausschließlich) wikidata=* benutzen wollen. Also alles OK. Wir haben ganz andere Probleme mit doppeldeutigen, schlecht dokumentierten, in verschiedenen Weltgegenden unterschiedlich verwendeten … Tags. Über diese können, ja müssen wir diskutieren. Aber was ist das Problem gerade mit *wikipedia=**? Wollen wir jetzt etwa jede Woche eine andere Sau, ehm, ein anderes Tag durchs Forum treiben und danach aus der Datenbank werfen?

Der Wikidata-Tag hat den Vorteil dass er “sprach-neutral” ist. Ihr glaubt gar nicht wie oft es Konflikte in zweisprachigen Regionen gibt, darüber ob der Link jetzt zur Wikipedia in Sprache X oder Sprache Y geht. Mit dem Wikidata-Tag fällt dieses Problem weg.
In sehr seltenen Fällen gibt es heute noch Wikipedia-Artikel die keinen Wikidata-Eintrag haben. Für alle anderen Fälle könnte man aber doch einfach Mal nen Bot drüber laufen lassen, der die fehlenden Wikidata-Einträge nachlädt und danach den Wikipedia-Tag löschen.

Volle Zustimmung (nur mit dem Bot bin ich mir nicht ganz sicher, vielleicht machen wir das doch besser von Hand?). Ich habe das originale Posting aber so verstanden, dass Wikipedia- und Wikidata-Tags gleichermaßen gelöscht werden sollen – und das hat mich dann doch sehr verwundert. :wink:

Warum letzteres?

Was glaubst du, was Yuri in den letzten Monaten gemacht hat? Schau mal auf der Talk-Mailingliste vorbei.
Das Löschen geht gar nicht, es würde u.a. Nominatim und viele andere Anwendungen kaputt machen.

Ich habe keine Ahnung was Nominatim alles durchsucht, warum braucht man den Wikipedia tag? Idealerweise sollte doch der Name-tag durchsucht werden, nicht der Wikipedia-tag.

Stichwort: Relevanzkriterium.

Dafür sollte das wikidata-Tag aber auch taugen, wenn nicht gar besser. Natürlich muss man Anwendungen darauf umstellen, aber langfristig wird das die bessere Lösung sein.

Danke der Nachfrage, Verzeihung für den ungenauen Ausdruck. Ich meinte:

Der wikipedia-Web-Verweis ist vor Ort am betreffenden Objekt im allgemeinen nicht nachprüfbar, ohne eine Suchmaschine Deiner Wahl zu benutzen.

Kannst Du diesen Ausdruck mal erläutern, dass er einen Sinn ergibt?

Wenn man einen Wikipedia-Web-Verweis hat, braucht man doch keine Suchmaschine, um ihn direkt aufzurufen.
Wenn man keinen Wikipedia-Web-Verweis hat, braucht man doch auch keine Suchmaschine, da man dann direkt in Wikipedia sucht, um einen Artikel zu finden, auf den man verweisen könnte.
Man braucht natürlich vor Ort einen Web-Zugang, um zu prüfen, ob der Web-Verweis auf den richtigen Artikel zeigt und ob der dann auch das Objekt bechreibt, an dem man das vor Ort nachprüft - aber der ist im Allgemeinen heute eher gegeben.

Ich probiere mal den Sinn des Ausdrucks an einem Beispiel zu verdeutlichen. Gerne darfst Du mir nachträglich helfen und meinen vorherigen Satz (Ausdruck) so ändern, damit der Satz dann das ausdrückt, was ich eigentlich meine.

Beispiel: Du kommst in München an einem Objekt [1] vorbei, welches die Wiese (Grünanlage) ist, die sich in der Nähe der Isar befindet. Du kommst dort vor Ort zufällig an diesen [2] Schild vorbei, welches das Objekt beschreibt/nennt. Auf dem Schild [2] ist vermutlich der wikipedia-Web-Verweis [3] nicht aufgedruckt. Daher bin ich der Meinung, der wikipedia-Link [3] (nicht das Objekt selbst) ist vor Ort nicht auffindbar/nachprüfbar.

[1] http://www.openstreetmap.org/way/159075298
[2] https://farm9.static.flickr.com/8546/28632163664_0385de1f36_b.jpg
[3]

https://de.wikipedia.org/wiki/Englischer_Garten_(M%C3%BCnchen)

Und was lernen wir daraus, das Problem ist nicht wikipedia oder wikidata, sondern das starre “vor Ort nicht auffindbar/nachprüfbar.” denken.

Grüße von Lutz

  • 1.000.000 (in Worten: 1 Million).

Muss man jetzt wirklich daran erinnern, dass sehr viele Dinge „vor Ort nicht auffindbar/nachprüfbar“ werden, wenn wir den Begriff so eng auslegen? :roll_eyes: Grenzen etc. dürften wir dann sowieso nicht in der Datenbank haben, das ist klar. Aber wenn ich mich derart unflexibel anstelle, dann frage ich mich auch, ob ich dann einen Bäcker noch mit shop=bakery taggen darf; es steht ja nicht „shop=bakery“ dran … ja, oft nicht mal „Bäcker“, sondern (hier vor Ort z.B.) einfach nur „Kern“ oder „Betz“. Damit wäre das *name=-Tag zwar gegeben. Festzustellen, dass es sich um einen Bäcker handelt, erfordert dagegen größere geistige Anstrengungen, die mMn noch deutlich über das Verifizieren von *wikipedia=-Tags hinausgehen. Also werde ich, wenn wir „vor Ort nicht auffindbar/nachprüfbar“ so streng auslegen wollen, in Zukunft einen Bäcker nur noch dann als Bäcker taggen, wenn „shop=bakery“ oder wenigstens „Bäckerei“ dransteht. Und das gilt dann natürlich auch für alle anderen POIs. Da gibt es doch diese Dinger, wo „Shell“ oder „Aral“ dransteht. Irgendjemand taggt die immer als amenity=fuel, aber das ist zweifellos reine Spekulation und „vor Ort nicht auffindbar/nachprüfbar“. Alles, was nicht dransteht, muss raus aus der Datenbank. Supi!!! Ich sehe güldene Zeiten auf OSM zukommen … :stuck_out_tongue:

Ja, bei allen Dingen, die nicht vor Ort überprüfbar sind, sollten wir uns ganz kritisch fragen, ob deren Wichtigkeit die potentiell aus fehlender Nachprüfbarkeit resultierende Streiterei aufwiegt. Für aktuelle Verwaltungsgrenzen dürften wir uns da weitgehend einig sein. Bei historischen Verwaltungsgrenzen der jüngeren Geschichte vielleicht schon nicht mehr so… das ganze ist keine binäre Sache, wo man sagen kann “einmal irgendwo was nicht nachprüfbares gemappt, also geht alles”.

Entschuldige, aber das ist ein Scheinargument, das der Sache nicht dienlich ist. Frage eine zufällig vorbeikommende Person “ist dies ein Bäcker”, und die Person wird entweder “ja” sagen oder Dich besorgt anschauen und davonrennen. Frage eine zufällig vorbeikommende Person “hat dieses Geschäft bei Wikidata die ID Q1234”…

Der Wikidata-Link benötigt zur Überprüfung (1) technisches Gerät und Wissen auf Deiner Seite, (2) eine funktionierende Internet-Verbindung, (3) einen funktionierenden Wikidata-Server. Du magst Dich gern auf den Standpunkt stellen, dass das für Dich kein Problem sei, aber einfacher, als einen Laden als Bäckerei zu identifizieren, ist es gewiss nicht.

Dadurch, dass Du ein völlig vernünftiges Argument - nämlich dass unsere Informationen vor Ort überprüfbar sein sollen - zu “alles muss vor Ort angeschrieben sein” verdrehst und das dann ins Lächerliche ziehst, wird das ursprüngliche Argument nicht widerlegt.

Natürlich steht an einem Baum auch nicht “Baum” dran und wir mappen das trotzdem. Du wirst Philosophen finden, mit denen Du ausgezeichnet darüber diskutieren kannst, ob das ein Baum ist oder ob der Baum nur in Deinem Kopf existiert, aber so genau nehmen wir das bei OSM nicht, uns reicht das, wenn es ungefähr aussieht wie ein Baum und man sich den Kopf dran anhauen kann.

Die vor-Ort-Überprüfbarkeit ist für OSM von zentraler Wichtigkeit und das einzige, was uns vor Edit-Wars um Nuancen und Auslegungen schützt, vor ewigen Diskussionen und politischer Fakten-Auslegerei. Wenn zwei sich streiten: Trefft Euch vor Ort und schaut nach, dann ist die Sache eindeutig. Alles, ws vor Ort nicht eindeutig ist, birgt das Potential für Ärger. Natürlich haben wir davon auch genug (trunk oder primary? river oder stream? town oder city?), aber im großen und ganzen funktioniert es.

Nun gibt es natürlcih Dinge, die sind vor Ort nicht überprüfbar, aber trotzdem eindeutig, wenn man die Überprüfungs-Hürden überwindet. Zum Beispiel ein Springbrunnen, der 1878 (und nicht 1877 oder 1879) erbaut wurde, an dem kein Schild dransteht, aber man kann auf dem Rathaus in den Unterlagen nachsehen und da steht es genau drin. Diese Sachen sind also “theoretisch” überprüfbar, nur eben schwieriger. Wenn sich da zwei streiten, muss man schon sagen: Trefft Euch am Rathaus, wenn das gerade offen hat. Noch schwieriger wird es, wenn Dinge getaggt werden, die zwar überprüfbar sind, aber spezielle Messgeräte erfordern oder ganz spezielles Fachwissen. Und Wikipedia/Wikidata-Links liegen auch irgendwo auf dieser Skala. Sie sind garantiert nicht so leicht zu prüfen wie “hier steht ein Baum” oder “das ist ein Bäcker”.

Ich stelle mir gerade vor, irgendjemand taggt “patron_saint:wikidata=Q1234” und ich darf dann rausfinden, ob der heilige St. Thomas, auf den Q1234 zeigt, auch wirklich derjenige ist, nach dem die Kirche benannt ist, oder ob die Kirche vielleicht doch nach dem St. Thomas mit der ID Q4321 benannt ist, und natürlich ist klar, was ich tun würde: Achselzucken und mir denken “wird sich schon jemand was bei gedacht haben”. Während ich umgekehrt einen Baum, der als Eiche getaggt ist, in der Realität aber doch ein Ahorn ist, durchaus noch reparieren kann.

Also langer Rede kurzer Sinn, bitte hier keinen argumentativen Unsinn verzapfen wie das mit der Bäckerei, das bringt nicht weiter. Vor-Ort-Überprüfbarkeit ist keine ja/nein-Frage, sondern ein Spektrum, und wir täten gut daran, an dem Ende des Spektrums zu bleiben, wo wir noch sehr viele Mapper an Bord haben. Sonst geht unsere Qualität nämlich den Bach runter.

Bye
Frederik

Hallo,
Was Chrysopras schrieb war sehr emotional geladen, trotzdem denke ich versteht jeder, was er meint.
Es ist nicht schlimm, wenn ein zweitrangiges key/value in der Datenbank über kurz oder lang falsch ist.
Das wächst mit der Zeit raus…
Deshalb brauchen wir keine Verbote bestimmte key/value nicht in die Datenbank zu nehmen (es sei denn, die sie spiegeln sexistische, rassistische oder faschistische Meinungen wieder).

grüße von Lutz

Ich denke hier geht dein Argument fehl - es könnte durchaus leichter sein, ersteres zu überprüfen (wenn an der Kirche ein Schild hängt, auf dem steht, sie sei nach dem Hl. Thomas von Foo benannt und ID Q1234 aber der Hl. Thomas von Bar ist), während ein Nicht(hobby)botaniker vielleicht Schwierigkeiten hat, Eiche und Ahorn (oder was ähnlicheres…) auseinanderzuhalten. Das Problem ist wohl eher, dass ich, wenn ich den Baum als Ahorn identifiziert habe, ich sehe, dass der Eintrag mit der Eiche falsch ist, aber wenn ich die Kirche als nach Thomas von Foo benannt identifiziert habe, ich erst noch auf die Idee kommen müsste, den Wikidata-Tag nachzuverfolgen. Aber das wiederum ist eher eine Sache der Darstellung, denn meist wird man ja nicht mit dem Tag selbst interagieren, sondern eine Karte haben, die einem zum Objekt die Informationen aus dem Wikidata-Eintrag anzeigt - und dann sehe ich den Fehler wieder direkt.

Du hast natürlich recht. Ich entschuldige mich also für meinen überzogenen Unsinn aus #14! Worauf ich satirisch aufmerksam machen wollte, war, dass wir ein Tag nicht einfach deshalb ablehnen sollten, weil sein Wert nicht am realen Objekt im Klartext aufgedruckt ist – so habe ich nämlich #12 verstanden, wo es wörtlich heißt:

Wohlgemerkt, hier war noch nicht von Wikidata-IDs die Rede (deren Tagging gewiss Recherche erfordert), sondern von einfachen „wikipedia-Web-Verweis[en]“ – und diese sind in einem Fall wie dem angeführten Englischen Garten mMn auch nicht sooo viel schwerer abzuleiten als das Tag shop=bakery. (Spätestens bei den exotischeren Werten für shop=* muss ich immer wieder mal in unser Wiki schauen, und das ist dann wirklich auch nicht weniger aufwändig als das Heraussuchen eines Wikipedia-Links.) Das Unsinns-Argument “alles muss vor Ort angeschrieben sein” habe ich mir also nicht völlig frei ausgedacht bzw. etwas dazu verdreht, ich habe es aus dem oben zitierten Argument von #12 („ist vermutlich der wikipedia-Web-Verweis [3] nicht aufgedruckt“) entnommen und nur durch die Übertragung auf das Tag shop=bakery deutlicher machen wollen, warum ich diese Auffassung für falsch halte.

Aber das nur zur Erklärung. Ich stimme ja allem 1:1 zu, was Du (woodpeck) in #15 schreibst – ich wurde nur polemisch, weil mir die Auslegung des on-the-ground-Prinzips in #12 doch sehr überzogen vorkam. Mein Eindruck war, dass hier jemand unbedingt gegen die Tags wikipedia=* und wikidata=* angehen möchte und dazu das on-the-ground-Prinzip in … eigenwilliger Weise auslegt, in so überspitzer Weise nämlich, dass dies auch viele andere Tags betreffen und unsere Arbeit insgesamt sehr erschweren würde. Das wollte ich satirisch zeigen. Wenn das zu Missverständnissen verführt, entschuldige ich mich dafür gerne.

Es lebe das on-the-ground-Prinzip – aber immer in maßvoller und vernünftiger Auslegung, also genau so, wie Du (woodpeck) das in #15 beschreibst:

Genau das meinte und meine ich auch.

Edit/Ergänzung: Und dazu, also an dasjenige „Ende des Spektrums […], wo wir noch sehr viele Mapper an Bord haben“, gehören mMn eben auch einfache *wikipedia=-Tags wie wikipedia=de:Englischer Garten (München). Denn während wir über *wikidata=-Tags und v.a. über die zahllosen Varianten und wuchernden Variationen dazu à la *brand:wikidata=, operator:wikidata= etc. gut diskutieren können (dazu gibt es ja den anderen Thread), ist das simple *wikipedia=*-Tag für ein OSM-Objekt wie ein Gebäude, einen Park oder einen Ort nun wirklich kein Hexenwerk.

Da ich das andere Diskussionsthema:
https://forum.openstreetmap.org/viewtopic.php?id=63818 (Was ist die Essenz von OSM?)
nicht mit eher OT befüllen möchte, gehe ich in diesem ggf. etwas passenderen Diskussionsthema mal auf eine dortige Nachricht ein.

Bezüglich Mitteilung:
https://forum.openstreetmap.org/viewtopic.php?pid=716829#p716829

Ja

Danke für den google Tipp :wink: und auch für den Tipp nach Vorträgen und Videos zu schauen. Meinst Du etwa z.B. dieses Vortragsvideo:
https://www.youtube.com/watch?v=Zcv_7t7RcNM (2016 - Michael Maier: OpenStreetMap und Wikidata)

Oder hast Du zufällig Direktverweise zu anderen Vorträgen/Videos parat?

Die Benutzer, die deutschlandweit über 10 wikidata= Tags gelöscht haben. Als gelöscht zählt ein Wikidata Tag in dieser Auflistung nur, wenn er in dem DE Extrakt auch bei keinem anderen Objekt mehr vorhanden ist.
Es finden sich viele nachvollziehbare Löschungen darunter.


nyuriks , 3512
woodpeck_repair , 2282
Reclus , 62
floscher , 29
amilen , 27
richtkreiser , 25
Mateusz Konieczny , 25
Nakaner , 25
nvrandow , 23
elsaxo , 18

Die komplette Liste findet sich hier
https://www.codegeo.de/stats/deleted_tags.txt