Datenmüll durch Umtagging von POIChecker

+1. Wenn man sich die Changesets zu Heidelberg mal im Detail ansieht und die tlw. absurden Zuordnungen, die da von den armen Freiwilligen getroffen wurden, dann ist offensichtlich, dass diese Freiwilligen nicht verstanden haben und auch gar nicht verstehen konnten, was sie da taten: eben diese tlw. absurden Zuordnungen wurden ihnen ja von POIchecker vorgeschlagen. Dies zeigt, dass eine bessere Vorarbeit keineswegs nur um der OSM-Daten willen erforderlich ist, sondern gerade auch wegen der Anwender des Tools, die hier, im guten Glauben, etwas Gutes zu tun, viel kaputt gemacht haben. Diese Anwender müssen sich doch eigentlich vera****t vorkommen, wenn sie irgendwann einmal mitbekommen, was sie da unwillentlich angerichtet haben. Und das wollen wir doch alle nicht, oder?

Daher: Wenn sich ein Tool gerade an (Noch-)Nicht-OSM-Experten wendet, dann muss das Tool oder die die Datensätze vorbereitenden Person sicherstellen, dass die Wahrscheinlichkeit von falschen Zuordnungen und Änderungen sehr gering ist. Im Idealfall sollte POIchecker also bei der Zuordnung von Informationen über einen Parkplatz bzw. Behindertenparkplatz nur Objekte zur Auswahl stellen, die mit amenity=parking getaggt sind; wenn es um eine Kirche geht, nur Objekte mit amenity=place_of_worship und religion=christian, am besten auch noch building=; wenn es um einen Laden geht, nur POIs mit shop= usw. Ich kann mir vorstellen, dass das viel Arbeit macht, zudem könnten auf diese Weise sicher nicht alle Objekte eindeutig zugeordet werden (denn bei manchen ist das Tagging ja nicht eindeutig). Doch auf diese Weise würden ganz abwegige Zuordnungen ausgeschlossen und eine Beschädigung sinnvoller Daten unwahrscheinlich gemacht.

Ein weiteres Problem: mit POIchecker wurden ja nicht nur ein paar Tags zusätzlich gesetzt, die halt auch mal falsch sein können – es wurden auch Adressdaten geändert (in teils offensichtlich falsche), Objekte komplett umbenannt (siehe besonders eindrücklich Nakaners Beispiel von den 4 in “WC” unbenannten Bahnhöfen!) und umgewidmet etc. Wäre es nicht am besten, solche Änderungen komplett unmöglich zu machen? Sprich, POIchecker sollte Tags wie name=* oder Adressdaten einfach gar nicht ändern, sondern nur wheelchair=*-Tags u.Ä. ergänzen, wo diese fehlen.

Ohne sinnvolle Vorsortierung, ob manuell oder automatisch, kann ich mir nicht vorstellen, wie POIchecker jemals zu einem halbwegs sicheren Werkzeug werden soll (siehe oben). Vielleicht bin ich aber auch zu beschränkt ;). Jedenfalls, ohne ein bisschen mehr Aufwand wird es wohl kaum gehen, wenn das Tool wirklich mehr Freude als Ärger machen soll.

Uff … man überlege sich mal, was das im Umkehrschluss bedeutet! Wenn bereits die geschulten und begleiteten Freiwilligen in einer Stadt, in der sie sich auskannten, mit POIchecker solche Verheerungen anrichte konnten: was passiert dann erst, wenn ein nicht eingewiesener Benutzer mit diesem Werkzeug Orte bearbeitet, in denen er sich nicht auskennt? Und genau das kann jederzeit passieren, wenn das Tool auf einer öffentlichen Website steht. :roll_eyes: Umso dringender wäre es demnach, POIchecker stärker abzusichern, nämlich durch genauere Vorauswahl der Objekte und Einschränkung der zu ändernden Tags (siehe oben).

Edit: ergänzt.

PS: Ich weiß: OSM-Daten beschädigen kann jeder jederzeit – er muss sich nur einloggen und wild draufloslöschen oder, etwas subtiler, schwer zu erkennende falsche Informationen eintragen. Richtig “absichern” kann man OSM also nicht. Das Problem an Tools wie POIchecker ist aber, dass hier massive Datenbeschädigungen ohne bösen Willen passieren können – der User glaubt ja, etwas Gutes zu tun, und macht doch Dinge kaputt. Das ist ethisch ein massiver Unterschied. Und daher ist es leider nötig, gerade solche Werkzeuge besonders “idiotensicher” zu machen.

Update: Wir haben den Login auf POIchecker jetzt deaktiviert.

Jetzt erst? Ich dachte, das Zeug wäre schon längst gesperrt.

nun denn, fahre ich halt noch eine Auswertung.

Gruss
walter

EDIT: Mann oh Mann, ihr habt aber mächtig Quatsch verbreitet: housenumber anstelle von addr:housenumber, postcode anstelle von addr:postcode, website anstelle von source. ich hoffe, dass da nicht noch mehr kommt. :frowning:

Nachschlag: Noch 3 neue. Der Hype scheint wohl abgeflaut zu sein.


 https://www.openstreetmap.org/changeset/35681235 | http://poichecker.de/data_sets/29 | 2015-12-01 09:52:39
 https://www.openstreetmap.org/changeset/35687430 | http://poichecker.de/data_sets/29 | 2015-12-01 15:46:51
 https://www.openstreetmap.org/changeset/35705781 | http://poichecker.de/data_sets/29 | 2015-12-02 13:09:39

Zu https://www.openstreetmap.org/changeset/35705781 fällt mir auf: ihr könntet prüfen, ob die Koordinaten auch in DE liegen, auf die da die neuen Attribute geschrieben werden…

Bevor deshalb neue Kritik kommt: der Mapping-Fehler war mir bereits selbst aufgefallen und ich habe ihn auch schon korrigiert.
Weiterhin können POIChecker prinzipiell auch POIs außerhalb Deutschlands (z.B. Schweiz/Österreich) bearbeitet werden bzw. sogar auch POIs außerhalb des deutschsprachigen Raumes.

Da POIChecker aufgrund der beschriebenen Mängel derzeit nur bedingt geeignet ist, um Informationen zur Barrierefreiheit von Orten aus einem externen Datensatz in die OpenStreetMap zu übernehmen, hiermit die Bitte um Unterstützung an der manuellen Übernahme der Bewertung bzgl. Barrierefreiheit aus http://heidelberg.huerdenlos.de und Konvertierung in entsprechende wheelchair=* und toilets:wheelchair=* Tags. Wir werden auch daran arbeiten (nachdem die Korrektur der entstandenen Fehler abgeschlossen ist), sind über Unterstützung aber natürlich dankbar.

Nochmal zur Info: Die Erlaubnis zur Datenübernahme liegt vor und ist im Wiki dokumentiert:
https://wiki.openstreetmap.org/wiki/DE:Permissions#ab_2015

Wäre es nicht sinnvoll, erst alle (!) Beschädigungen rückgängig zu machen, die in Heidelberg und anderswo durch POIChecker entstanden sind? Oder seit ihr damit schon fertig? :wink:

Wenn keine Widersprüche kommen, werde ich vsl. am Sonntagabend oder Montag diese Changesets revertieren.

eventuell geht das einfacher, wenn du den vorher revertest: http://www.openstreetmap.org/changeset/35731715

war website → source

Gruss
walter

Das wäre super, damit dieser Alptraum endgültig vorbei ist. Vielen Dank, dass Du Dir die Mühe machst! Die reverts werden ja leider nicht gerade einfach sein, da schon viele Leute versucht haben, das eine oder andere manuell zu verbessern …

Ich revertiere gerade, werde heute vsl. aber nicht fertig werden.

Nachtrag 1: Die Datenquellen 29 und 28 (beides Heidelberg Hürdenlos) sind jetzt revertiert, 12 teilweise. Die anderen Sachen kommen ab morgen dran.

Furchtbares denglisch!

Wir arbeiten gerade daran, die tatsächlich entstandenen Beschädigungen - es waren schließlich nicht ausschließlich Beschädigungen, sondern in vielen Fällen auch nützliche neue Informationen, die hinzugefügt wurden - zu beseitigen.

Schade, dass nun die Mühen der hinzugefügten sinnvollen Informationen und die Mühen der Fehlerbeseitigung durch die Reverts umsonst waren. :frowning:

Habe nicht jeden Tag hier in das Forum gesehen, um zu prüfen, ob Aktuelles anlag und somit habe ich nun erst durch eine Notiz über ein Changeset erfahren, dass der Revert bereits erfolgt ist, ohne dass ich eine Chance hatte zuvor unsere aktuellen Arbeiten an der Fehlerbeseitigung zu erläutern.

Wer unterstützt uns dabei, die durch die Reverts verloren gegangenen sinnvollen Informationen wieder einzupflegen?

Kleiner Zwischenbericht vom Revert: Die POIChecker-Datensätze 23, 27, 28 und 29 sind jetzt revertiert. Nr. 21 (öffentliche Toiletten in Wien) kommt gleich dran ist jetzt auch revertiert, der Rest morgen und in den folgenden Tagen.

Beim Revert traten ca. 80 Konflikte auf. Zur Vereinfachung habe ich drei Reparatur-Changesets mitrevertiert. Diese drei Änderungssätze wurden entsprechend kommentiert. Weitere User haben auch vor meinem Revert Korrekturen vorgenommen, ohne das Ausmaß des Schaden zu erkennen. Wenn es sich nicht um triviale Edits gehandelt hat, habe ich die Informationen erhalten.

Beim Heidelberg-Hürdenlos-Importversuch fiel mir auf, dass der Import viele wheelchair=yes zu wheelchair=limited geändert hat, insbesondere bei Aldi- und Lidl-Filialen, die durch ihre meist einheitliche Bauweise einheitlich barrierfrei sind. Ich kann mir nicht vorstellen, weshalb die 08/15-Lidl-Filiale ein limited verdient. Solche Sachen sollte man vor einem Import klären, nicht hinterher. Dies ist ein Grund für meinen Revert.

Das ist normal. Hättet ihr euch vorher an die Regeln gehalten, würde man auch nicht nachher eure Edits, egal wie gut/wertvoll sie waren, revertieren. Eurem Import ist jetzt schon ein Platz in meiner Import Hall of Shame gewiss.

Bitte beschreitet den Wiki vorgeschriebenen Weg, auch wenn es sich um einen manuellen Import handelt! Ansonsten empfinde ich das als frech und würde in solch einem Fall die DWG anrufen. https://wiki.openstreetmap.org/wiki/Import/Guidelines

Viele Grüße

Michael

EDIT: Update Nr. 21

Soll man das ohne Ortskenntnis machen können, oder braucht man da Ortskenntnis für?

Hallo Michael/Nakaner,

Für die Heidelberg-Aktion gebe ich Dir Recht. Aber einen Revert aller Changesets die durch POIchecker-Editor erstellt wurden zu machen, halte ich für unverhältnismäßig.

Die drei anderen Referenzdaten wurden von mir und einem Freund von mir gemappt. Was ist an denen falsch?

Grüße,
Holger

Ich nehme an, Nakaner wird sich auf den Automated edits code of conduct http://wiki.openstreetmap.org/wiki/Automated_Edits_code_of_conduct beziehen, in dem eindeutig steht:

und aus den Import Guidelines http://wiki.openstreetmap.org/wiki/Import/Guidelines#Step_4_-_Documentation

Es ist also schon so, dass das Vorgehen mit POIChecker vmtl. dagegen verstößt, und man daher schon allein aus Prinzip reverten kann.

Hallo Holger,

Das ist zutreffend.

  1. Es ist ein mehrfachen Verstoß gegen die Import-Richtlinie. Da wird revertiert. Anschließend kann man es in Ruhe diskutieren.
  2. Auch diese Importe haben technische Mängel, die einen Revert rechtfertigen. Beispiele: https://www.openstreetmap.org/way/132862904/history, http://www.openstreetmap.org/way/105079534/history

Viele Grüße

Michael

Noch so ein paar traurig-lustige Beispiele aus diesem kaputten Import:

https://www.openstreetmap.org/way/93355541/history (wheelchair=ja)
https://www.openstreetmap.org/way/3933618/history (addr:street=-)
https://www.openstreetmap.org/way/78736138/history (hier habe ich bei der Konfliktlösung entschieden, name=Boschwerk zu verwenden)

Nr. 13 (Kirchentag Stuttgart) ist jetzt teilweise revertiert. Nr. 13 hat in mehreren Fällen, ß durch ss ersetzt, was natürlich auch revertiert wurde bzw. werden wird.

Hey,

Ich habe mich in der Forumsübersicht zuerst gewundert warum hier auf mittlerweile drei Seiten über ein Ärztehaus diskutiert wird, aus reinem Interesse dann mal draufgeklickt… Fazit: Der Titel des Threads sollte m.M.n geändert werden, das hat ja doch ne ziemliche Tragweite…

Schöne Grüße
Martin