Datenbank aufräumen?

Hallo zusammen,
bei TagInfo:smoothness habe ich mehrere Einträge gefunden, die nicht zu den vorgegebenen 8 passen. Nun habe ich mir diese Tags mal raus geschrieben und versucht zuzuordnen:

excellent
very_good, excellent , excelent, exellent, very good, smooth, suitable for roller skating

good
Good, ok, normal, fine, god

intermediate
medium, Medium, average, mediocre, moderate, i könnte auch impassible bedeuten!?, intermadiate, inermediate, intermediate, Intermediate, intermedia, middle

bad
poor, Bad, low, ad, beg, ba

very_bad
very bad, terrible, very-bad, very poor, vary bad, very _bad, vrey_bad

horrible
horriable, catastrophic, (horrible, horriblle, horibble, Horrible, extremly fucking bad, horribble, as bad as you can imagine

very_horrible
very horrible, harvester, verry_horrible, very_horrible, very_horibble, very horible

impassable
impassible, impossible

???
rough, yes, fair, 100, 5, 3, reasonable, wheel, grade2, bumpy, 1, dirt, high, wheels, grade1, asphalt, *, 6, soft, no, cool

Daneben gibt es noch “No Data” und doppel-Tags wie “bad;very_bad” oder auch “horrible;good”

Wäre das nun ein so genannter “Massenedit”, wenn ich die Werte anpasse? Bei “???” gehts natürlich nicht, da müsste man im Einzelfall schauen, ob es tracktype, surface oder was anderes ist. Die Tags aus TagInfo sind weltweit, sollte das dann besser auf der TaggingMailingliste angesprochen werden? Oder überflüssig, da nur Korrektur und keine Änderung?

Gruß
Masi

P.S.:
Gibt es Tools, mit denen es einfacher geht als: OverpassAPI → Texteditor: suchen/ersetzen → JOSM: hochladen?
Bei smoothness geht es so noch, aber bei anderen Tags wird es dann viel zu viel…

Die doppel-Tags habe ich auch schon bei surface=* gesehen (grass;ground) und sie gelassen, da es meist dem Wegverlauf entspricht. Würde ich auch bei smoothness empfehlen. Bei den anderen denke ich sind es Schreibfehler oder andere Umschreibung (zum ändern).

Einfache Rechtschreibfehler könnte doch eventuel Wall-E mit übernehmen? http://forum.openstreetmap.org/viewtopic.php?id=20433

“horrible;good” kann aber auch dem Verschmelzen von zwei Wegen kommen. In beiden Fällen geht aber wohl nichts automatisches.

Schau bei den betroffenen Objekten mal in die History. Wenn Du in einer Vorgängerversion von “horrible;good” ein “horrible” findest, sind sehr wahrscheinlich irgendwann zwei Wege zusammengefügt worden. JOSM kombiniert dann standardmäßig konfliktbehaftete Tags; Potlatch verwirft das zweite. So kommen auch Namen wie “Hauptstraße;Nebenstraße” zustande.

Edit: 19 Sekunden zu langsam :wink:

Ahh stimmt, die Doppeltags könnte man mit Hilfe der History rekonstruieren. Ist mir aber per Hand leider zu aufwändig :frowning:

Ich hatte erst mal die Wort- bzw. Sinn-Anpassung im Kopf, dann sind meisten Fälle erledigt.

Wenn das mal vereinheitlicht würde, könnten auch die Router was damit anfangen, was zur Zeit wohl nicht der Fall ist.
Bei BRouter z.B. wäre es sicher kein Problem, das mit ins Profil aufzunehmen.
Zweiter positiver Effekt: Ich denke einige bis viele, die so ein Tag vergeben, schauen vorher mal bei Taginfo nach gängigen Werten nach. Wenn es da eine klar abgegrenzte Toplist gibt, bildet sich vielleicht von selbst ein brauchbares Schema raus.

Ähm, in 98% der Fälle wurde doch einer der 8 dokumentierten Werte benutzt. Schaut euch doch vorher die im ersten Post verlinkte Seite bei Taginfo an, bevor ihr solche Aussagen macht.

Ich denke so lange man nur Rechtschreibfehler korrigiert ist das eigentlich kein Problem. Bei 30 “falschen” Vorkommen würde ich nicht von Massenedit sprechen, wenn man alle zusammen nimmt dann schon eher. Ansonsten muss man halt die entsprechende lokale Community fragen. Bei weltweiten Edits ist das halt immer so nen Sache ne passende Mailingliste zu finden. Evtl. imports@ oder tagging@… aber evtl. wissen andere da mehr.

Edit: Auf http://wiki.openstreetmap.org/wiki/Mechanical_Edit_Policy#Discuss steht tagging@lists.openstreetmap.org an erster Stelle.

MfG Andi

Ja, hätte ich mir wohl anschauen sollen. Aber wieso besteht bei 98% Nutzung der dokumentierten Werte überhaupt ein Korrekturbedarf? Ist doch ein sehr guter Wert. Und die mir bekannten Router nutzen es zur Zeit nicht, warum auch immer.

Bei strikter Auslegung fällt das Vorhaben unter die (überarbeitungsbedürftige) Mechanical Edit Policy (“search-and-replace operations using an editor”), liegt aber aus meiner Sicht in einer gemeinhin tolerierten Grauzone. Eine ganze Reihe von Leuten korrigieren regelmäßig großflächig oder gar weltweit solche mißglückten Werte, jeder in seinem thematischen Interessengebiet. Wenn nicht, wäre das Durcheinander noch größer. Bei einer eindeutigen Zuordnung - mit horriable, (horrible, horriblle, horibble, Horrible kann nur horrible gemeint sein - glaube ich nicht, daß irgendjemand ein Problem damit hätte, wenn Du per Editor die Werte änderst; vom Raten in unklaren Fällen (“normal” etc.) würde ich aber absehen. Im Grunde hilfst Du ja dem ursprünglichen Mapper und machst sein Tagging endlich auswertbar. Solange sie ordentlich gemacht sind und nichts kaputt geht, werden solche Edits nach meiner Wahrnehmung geduldet. Im Editor die Wege mit smoothnoess=horriable auszuwählen und auf horrible zu ändern, ist meines Erachtens auch noch etwas ganz anderes als ein Programm völlig autonom in den Daten herumpfuschen zu lassen, wie ich das tue - dabei ist eine Diskussion ganz klar unabdingbar. Die Mechanical Edit Policy kennt leider nur “entweder oder”, aber keine Abstufungen.

Hallo Masi

Wofür dieser Aufwand? Ändere diejenigen, die offensichtliche Schreibfehler sind. Bei no_data ist zwar klar was gemeint ist, aber außer die Schreibweise zu vereinheitlichen, kann man da nichts tun. Und dafür den Wegen eine neue Version spendieren, ist es das wert?
Bei den anderen ohne Ortskenntnisse etwas hinein zu interpretieren, was der Ersteller vielleicht gemeint haben könnte, halte ich für sinnfrei. Kann man von “terrible” wirklich auf very_bad schließen oder wäre (very_)horrible nicht näherliegend.
Da bleibt eben ein gewisser Bodensatz übrig, was soll’s. Außerdem habe einige von den 'seltsamen Einträgen durchaus das Potential die Mit-Mapper zu belustigen.

Es käme meiner Meinung nach durchaus in die Nähe eines Massenedits. Auf jeden Fall wäre es ein “mechanical edit” für den ja auch ähnliche Regeln zu beachten sind. Bei der nicht allzu großen Zahl wird vielleicht niemand protestieren, aber wenn du solche Aktionen auch bei anderen Taggs machst, wird es irgendwann auffallen.

Das weiß ich nicht. Wenn ich jedoch deine Frage lese, ergibt sich für mich der Eindruck, dass du dich immer weiter in Richtung Massenedits bewegst.

Ach ja, bevor du diese Aktionen wirklich startest, lege dir einen eigenen Account dafür zu. So sind diese Änderungen wenigstens leicht zurück zu verfolgen.

Edbert (EvanE)

Tja, wäre schön, wenn dieses Tag mit seinen Werten auch unter die Presets der Editoren käme. Aber da weigern sich die JOSM-Entwickler…

Ich weiß nicht, ob die JOSM-Entwickler sich weigern das in die Standard-Presets mit aufzunehmen. Nachvollziehen könnte ich es bei diesem weitgehend subjektiven und wohl auch umstrittenen Tagg durchaus.

Dir bleibt immer die Wahl, eigene Presets zu entwickeln und sie allen Interessierten zur Verfügung zu stellen.

Edbert (EvanE)

Ok, auf wiki:Mechanical_Edit_Policy steht, dass es auch für Verbesserungen wie highway=grade1 → highway=track + tracktype=grade1 gilt. Das ist ähnlich dem, was ich vor habe.

Deswegen werde ich vorerst von dem Thema die Finger lassen, denn nur um smoohtness zu bereinigen, ist mir dann die Hürde doch zu hoch, das in englisch auszudiskutieren, nen neuen Account anzuslgen usw. Wenn das ganze Suchen&Ersetzen einfacher ginge (zB mit einem Programm, was alle anderen/fehlerhaften Tags auflistet, und man dahinter nur noch die Korrektur eingeben braucht, und das Programm auch den Rest macht), so dass man das auch sehr leicht für andere Tags anwenden kann, würds (für mich) erst Sinn machen.

Danke für eure Hinweise! Wenn, dann ist es sicher Sinnvoll, die nicht glasklaren Fälle wie terrible, catastrophic, extremly fucking bad, as bad as you can imagine, low, harvester und i nicht zu behandeln.

Ein Teil der Hürden kannst du ja umgehen, wenn du mal einen der bereits bestehenden Bot-Betreiber fragst, ob sie das dann umsetzen würden. Die entsprechende Diskussion auf tagging@lists.osm.org müsstest du natürlich trotzdem führen (wenn du es weltweit machen willst).

MfG Andi