Ich hab mir die Diskussionen unter euren Links (danke!) nochmal angeschaut und hab versucht nachzuvollziehen wie das ganze in die OSM-Welt kam.
In diesem Talk wird ein Problem bei einem HOT Projekt beschrieben, in dem sie Daten manuell importierten und dabei allerdings mal die Variante alt_name:2 und mal alt_name_2 verwendet haben. Die Person wollte das nun mit einem vollmechanischen Edit alles auf alt_name_2 ändern, aber nicht nur im Gebiet des Hot Projekts sondern am liebsten auch weltweit.
Das wurde wohl auch extra mit Twain vom Nominatim Team abgesprochen, der dafür einen Patch geschrieben hat damit diese alternativen (alt_name_n) auch berücksichtigt werden. Allerdings war das sonst wohl nicht weiter abgesprochen und dementsprechend entstand eine etwas hitzige Diskussion weil die Variante mit dem Semikolon schon existierte und vorgezogen werden sollte. (wie genau die Diskussion verlief könnt ihr ja nachlesen bei Interesse).
Auf jeden Fall gibt es diese alt_name_n Variante nun knapp 4000 mal in einem Gebiet in Westafrika (http://overpass-turbo.eu/s/4ZL) und eher selten ausserhalb dieses Gebietes.
Allerdings hat Twain (von Nominatim) diese Variante dann im November 2014 ins Wiki geschrieben und damit dokumentiert
mit extra Hinweis darauf, dass ‘;’-Listen vermieden werden sollen, ist ihm das also ein Anliegen?
Im April 2015 wurde dann nochmal präzisiert, dass das dann verwendet werden soll wenn die Zeichenanzahl für die Kommata-Listen nicht mehr ausreichen (so sol man den Satz wohl verstehen, die deutsche Übersetzung war dann noch schlimmer)
Die Dokumentation von name_x kam dann erst im August dazu und basiert wohl nicht auf irgendwelchen Proposals oder Diskussionen sondern auf dem puren Vorhandensein dieses Tags:
Was auch immer man allgemein jetzt von diesen Werten halten will, die Dokumentation im Wiki ist meiner Meinung nach jeweils recht schlecht geraten.
Jetzt könnte man natürlich vermuten, dass das hohe Aufkommen von name_x durch den ID Editor entstanden ist. Interessant dazu wäre ja mal eine historische Entwicklung, gibt es dafür ein Tool? Also ein Taginfo das die Anzahl in der Vergangenheit erhebt? Den ID gibt es ja noch nicht soo lang. Außerdem wäre ein Zusammenhang zwischen “Changeset der mit ID gemacht wurde” und “name_x ist neu getaggt worden” Interessant. Stichproben nach zumindest bestätigt sich, dass das zusammengehört.
Allerdings geht das Problem dann ja auch weiter, wenn man den ID betrachtet. Denn wie in einem der verlinkten Beiträgen auch schon erwähnt wird:
Wie in dem Thread gezeigt wird, handelt es sich übrigens nicht um einen Bug sondern ein Feature, ist also extra eingebaut, wie es dazu kam zeigen diese Kommentare von den Entwicklern:
Also anstatt einer Warnung oder Erklärung baut der ID da eine “Lösung” die die Daten vermüllt und, noch schlimmer, die Leute darin trainiert das auch selbst weiter zu machen. Eigentlich wollte jemand dazu was in den ID Bugtracker schreiben, ich weiß aber nicht ob dass dann passiert ist?
Dieses Verhalten vom ID sollte auf jeden Fall aufgehalten werden weil es völlig unkontrolliert ist und sich ja auch nicht nur auf name_x oder alt_name_x bezieht sondern noch viel mehr Blüten treibt (schöne Beispiele gibts in dem verlinkten Thread).
Trotzdem weiß ich nicht, ob man generell sagen kann “braucht man nicht, muss weg, semikolon ist besser”. Natürlich hat sich zuallererst mal das Semikolon etabliert, auch mit dem Argmument, dass sich das besser auswerten liesse. Das wundert mich allerdings ein bisschen, zwar kann ich das total nachvollziehen für Fälle in denen ich mir einen bestimmten Datensatz genau anschaue. Aber für Programme wie Nominatim beispielsweise die in den Daten suchen ist das doch viel komplizierter / kostenreicher weil dann reguläre Ausdrücke etc. genutzt werden müssen. Allerdings werden sich diese Programme wahrscheinlich sowieso einen eigenen Index zusammenbasteln womit das dann schon wieder obsolet wird.
Viel wichtiger finde ich aber zu beachten, dass es in manchen Ländern nicht so eindeutig festgelegte offizielle Namen gibt und da dann vielleicht wirklich mehrere Namen vorkommen könnten, die den Rahmen von 255 Zeichen sprengen würden? Wahrscheinlich kommt das aber auch nicht wirklich oft vor und wahrscheinlich könnte man das oft mit sprachenspezifischen Name-Tagging auffangen. Ich fänd nur wichtig, dass diese Möglichkeit auch Bestandteil der Diskussion ist. Ich hab mir das nochmal grob in Sierra Leone angeschaut wo es die 4000 alt_name_x gibt. Mir scheint, dass es sich dabei auch eher um sprachliche Variationen handelt, aber hab da natürlich keine Ahnung. Auf jeden Fall seh ich aber auch keinen wirklichen Grund, warum da nicht das Semikolon Tagging verwendet wurde. Für die menschlichen Augen sind die multiplen Tags halt einfacher zu erfassen, das ist glaub ich ein Knackpunkt bei der gesamten Geschichte.
Auf jeden Fall gefällt mir der Vorschlag, darauf hinzuweisen dass immer erst die semantisch reicheren name Tags verwendet werden sollte, dann erst alt_name und im absoluten Ausnahmefall wenn die 255 Zeichen von alt_name nicht ausreichen noch alt_name_1. Aber dann sollte man sich auc nicht wundern wenn das nicht ausgewertet werden kann (sollte eigentlich auch nicht vorkommen der Fall). Problematisch ist, dass viele wahrscheinlich überfordert sind mit der Unterscheidung zwischen den einzelnen Name-Tags, oder auch Operator und Brand etc. Da muss wahrschienlich mehr Arbeit ins Wiki gesteckt werden.
Und name_1 is halt leichter, und der Editor machts ja auch so und es steht sogar im Wiki, da darf man sich nunmal nicht wundern…
Also Fazit:
- gibt es einen Bugtracker Report dazu im ID? Ich hab keinen gefunden
- Weiß jemand wie man mal auswerten kann seit wann der name_1 benutzt wird oder wie der mit ID changesets zusammenhängt (oder mit Mappern die vorher ID benutzt haben, das wär die Königsaufgabe ;))
- Kann ich name_1 und alt_name_1 aus dem Wiki hauen? zumindest aus dem deutschen? Oder wo müsste man dazu noch diskutieren etc? raushauen = empfehlen das nicht zu verwenden etc.