А как я потом, скачав базу, отличу, где устоявшееся название, а где результат транскрипции Васи Пупкина, с алгоритмом которого я, может быть, не согласен?
Точно так же, как и сейчас — никак. Но вы сможете исправить эти названия, если посчитаете нужным.
А сейчас ситуация лучше? Вы считаете, что те полторы тысячи русских названий, которые есть в базе — это устоявшиеся названия? Или они соответствуют какому-то ГОСТу?
Предполагаю, что нет Поэтому я бы предпочёл видеть карту вообще с оригинальными названиями на местном языке (за исключением стран с иероглифами, но туда я обычно не суюсь)
Я позволю себе ненавязчиво напомнить, что транскрипция и транслитерация - это очень разные вещи.
Транскрипция (в контексте этой дискуссии) представляет из себя запись звучания слов на одном языке буквами алфавита другого языка.
Транслитерация - запись слов, которые написаны на одном языке, буквами алфавита другого языка по неким фиксированным правилам отображения с куда меньшим учетом особенностей звучания.
Первое может в случае больших фонетических различий между языками не только не добавлять понятности надписям, но и наоборот, хотя опознаванию названий на слух оно, теоретически, помочь может.
Второе, в свою очередь, позволяет читать и запоминать названия “для себя”, но совершенно не помогает использовать их правильно в коммуникации.
Так что в случае больших фонетических различий, ни транслитерация, ни транскрипция большой практической пользы все равно не несут, кроме, может быть, случая транскрипции/транслитерации с языков типа арабского, китайского или японского на использующие латинский алфавит или кириллицу.
Я к чему это все веду… Если у какого-то объекта нет внятного названия на другом языке, то все эти транслитерации и транскрипции его оригинального названия бесполезны, т.к. не решают никаких практических проблем (кроме упомянутой в предыдущем абзаце ситуации).
С чисто академической точки зрения, возможно, имеет смысл наличие транскрипции в IPA. Хотя что это такое и как ее читать, знает не больше пяти процентов образованных людей, но она хотя бы более однозначна, чем “Novobratszevskij”, “Лаусанне” (Лозанна), “Морлаикс” (Морлэ) или “Тов Лав” (Тоу Лоу).
Да, сейчас ситуация лучше. Сейчас name:ru ещё не зас*ан транслитерирующими ботами, поэтому с некоторой уверенностью можно предполагать, что само наличие name:ru соответствует наличию устоявшегося русского наименования.
Хотя желающие его понапрописывать появляются в среднем раз в год
Значит проблема действительно существует. У вас уже готов ответ на вопрос, почему бы не завести отдельный тег со смыслом «транскрипция оригинального названия в разные языки»?
Есть правила написания иностранных географических названий на российских картах. Тут не нужно мнение высказывать или придумывать что-то. Есть правила, стандарт. Российское OSM-сообщество игнорирует этот стандарт.
Ну если актуальная задача, могу написать, после того как свой супер пупер геокодер допишу :). Правда всякие суахили нафиг не нужны, хотелось бы для 10 распространенных языков но в обе стороны.
Есть int_name для “международной” транслитерации.
А дальше есть прицип any tags you like - записывай что угодно в любой тег, который не конфликтует с общепринятым.
Правила и стандарт?
Это вроде 120-страничного талмуда “Нормализация географических названий и ее топонимические основы”? Или штук тридцать “Инструкций по русской передаче географических названий …”?
Это не правила, это сборники прецедентов.
Ну и их существование никак не отвечает на вопрос “зачем”. По крайней мере, вне упомянутых мной случаев с китайским, японским и подобными языками.
Я несколько иначе понял его смысл, но ладно, пусть будет так.
Ok, давайте обсудим, насколько это приемлемо.
Мне кажется, такой тег был бы полезен. Например, transcription_name:<язык>. Описание: автоматическая транскрипция name в указанный язык (без связи с устоявшимися названиями). К сожалению, я не понимаю, какой из существующих тегов содержит чистое официальное местное название. Name часто содержит мусор в виде перевода на английский.
Правило заключается в том, что названия нужно писать по-русски. Как сделать русское название из нерусского? Тут есть правила и сборники прецедентов. Это уже технический вопрос.
Зачем это нужно? Чтобы русскоговорящие пользователи, не знающие иностранный язык, могли оперировать в своей речи и на письме этими словами. Вы не понимаете, зачем нужно слово «Лондон»?
По идее для него предназначен именно name.
Хуже с многоязычными территориями типа Каталонии (или даже Крыма) - там про name достоверно ничего предполагать нельзя.
Кроме устоявшихся названий, существующих для наиболее известных объектов, все остальные не будут “русскими” - это будет транслитерация, транскрипция и частичный перевод.
Я не спрашиваю, зачем нужно слово “Лондон” - оно уже существует и его вполне можно записать в name:ru у того города, у которого name=London.
Я не понимаю, какой практический смысл в том, чтобы записывать русским алфавитом абсолютно все названия, устоявшийся вариант которых не существует. Это не решает никаких практических проблем.
Чтобы оперировать незнакомыми словами лучше их писать в оригинальном виде, а не кто во что горазд, что потом получаем изломанный телефон. Если кому-то что-то нужно будет найти, то он его будет или искать в оригинальном виде или в чьей-то транскрипции которая с высокой вероятностью может не совпасть в Вашей. Так что в баню все эти транскрипции и прочие сомадеятельности.
Транскрипция/транслитерация полезна при поиске (через геокодер или в навигаторе) тоесть я бы не сказал что это бесполезная штука, но вот на счет стоит ли тащить в name:* у меня есть сомнения.
Не хотите, а придется… На русском языке разговаривают и пишут не только в России (Казахстан, Украина), и ГОСТы у них могут быть совсем другие, к России не имеющие НИКАКОГО отношения. Например для name:ru и name:kk в Казахстане есть нормальный КАТО, который ставит в однозначное соответствие названия русских сёл казахскому написанию и наоборот - названия аулов по-русски.
ГОСТ определяет русское написание для карт, используемых на территории России. Для остальных стран этот ГОСТ побоку (хотя в большинстве случаев можно договориться).
Вы про который из ГОСТ-ов? Про ГОСТ 16876-71 ? Или про ГОСТ 7.79? Или про адаптацию ГОСТ 7.79-2000 ? Или всё-таки про ГОСТ Р 52535.1-2006? И про “система А” или “система Б” в этих ГОСТ-ах?