Допустим, вам нужно показать карту турции в русскоязычном интерфейсе. Какой план?
liosha, вы можете рассказать по пунктам алгоритм преобразования названий? Какие теги брали, что с ними делали?
Где есть, брал name:ru, где нет, прогонял name через арабско-русскую транскрипцию.
А как я потом, скачав базу, отличу, где устоявшееся название, а где результат транскрипции Васи Пупкина, с алгоритмом которого я, может быть, не согласен?
Точно так же, как и сейчас — никак. Но вы сможете исправить эти названия, если посчитаете нужным.
А сейчас ситуация лучше? Вы считаете, что те полторы тысячи русских названий, которые есть в базе — это устоявшиеся названия? Или они соответствуют какому-то ГОСТу?
Ну да, у меня такой же план. А какой алгоритм арабско-русской транскрипции был использован?
Предполагаю, что нет Поэтому я бы предпочёл видеть карту вообще с оригинальными названиями на местном языке (за исключением стран с иероглифами, но туда я обычно не суюсь)
Я позволю себе ненавязчиво напомнить, что транскрипция и транслитерация - это очень разные вещи.
Транскрипция (в контексте этой дискуссии) представляет из себя запись звучания слов на одном языке буквами алфавита другого языка.
Транслитерация - запись слов, которые написаны на одном языке, буквами алфавита другого языка по неким фиксированным правилам отображения с куда меньшим учетом особенностей звучания.
Первое может в случае больших фонетических различий между языками не только не добавлять понятности надписям, но и наоборот, хотя опознаванию названий на слух оно, теоретически, помочь может.
Второе, в свою очередь, позволяет читать и запоминать названия “для себя”, но совершенно не помогает использовать их правильно в коммуникации.
Так что в случае больших фонетических различий, ни транслитерация, ни транскрипция большой практической пользы все равно не несут, кроме, может быть, случая транскрипции/транслитерации с языков типа арабского, китайского или японского на использующие латинский алфавит или кириллицу.
Я к чему это все веду… Если у какого-то объекта нет внятного названия на другом языке, то все эти транслитерации и транскрипции его оригинального названия бесполезны, т.к. не решают никаких практических проблем (кроме упомянутой в предыдущем абзаце ситуации).
С чисто академической точки зрения, возможно, имеет смысл наличие транскрипции в IPA. Хотя что это такое и как ее читать, знает не больше пяти процентов образованных людей, но она хотя бы более однозначна, чем “Novobratszevskij”, “Лаусанне” (Лозанна), “Морлаикс” (Морлэ) или “Тов Лав” (Тоу Лоу).
Да, сейчас ситуация лучше. Сейчас name:ru ещё не зас*ан транслитерирующими ботами, поэтому с некоторой уверенностью можно предполагать, что само наличие name:ru соответствует наличию устоявшегося русского наименования.
Хотя желающие его понапрописывать появляются в среднем раз в год
Значит проблема действительно существует. У вас уже готов ответ на вопрос, почему бы не завести отдельный тег со смыслом «транскрипция оригинального названия в разные языки»?
Есть правила написания иностранных географических названий на российских картах. Тут не нужно мнение высказывать или придумывать что-то. Есть правила, стандарт. Российское OSM-сообщество игнорирует этот стандарт.
Ну если актуальная задача, могу написать, после того как свой супер пупер геокодер допишу :). Правда всякие суахили нафиг не нужны, хотелось бы для 10 распространенных языков но в обе стороны.
У вас уже готов ответ на вопрос, почему бы не завести отдельный тег со смыслом «транскрипция оригинального названия в разные языки»?
Есть int_name для “международной” транслитерации.
А дальше есть прицип any tags you like - записывай что угодно в любой тег, который не конфликтует с общепринятым.
Есть правила написания иностранных географических названий на российских картах. Тут не нужно мнение высказывать или придумывать что-то. Есть правила, стандарт. Российское OSM-сообщество игнорирует этот стандарт.
Правила и стандарт?
Это вроде 120-страничного талмуда “Нормализация географических названий и ее топонимические основы”? Или штук тридцать “Инструкций по русской передаче географических названий …”?
Это не правила, это сборники прецедентов.
Ну и их существование никак не отвечает на вопрос “зачем”. По крайней мере, вне упомянутых мной случаев с китайским, японским и подобными языками.
Есть int_name для “международной” транслитерации.
Я несколько иначе понял его смысл, но ладно, пусть будет так.
А дальше есть прицип any tags you like - записывай что угодно в любой тег, который не конфликтует с общепринятым.
Ok, давайте обсудим, насколько это приемлемо.
Мне кажется, такой тег был бы полезен. Например, transcription_name:<язык>. Описание: автоматическая транскрипция name в указанный язык (без связи с устоявшимися названиями). К сожалению, я не понимаю, какой из существующих тегов содержит чистое официальное местное название. Name часто содержит мусор в виде перевода на английский.
Это не правила, это сборники прецедентов.
Ну и их существование никак не отвечает на вопрос “зачем”.
Правило заключается в том, что названия нужно писать по-русски. Как сделать русское название из нерусского? Тут есть правила и сборники прецедентов. Это уже технический вопрос.
Зачем это нужно? Чтобы русскоговорящие пользователи, не знающие иностранный язык, могли оперировать в своей речи и на письме этими словами. Вы не понимаете, зачем нужно слово «Лондон»?
К сожалению, я не понимаю, какой из существующих тегов содержит чистое официальное местное название. Name часто содержит мусор в виде перевода на английский.
По идее для него предназначен именно name.
Хуже с многоязычными территориями типа Каталонии (или даже Крыма) - там про name достоверно ничего предполагать нельзя.
Ну и их существование никак не отвечает на вопрос “зачем”. По крайней мере, вне упомянутых мной случаев с китайским, японским и подобными языками.
Когда такой картой пользуются внутри русскоязычной тусовки, она вполне оправдана.
Правило заключается в том, что названия нужно писать по-русски. Как сделать русское название из нерусского? Тут есть правила и сборники прецедентов. Это уже технический вопрос.
Зачем это нужно? Чтобы русскоговорящие пользователи, не знающие иностранный язык, могли оперировать в своей речи и на письме этими словами. Вы не понимаете, зачем нужно слово «Лондон»?
Кроме устоявшихся названий, существующих для наиболее известных объектов, все остальные не будут “русскими” - это будет транслитерация, транскрипция и частичный перевод.
Я не спрашиваю, зачем нужно слово “Лондон” - оно уже существует и его вполне можно записать в name:ru у того города, у которого name=London.
Я не понимаю, какой практический смысл в том, чтобы записывать русским алфавитом абсолютно все названия, устоявшийся вариант которых не существует. Это не решает никаких практических проблем.
Чтобы оперировать незнакомыми словами лучше их писать в оригинальном виде, а не кто во что горазд, что потом получаем изломанный телефон. Если кому-то что-то нужно будет найти, то он его будет или искать в оригинальном виде или в чьей-то транскрипции которая с высокой вероятностью может не совпасть в Вашей. Так что в баню все эти транскрипции и прочие сомадеятельности.