Перевод названий всех городов

Ну ещё бы, вы вместо использования базы OSM ввязались в непонятный спор о массовых правках в OSM, которые лично вам нафиг не нужны. :3

skymeteo, сделайте валидатор, который был бы удобен в данном редактировании. И кто знает, сколько реально человек займуться выпиливанием валидатора. (обязательное условие частое его обновление например раз вдень)
И 70к объектов это не так много :), особенно если требуется проверить всего лишь правильность его положения по википедии. Или тут ещё какие-то тонкости?

Почему он вдруг некорректный? Какой язык используется, тот и будет транлитерироваться/транскрибироваться.
У меня вон есть плагин, который прогоняет названия через Яндекс.Перевод, тоже неплохой результат получается.

Допустим, вам нужно показать карту турции в русскоязычном интерфейсе. Какой план?

Дык уже: http://forum.openstreetmap.org/viewtopic.php?pid=305084#p305084

liosha, вы можете рассказать по пунктам алгоритм преобразования названий? Какие теги брали, что с ними делали?

Где есть, брал name:ru, где нет, прогонял name через арабско-русскую транскрипцию.

А как я потом, скачав базу, отличу, где устоявшееся название, а где результат транскрипции Васи Пупкина, с алгоритмом которого я, может быть, не согласен?

Точно так же, как и сейчас — никак. Но вы сможете исправить эти названия, если посчитаете нужным.

А сейчас ситуация лучше? Вы считаете, что те полторы тысячи русских названий, которые есть в базе — это устоявшиеся названия? Или они соответствуют какому-то ГОСТу?

Ну да, у меня такой же план. А какой алгоритм арабско-русской транскрипции был использован?

Предполагаю, что нет :slight_smile: Поэтому я бы предпочёл видеть карту вообще с оригинальными названиями на местном языке (за исключением стран с иероглифами, но туда я обычно не суюсь)

Я позволю себе ненавязчиво напомнить, что транскрипция и транслитерация - это очень разные вещи.
Транскрипция (в контексте этой дискуссии) представляет из себя запись звучания слов на одном языке буквами алфавита другого языка.
Транслитерация - запись слов, которые написаны на одном языке, буквами алфавита другого языка по неким фиксированным правилам отображения с куда меньшим учетом особенностей звучания.

Первое может в случае больших фонетических различий между языками не только не добавлять понятности надписям, но и наоборот, хотя опознаванию названий на слух оно, теоретически, помочь может.
Второе, в свою очередь, позволяет читать и запоминать названия “для себя”, но совершенно не помогает использовать их правильно в коммуникации.

Так что в случае больших фонетических различий, ни транслитерация, ни транскрипция большой практической пользы все равно не несут, кроме, может быть, случая транскрипции/транслитерации с языков типа арабского, китайского или японского на использующие латинский алфавит или кириллицу.

Я к чему это все веду… Если у какого-то объекта нет внятного названия на другом языке, то все эти транслитерации и транскрипции его оригинального названия бесполезны, т.к. не решают никаких практических проблем (кроме упомянутой в предыдущем абзаце ситуации).

С чисто академической точки зрения, возможно, имеет смысл наличие транскрипции в IPA. Хотя что это такое и как ее читать, знает не больше пяти процентов образованных людей, но она хотя бы более однозначна, чем “Novobratszevskij”, “Лаусанне” (Лозанна), “Морлаикс” (Морлэ) или “Тов Лав” (Тоу Лоу).

Упрощённая http://ru.wikipedia.org/wiki/%C0%F0%E0%E1%F1%EA%EE-%F0%F3%F1%F1%EA%E0%FF_%EF%F0%E0%EA%F2%E8%F7%E5%F1%EA%E0%FF_%F2%F0%E0%ED%F1%EA%F0%E8%EF%F6%E8%FF

Да, сейчас ситуация лучше. Сейчас name:ru ещё не зас*ан транслитерирующими ботами, поэтому с некоторой уверенностью можно предполагать, что само наличие name:ru соответствует наличию устоявшегося русского наименования.

Хотя желающие его понапрописывать появляются в среднем раз в год :smiley:

Значит проблема действительно существует. У вас уже готов ответ на вопрос, почему бы не завести отдельный тег со смыслом «транскрипция оригинального названия в разные языки»?

Есть правила написания иностранных географических названий на российских картах. Тут не нужно мнение высказывать или придумывать что-то. Есть правила, стандарт. Российское OSM-сообщество игнорирует этот стандарт.

Ну если актуальная задача, могу написать, после того как свой супер пупер геокодер допишу :). Правда всякие суахили нафиг не нужны, хотелось бы для 10 распространенных языков но в обе стороны.

Есть int_name для “международной” транслитерации.
А дальше есть прицип any tags you like - записывай что угодно в любой тег, который не конфликтует с общепринятым.

Правила и стандарт?
Это вроде 120-страничного талмуда “Нормализация географических названий и ее топонимические основы”? Или штук тридцать “Инструкций по русской передаче географических названий …”?

Это не правила, это сборники прецедентов.

Ну и их существование никак не отвечает на вопрос “зачем”. По крайней мере, вне упомянутых мной случаев с китайским, японским и подобными языками.

Я несколько иначе понял его смысл, но ладно, пусть будет так.

Ok, давайте обсудим, насколько это приемлемо.
Мне кажется, такой тег был бы полезен. Например, transcription_name:<язык>. Описание: автоматическая транскрипция name в указанный язык (без связи с устоявшимися названиями). К сожалению, я не понимаю, какой из существующих тегов содержит чистое официальное местное название. Name часто содержит мусор в виде перевода на английский.

Правило заключается в том, что названия нужно писать по-русски. Как сделать русское название из нерусского? Тут есть правила и сборники прецедентов. Это уже технический вопрос.

Зачем это нужно? Чтобы русскоговорящие пользователи, не знающие иностранный язык, могли оперировать в своей речи и на письме этими словами. Вы не понимаете, зачем нужно слово «Лондон»?

По идее для него предназначен именно name.
Хуже с многоязычными территориями типа Каталонии (или даже Крыма) - там про name достоверно ничего предполагать нельзя.