Перевод названий всех городов

Ну если актуальная задача, могу написать, после того как свой супер пупер геокодер допишу :). Правда всякие суахили нафиг не нужны, хотелось бы для 10 распространенных языков но в обе стороны.

Есть int_name для “международной” транслитерации.
А дальше есть прицип any tags you like - записывай что угодно в любой тег, который не конфликтует с общепринятым.

Правила и стандарт?
Это вроде 120-страничного талмуда “Нормализация географических названий и ее топонимические основы”? Или штук тридцать “Инструкций по русской передаче географических названий …”?

Это не правила, это сборники прецедентов.

Ну и их существование никак не отвечает на вопрос “зачем”. По крайней мере, вне упомянутых мной случаев с китайским, японским и подобными языками.

Я несколько иначе понял его смысл, но ладно, пусть будет так.

Ok, давайте обсудим, насколько это приемлемо.
Мне кажется, такой тег был бы полезен. Например, transcription_name:<язык>. Описание: автоматическая транскрипция name в указанный язык (без связи с устоявшимися названиями). К сожалению, я не понимаю, какой из существующих тегов содержит чистое официальное местное название. Name часто содержит мусор в виде перевода на английский.

Правило заключается в том, что названия нужно писать по-русски. Как сделать русское название из нерусского? Тут есть правила и сборники прецедентов. Это уже технический вопрос.

Зачем это нужно? Чтобы русскоговорящие пользователи, не знающие иностранный язык, могли оперировать в своей речи и на письме этими словами. Вы не понимаете, зачем нужно слово «Лондон»?

По идее для него предназначен именно name.
Хуже с многоязычными территориями типа Каталонии (или даже Крыма) - там про name достоверно ничего предполагать нельзя.

Когда такой картой пользуются внутри русскоязычной тусовки, она вполне оправдана.

Кроме устоявшихся названий, существующих для наиболее известных объектов, все остальные не будут “русскими” - это будет транслитерация, транскрипция и частичный перевод.

Я не спрашиваю, зачем нужно слово “Лондон” - оно уже существует и его вполне можно записать в name:ru у того города, у которого name=London.
Я не понимаю, какой практический смысл в том, чтобы записывать русским алфавитом абсолютно все названия, устоявшийся вариант которых не существует. Это не решает никаких практических проблем.

Чтобы оперировать незнакомыми словами лучше их писать в оригинальном виде, а не кто во что горазд, что потом получаем изломанный телефон. Если кому-то что-то нужно будет найти, то он его будет или искать в оригинальном виде или в чьей-то транскрипции которая с высокой вероятностью может не совпасть в Вашей. Так что в баню все эти транскрипции и прочие сомадеятельности.

Я не хочу обсуждать что лучше, а что хуже, когда есть правила на этот счет.
Вообще не понимаю, как вы из ГОСТа сделали «кто во что горазд».

Транскрипция/транслитерация полезна при поиске (через геокодер или в навигаторе) тоесть я бы не сказал что это бесполезная штука, но вот на счет стоит ли тащить в name:* у меня есть сомнения.

Не хотите, а придется… На русском языке разговаривают и пишут не только в России (Казахстан, Украина), и ГОСТы у них могут быть совсем другие, к России не имеющие НИКАКОГО отношения. Например для name:ru и name:kk в Казахстане есть нормальный КАТО, который ставит в однозначное соответствие названия русских сёл казахскому написанию и наоборот - названия аулов по-русски.

ГОСТ определяет русское написание для карт, используемых на территории России. Для остальных стран этот ГОСТ побоку (хотя в большинстве случаев можно договориться).

Вы про который из ГОСТ-ов? Про ГОСТ 16876-71 ? Или про ГОСТ 7.79? Или про адаптацию ГОСТ 7.79-2000 ? Или всё-таки про ГОСТ Р 52535.1-2006? И про “система А” или “система Б” в этих ГОСТ-ах? :slight_smile:

Идея с отдельным тэгом auto_:ru мне кажется покрайней мере интересной. Особенно если рендер ещё будет выводить name:ru , если его нет, то возможно обращаться к auto_:ru , т.е. к тэгу который по-какому-нибудь признаку сформированому автоматически.

Так, а в чём проблема? Вроде мы живём в России. Так что я не вижу проблемы в том что тэг *:ru будет расчитан на нас говорящих на русском?

Тег name:ru в стране Казахстан рассчитан в первую очередь на русских, живущих в Казахстане, а не в России. Не надо узурпировать тег :smiley:
Есть же разница между british english и american english, хотя в обоих случаях используется name:en

PS: меня например тоже коробит, когда “русские немцы” употребляют в речи и письме слово “ойро”. А что поделаешь - на своей новой родине русские говорят по-другому…

Угу, нужно ещё уточнять, ru_RU или ru_KZ :smiley:

Кстати я тоже об этом подумал, но в данном случае не всё так запущено…
Хотя есть исключения. Например город name:ru=Алматы, а в России по-старинке станция метро name:ru=Алма-Атинская. Заметьте никто из казахстанцев не лезет переправлять.

Ok, вы пока придумайте 500 причин, почему ничего не нужно делать, а я завтра зайду.
Казахстан, чукчи-дальтоники, какой-нибудь пример в стиле «один на миллион»…

На данный момент я за тег transcription_name:<язык>.
Не auto_name, поскольку слово auto ничего не говорит о назначении тега, а инструкции тут никто не читает.

Проблема в том что вы хотите навязать свое мнение для использования исключительно в своих целях. Ну так будьте готовы что после worldwide-правки в большинстве стран её откатят как бесполезную и не несущую новых данных, а transcription_name:ru останется только у вас в Новой Зеландии.

  1. Уже десяток раз обсуждались подобные “автоматические генераторы данных”, и все они были забракованы;
  2. Судя по всему вам очень хочется одобрения сообщества на заливку вашей базы в ОСМ целиком. На это вам предложили сделать валидатор, в котором останутся только имена собственные, без траскрипции, и многие пользователи уже согласились помочь в проверке названий;
  3. Транскрипцию вы можете делать на стадии импорта;
  4. Вы можете делать транскрипцию на своем локальном промежуточным сервере: плагин SDS (Separate Data Store)

В последнем случае и волки сыты, и овцы целы - вы получаете доступ к обновляемой базе ОСМ (кто-то вносит новые объекты, вы их скачиваете в реальном времени), пользуетесь всеми благами ОСМ, но автоматическая транскрипция хранится на вашем локальном сервере (небольшой объем, только номера объектов-городов и дополнительные теги для них) и не мусорит в основной базе.

Какое именно? Оно менялось в ходе обсуждения. У меня есть определенные интересы и я их озвучил. Мне казалось, что эти интересы сильно пересекаются с интересами сообщества. Обратите внимание, что в этой ветке есть и другие люди, которым нужны русские названия иностранных объектов.

Во-первых, хотелось бы увидеть ссылки на обсуждение. Я находил пару тем (2008 и 2010 годы), в которых всё сводилось к чьему-то частному мнению. Кто-то предлагал переводить названия, кто-то — транслитерировать…

Во-вторых, не нужно называть это автоматическим генератором. Я не предлагаю делать автоматический герератор названий. Это сложно понять?

Что за бред? Наоборот, я хочу получить источник, откуда можно было бы загрузить базу целиком.
Я (как пользователь) говорю, что в базе OSM не хватает локализации иностранных названий. И отмечаю, что базу можно использовать не только для отрисовки PNG.

Конечно, мне хочется одобрения сообщества на любые действия с вашей базой. Я уважаю ваш труд.
А своей базы, которую можно было бы залить в ОСМ, у меня нет.

Ну, примерно это и предлагается. Только я не понимаю, почему вы называете это валидатором. У вас в базе нечего валидировать. Нужен добавлятор, а не валидатор. Импорт нужен.
Я уже частично сделал админку городов, но выяснилось, что в Википедии русские названия искать тяжело и это не очень эффективно. Хороший прирост названий дает база Geonames, но там часто попадаются ошибочные названия на русском.

У вас есть стереотипы насчет пакетного импорта? Думаете, пакетная заливка не может дать качественные данные? С этим нужно что-то сделать.

Вы сначала утрируете мое предложение до «автоматического генератора данных», отказываетесь от этого, а потом предлагаете мне воспользоваться этим методом? Так не пойдет.

Транскрипция — не такая простая задача, как многим кажется. Нельзя просто взять и обработать базу городов мира в автоматическом режиме. Есть множество причин, но главная причина в том, что у вас изначально кривая база названий. Теги *_name используются как попало, многие теги не заполнены.

Сама идея с транскрипцией родилась, когда оказалось, что в открытых источниках недостаточно русских названий.