Перевод названий всех городов

Кроме устоявшихся названий, существующих для наиболее известных объектов, все остальные не будут “русскими” - это будет транслитерация, транскрипция и частичный перевод.

Я не спрашиваю, зачем нужно слово “Лондон” - оно уже существует и его вполне можно записать в name:ru у того города, у которого name=London.
Я не понимаю, какой практический смысл в том, чтобы записывать русским алфавитом абсолютно все названия, устоявшийся вариант которых не существует. Это не решает никаких практических проблем.

Чтобы оперировать незнакомыми словами лучше их писать в оригинальном виде, а не кто во что горазд, что потом получаем изломанный телефон. Если кому-то что-то нужно будет найти, то он его будет или искать в оригинальном виде или в чьей-то транскрипции которая с высокой вероятностью может не совпасть в Вашей. Так что в баню все эти транскрипции и прочие сомадеятельности.

Я не хочу обсуждать что лучше, а что хуже, когда есть правила на этот счет.
Вообще не понимаю, как вы из ГОСТа сделали «кто во что горазд».

Транскрипция/транслитерация полезна при поиске (через геокодер или в навигаторе) тоесть я бы не сказал что это бесполезная штука, но вот на счет стоит ли тащить в name:* у меня есть сомнения.

Не хотите, а придется… На русском языке разговаривают и пишут не только в России (Казахстан, Украина), и ГОСТы у них могут быть совсем другие, к России не имеющие НИКАКОГО отношения. Например для name:ru и name:kk в Казахстане есть нормальный КАТО, который ставит в однозначное соответствие названия русских сёл казахскому написанию и наоборот - названия аулов по-русски.

ГОСТ определяет русское написание для карт, используемых на территории России. Для остальных стран этот ГОСТ побоку (хотя в большинстве случаев можно договориться).

Вы про который из ГОСТ-ов? Про ГОСТ 16876-71 ? Или про ГОСТ 7.79? Или про адаптацию ГОСТ 7.79-2000 ? Или всё-таки про ГОСТ Р 52535.1-2006? И про “система А” или “система Б” в этих ГОСТ-ах? :slight_smile:

Идея с отдельным тэгом auto_:ru мне кажется покрайней мере интересной. Особенно если рендер ещё будет выводить name:ru , если его нет, то возможно обращаться к auto_:ru , т.е. к тэгу который по-какому-нибудь признаку сформированому автоматически.

Так, а в чём проблема? Вроде мы живём в России. Так что я не вижу проблемы в том что тэг *:ru будет расчитан на нас говорящих на русском?

Тег name:ru в стране Казахстан рассчитан в первую очередь на русских, живущих в Казахстане, а не в России. Не надо узурпировать тег :smiley:
Есть же разница между british english и american english, хотя в обоих случаях используется name:en

PS: меня например тоже коробит, когда “русские немцы” употребляют в речи и письме слово “ойро”. А что поделаешь - на своей новой родине русские говорят по-другому…

Угу, нужно ещё уточнять, ru_RU или ru_KZ :smiley:

Кстати я тоже об этом подумал, но в данном случае не всё так запущено…
Хотя есть исключения. Например город name:ru=Алматы, а в России по-старинке станция метро name:ru=Алма-Атинская. Заметьте никто из казахстанцев не лезет переправлять.

Ok, вы пока придумайте 500 причин, почему ничего не нужно делать, а я завтра зайду.
Казахстан, чукчи-дальтоники, какой-нибудь пример в стиле «один на миллион»…

На данный момент я за тег transcription_name:<язык>.
Не auto_name, поскольку слово auto ничего не говорит о назначении тега, а инструкции тут никто не читает.

Проблема в том что вы хотите навязать свое мнение для использования исключительно в своих целях. Ну так будьте готовы что после worldwide-правки в большинстве стран её откатят как бесполезную и не несущую новых данных, а transcription_name:ru останется только у вас в Новой Зеландии.

  1. Уже десяток раз обсуждались подобные “автоматические генераторы данных”, и все они были забракованы;
  2. Судя по всему вам очень хочется одобрения сообщества на заливку вашей базы в ОСМ целиком. На это вам предложили сделать валидатор, в котором останутся только имена собственные, без траскрипции, и многие пользователи уже согласились помочь в проверке названий;
  3. Транскрипцию вы можете делать на стадии импорта;
  4. Вы можете делать транскрипцию на своем локальном промежуточным сервере: плагин SDS (Separate Data Store)

В последнем случае и волки сыты, и овцы целы - вы получаете доступ к обновляемой базе ОСМ (кто-то вносит новые объекты, вы их скачиваете в реальном времени), пользуетесь всеми благами ОСМ, но автоматическая транскрипция хранится на вашем локальном сервере (небольшой объем, только номера объектов-городов и дополнительные теги для них) и не мусорит в основной базе.

Какое именно? Оно менялось в ходе обсуждения. У меня есть определенные интересы и я их озвучил. Мне казалось, что эти интересы сильно пересекаются с интересами сообщества. Обратите внимание, что в этой ветке есть и другие люди, которым нужны русские названия иностранных объектов.

Во-первых, хотелось бы увидеть ссылки на обсуждение. Я находил пару тем (2008 и 2010 годы), в которых всё сводилось к чьему-то частному мнению. Кто-то предлагал переводить названия, кто-то — транслитерировать…

Во-вторых, не нужно называть это автоматическим генератором. Я не предлагаю делать автоматический герератор названий. Это сложно понять?

Что за бред? Наоборот, я хочу получить источник, откуда можно было бы загрузить базу целиком.
Я (как пользователь) говорю, что в базе OSM не хватает локализации иностранных названий. И отмечаю, что базу можно использовать не только для отрисовки PNG.

Конечно, мне хочется одобрения сообщества на любые действия с вашей базой. Я уважаю ваш труд.
А своей базы, которую можно было бы залить в ОСМ, у меня нет.

Ну, примерно это и предлагается. Только я не понимаю, почему вы называете это валидатором. У вас в базе нечего валидировать. Нужен добавлятор, а не валидатор. Импорт нужен.
Я уже частично сделал админку городов, но выяснилось, что в Википедии русские названия искать тяжело и это не очень эффективно. Хороший прирост названий дает база Geonames, но там часто попадаются ошибочные названия на русском.

У вас есть стереотипы насчет пакетного импорта? Думаете, пакетная заливка не может дать качественные данные? С этим нужно что-то сделать.

Вы сначала утрируете мое предложение до «автоматического генератора данных», отказываетесь от этого, а потом предлагаете мне воспользоваться этим методом? Так не пойдет.

Транскрипция — не такая простая задача, как многим кажется. Нельзя просто взять и обработать базу городов мира в автоматическом режиме. Есть множество причин, но главная причина в том, что у вас изначально кривая база названий. Теги *_name используются как попало, многие теги не заполнены.

Сама идея с транскрипцией родилась, когда оказалось, что в открытых источниках недостаточно русских названий.

skymeteo,

Поймите простую вещь, “русское название” - это название, которое употребимо в русском языке, и которое можно найти в материалах на русском языке - книгах, картах, радиопередачах, причем желательно больше одного раза.

Такие названия есть далеко не у всех объектов, даже не у всех городов. И их никогда и не будет хватать. Се ля ви.

Та или иная схема траслитерации, сама по себе, никак не может служить источником русского названия, пригодного для name:ru
Схем траслитерации существует много разных, и у всех предпочтения разные.

skymeteo,
Извините, но вам (и нам) лучше иметь валидатор. Причин несколько:

  1. Вам нужны одноразово эти города?
  2. Вы не предполагаете обновлять свою БД, как закончить?
    Если ответ да, то сделайте зеркало и напишите скрипт какой вам нужен и всё :).

Валидатор в отличии от импорта позволяет поддерживать и смотреть за информацией. Например в том же валидаторе ОКАТО не однократно ломали отношения границ.
А сделать хороший валидатор это задача не простая. На мой взгляд вам как минимум нужно разбить города по странам и областям. (т.е. что бы не было в куче)
Так же продумать схему цветов, схему изменений. Для того что бы отслеживать где в друг потёрли тэг. Удалили город. Переместили его на другой континент и т.д.
Что бы была заинтересованность закрасить всё в зелёный цвет и т.д.
Я бы привёл в качестве такого валидатора ОКАТО, но по техническим причинам он недоступен. Так что посмотрите другие валидаторы :wink:

Названия на латинице по моему транслитировать не стоит, они и так визуально воспринимаются. А вот всякие иероглифы нужно обязательно. Хотя бы для ориентирования, ведь не воспринимается даже визуально.

За идеей использовать транскрипцию воспоследовала идея сделать для нее отдельный тег.

Вы понимаете, откуда эти названия берутся, если уж они у каких-то объектов есть? Есть справочник, в котором десятки тысяч русских названий для иностранных объектов. Откуда они взялись?

Есть, конечно, сотня-другая городов, у которых есть исторические русские названия, заметно отличающиеся от транскрипции. Но они уже заполнены в OSM, к таким городам нет вопросов.

Не очень удачно, но хотя бы мешаться не будет.

Что касается самой идеи, то она обречена: данные эти в базе никому не нужны, поэтому поддерживать их никто не будет. Зато будут постоянные вопросы, что это и зачем, часть снесут, часть протухнет. Оставшиеся будут болтаться ненужным мусором, пока их централизованно не выпилят. В общем, повторится судьба cladr:* тегов.

Это если импорт будет не особо массовый. В случае большого импорта появятся возражения уже у DWG, и его откатят сразу.

skymeteo

Есть данные Natural Earth: «All versions of Natural Earth raster + vector map data found on this website are in the public domain».
Пойдёт.

Есть данные Geonames: «This work is licensed under a Creative Commons Attribution 3.0 License». Можно им написать и попросить разрешение использовать данные для OSM.
До получения разрешения - загружать в OSM нельзя.

Но мне кажется, наименования географических объектов — это общественное достояние. С численностью — вопрос.
Вам кажется, а у LWG может быть другое мнение и вашу правку откатят.

Мне присылали e-mail «исправьте пожалуйста пос. Железнодорожный, у него какие-то левые координаты» или «у вас в базе три Москвы».
Я лез в MySQL-базу и исправлял. На сайте никаких соглашений нет. Это какие условия?
Это никакие. У вас нет уверенности, что присылаемая вам информация не взята из гугл-мапс, яндекс-карт и т.п.
На мой взгляд, использовать нельзя.

Ну это уже перебор. Я же не копировать собираюсь, а показать пользователю, что на этот счет думает Википедия. И пользователь уже будет принимать решение насчет названий.
Как уже написали, интервики находится под CC0, т.е. перевод названий оттуда можно использовать.

Я просто называю вещи своими именами. Валидатор — это программа, проверяющая соответствие определенному правилу или формату.
У вас тут своя терминология. Вы называете валидатором скрипт полуавтоматического пакетного или более-менее ручного добавленя и редактирования данных.
http://toolserver.org/~kentaur/osm_wp/show_osm_wp.php?lang=uk — это не валидатор, это пакетный импорт.

Тут все боятся пакетных изменений. Извините, но я не буду называть пакетный импорт валидатором только из-за фобий сообщества :slight_smile:
О Боже, нет, он сказал «импорт»??

В остальном я согласен — нужен инструмент, который позволит не только добавлять данные, но и контролировать полноту существующей базы, т.к. с названиями там не все в порядке.

Но мы сейчас не интерфейс обсуждаем, а принципиальную возможность и необходимость вносить какие-то данные в базу. Выясняем, какие данные можно вносить.
Я не хочу делать инструмент, с помощью которого добавят 200 названий в ближайший год. А другой перспективы я пока не вижу, судя по этому обсуждению.
Одни данные не подходят по соображениям лицензионной нечистоты, другие просто недостаточно хороши для OSM… В итоге остаемся без перевода вообще.