Перевод названий всех городов

Проблема в том что вы хотите навязать свое мнение для использования исключительно в своих целях. Ну так будьте готовы что после worldwide-правки в большинстве стран её откатят как бесполезную и не несущую новых данных, а transcription_name:ru останется только у вас в Новой Зеландии.

  1. Уже десяток раз обсуждались подобные “автоматические генераторы данных”, и все они были забракованы;
  2. Судя по всему вам очень хочется одобрения сообщества на заливку вашей базы в ОСМ целиком. На это вам предложили сделать валидатор, в котором останутся только имена собственные, без траскрипции, и многие пользователи уже согласились помочь в проверке названий;
  3. Транскрипцию вы можете делать на стадии импорта;
  4. Вы можете делать транскрипцию на своем локальном промежуточным сервере: плагин SDS (Separate Data Store)

В последнем случае и волки сыты, и овцы целы - вы получаете доступ к обновляемой базе ОСМ (кто-то вносит новые объекты, вы их скачиваете в реальном времени), пользуетесь всеми благами ОСМ, но автоматическая транскрипция хранится на вашем локальном сервере (небольшой объем, только номера объектов-городов и дополнительные теги для них) и не мусорит в основной базе.

Какое именно? Оно менялось в ходе обсуждения. У меня есть определенные интересы и я их озвучил. Мне казалось, что эти интересы сильно пересекаются с интересами сообщества. Обратите внимание, что в этой ветке есть и другие люди, которым нужны русские названия иностранных объектов.

Во-первых, хотелось бы увидеть ссылки на обсуждение. Я находил пару тем (2008 и 2010 годы), в которых всё сводилось к чьему-то частному мнению. Кто-то предлагал переводить названия, кто-то — транслитерировать…

Во-вторых, не нужно называть это автоматическим генератором. Я не предлагаю делать автоматический герератор названий. Это сложно понять?

Что за бред? Наоборот, я хочу получить источник, откуда можно было бы загрузить базу целиком.
Я (как пользователь) говорю, что в базе OSM не хватает локализации иностранных названий. И отмечаю, что базу можно использовать не только для отрисовки PNG.

Конечно, мне хочется одобрения сообщества на любые действия с вашей базой. Я уважаю ваш труд.
А своей базы, которую можно было бы залить в ОСМ, у меня нет.

Ну, примерно это и предлагается. Только я не понимаю, почему вы называете это валидатором. У вас в базе нечего валидировать. Нужен добавлятор, а не валидатор. Импорт нужен.
Я уже частично сделал админку городов, но выяснилось, что в Википедии русские названия искать тяжело и это не очень эффективно. Хороший прирост названий дает база Geonames, но там часто попадаются ошибочные названия на русском.

У вас есть стереотипы насчет пакетного импорта? Думаете, пакетная заливка не может дать качественные данные? С этим нужно что-то сделать.

Вы сначала утрируете мое предложение до «автоматического генератора данных», отказываетесь от этого, а потом предлагаете мне воспользоваться этим методом? Так не пойдет.

Транскрипция — не такая простая задача, как многим кажется. Нельзя просто взять и обработать базу городов мира в автоматическом режиме. Есть множество причин, но главная причина в том, что у вас изначально кривая база названий. Теги *_name используются как попало, многие теги не заполнены.

Сама идея с транскрипцией родилась, когда оказалось, что в открытых источниках недостаточно русских названий.

skymeteo,

Поймите простую вещь, “русское название” - это название, которое употребимо в русском языке, и которое можно найти в материалах на русском языке - книгах, картах, радиопередачах, причем желательно больше одного раза.

Такие названия есть далеко не у всех объектов, даже не у всех городов. И их никогда и не будет хватать. Се ля ви.

Та или иная схема траслитерации, сама по себе, никак не может служить источником русского названия, пригодного для name:ru
Схем траслитерации существует много разных, и у всех предпочтения разные.

skymeteo,
Извините, но вам (и нам) лучше иметь валидатор. Причин несколько:

  1. Вам нужны одноразово эти города?
  2. Вы не предполагаете обновлять свою БД, как закончить?
    Если ответ да, то сделайте зеркало и напишите скрипт какой вам нужен и всё :).

Валидатор в отличии от импорта позволяет поддерживать и смотреть за информацией. Например в том же валидаторе ОКАТО не однократно ломали отношения границ.
А сделать хороший валидатор это задача не простая. На мой взгляд вам как минимум нужно разбить города по странам и областям. (т.е. что бы не было в куче)
Так же продумать схему цветов, схему изменений. Для того что бы отслеживать где в друг потёрли тэг. Удалили город. Переместили его на другой континент и т.д.
Что бы была заинтересованность закрасить всё в зелёный цвет и т.д.
Я бы привёл в качестве такого валидатора ОКАТО, но по техническим причинам он недоступен. Так что посмотрите другие валидаторы :wink:

Названия на латинице по моему транслитировать не стоит, они и так визуально воспринимаются. А вот всякие иероглифы нужно обязательно. Хотя бы для ориентирования, ведь не воспринимается даже визуально.

За идеей использовать транскрипцию воспоследовала идея сделать для нее отдельный тег.

Вы понимаете, откуда эти названия берутся, если уж они у каких-то объектов есть? Есть справочник, в котором десятки тысяч русских названий для иностранных объектов. Откуда они взялись?

Есть, конечно, сотня-другая городов, у которых есть исторические русские названия, заметно отличающиеся от транскрипции. Но они уже заполнены в OSM, к таким городам нет вопросов.

Не очень удачно, но хотя бы мешаться не будет.

Что касается самой идеи, то она обречена: данные эти в базе никому не нужны, поэтому поддерживать их никто не будет. Зато будут постоянные вопросы, что это и зачем, часть снесут, часть протухнет. Оставшиеся будут болтаться ненужным мусором, пока их централизованно не выпилят. В общем, повторится судьба cladr:* тегов.

Это если импорт будет не особо массовый. В случае большого импорта появятся возражения уже у DWG, и его откатят сразу.

skymeteo

Есть данные Natural Earth: «All versions of Natural Earth raster + vector map data found on this website are in the public domain».
Пойдёт.

Есть данные Geonames: «This work is licensed under a Creative Commons Attribution 3.0 License». Можно им написать и попросить разрешение использовать данные для OSM.
До получения разрешения - загружать в OSM нельзя.

Но мне кажется, наименования географических объектов — это общественное достояние. С численностью — вопрос.
Вам кажется, а у LWG может быть другое мнение и вашу правку откатят.

Мне присылали e-mail «исправьте пожалуйста пос. Железнодорожный, у него какие-то левые координаты» или «у вас в базе три Москвы».
Я лез в MySQL-базу и исправлял. На сайте никаких соглашений нет. Это какие условия?
Это никакие. У вас нет уверенности, что присылаемая вам информация не взята из гугл-мапс, яндекс-карт и т.п.
На мой взгляд, использовать нельзя.

Ну это уже перебор. Я же не копировать собираюсь, а показать пользователю, что на этот счет думает Википедия. И пользователь уже будет принимать решение насчет названий.
Как уже написали, интервики находится под CC0, т.е. перевод названий оттуда можно использовать.

Я просто называю вещи своими именами. Валидатор — это программа, проверяющая соответствие определенному правилу или формату.
У вас тут своя терминология. Вы называете валидатором скрипт полуавтоматического пакетного или более-менее ручного добавленя и редактирования данных.
http://toolserver.org/~kentaur/osm_wp/show_osm_wp.php?lang=uk — это не валидатор, это пакетный импорт.

Тут все боятся пакетных изменений. Извините, но я не буду называть пакетный импорт валидатором только из-за фобий сообщества :slight_smile:
О Боже, нет, он сказал «импорт»??

В остальном я согласен — нужен инструмент, который позволит не только добавлять данные, но и контролировать полноту существующей базы, т.к. с названиями там не все в порядке.

Но мы сейчас не интерфейс обсуждаем, а принципиальную возможность и необходимость вносить какие-то данные в базу. Выясняем, какие данные можно вносить.
Я не хочу делать инструмент, с помощью которого добавят 200 названий в ближайший год. А другой перспективы я пока не вижу, судя по этому обсуждению.
Одни данные не подходят по соображениям лицензионной нечистоты, другие просто недостаточно хороши для OSM… В итоге остаемся без перевода вообще.

То что по ссылке пользоваться не возможно :slight_smile: . Просто сделайте по аналогии: http://vwo.osm.rambler.ru/ , http://peirce.gis-lab.info/addr.php?mapid=RU-YAR.
Одно из правил ОСМ: каждый делает то, что ему нужно(хочется).
Другое правило ОСМ: делает тот, кому это больше надо.
Т.е. вы сначала сделайте это. А потом уже вокруг этого сформируется (или нет) группа людей которые так же как и вы будет развивать это направление.

(del сорри уже напечатали ссылку)

Часто бывая в Китае, могу сказать, что имеет смысл брать названия НП из источников на пиньине.
Это официально утвержденная система романизации в КНР и на Тайване.
Транскрибировать иероглифы не нужно, перевести так чтобы это поняли сами китайцы, вы вряд ли
сможете. Пиньин в Китае используется часто, особенно на дорожных знаках.

Кроме того, русские названия китайских НП часто отличаются англоязычных.
Примеры: Пекин - Bejing, Нанкин - Nanjing и т.д.
Город Yiwu как только не называют в русской речи…

Так что возможно имеет смысл сначала проставить названия на пиньине, а потом уже определяться
с русскими названиями.

Можно попросить Cupivan сделать специально заточенную версию валидатора.

Или сформируется группа людей, которые выпилят это к едрене фене.

Тому кто хочет ориентироваться в Китае (особенно сидя у себя дома), есть смысл взять несколько уроков каллиграфии. ей богу, это не так сложно.

Дык пиньин - это система романизации. Ее прямая транслитерация в кириллицу как раз и рождает уродцев типа Бейжынг, Нанжынг, Йиву и.т.д.

Хм. Ну вот я, например, умею писать иероглифы и знаю, из каких частей они состоят (достаточно, чтобы уметь пользоваться бумажным словарем по ключу). Но при своей неплохой визуальной памяти не могу запомнить строку более чем из четырех-пяти иероглифов на какое-то существенное время. Так что это не то чтобы вариант решения проблемы.

Китай был взят для примера. Японский, арабский да и греческий ничуть не лучше для восприятия русским человеком.

Может я чего-то не понимаю, но какое у этой проблемы (слабое знакомство русского человека с иностранными языками) может быть решение? Придумать для всех объектов в мире русские названия? :smiley:

Названий на латинице было бы достаточно. :slight_smile:

Коллега skymeteo, судя по всему, выступает именно за это.
Я же свое мнение о бесполезности этого в общем случае уже высказывал выше - http://forum.openstreetmap.org/viewtopic.php?pid=306120#p306120

Хорошо написано)

Автоматизированного решения здесь быть не может.