Я в любом случае говорю только про города (city — в первую очередь, town — во вторую). Это десятки тысяч, а не сотни. Всё это можно руками перебрать.
Это сложная задача. Я собираюсь использовать Транскриптор, но там довольно мало языков. И его исходники я опубликовать не могу.
Дело в том, что на данный момент я считаю неправильным делать транскрипцию английского названия, которая уже является транскрипцией или транслитерацией исходного названия. Но нужно получше изучить вопрос.
Слово «автоматической» взято в кавычки, т.к. я не предлагал и не предлагаю делать какие-либо преобразования в полностью автоматическом режиме. Автоматически я могу только сделать некоторые преобразования, в которых уверен, и предложить их редактору как вариант названия, наряду с данными из открытых источников.
Передача иностранных названий на карте — сложный вопрос, требующий серьезного изучения. Существуют нормы, которыми всё регулируется. Да, они не окончательны и меняются раз в 30 лет, как и любые другие нормы языка.
Если не заняться серьезно этим вопросом, то сообщество пойдет по пути наименьшего сопротивления. Например, будет «за 30 минут написан плугин», который делает транслитерацию английских названий, хотя это совершенно некорректный подход для любой страны, официальным языком которой не является английский.
skymeteo, сделайте валидатор, который был бы удобен в данном редактировании. И кто знает, сколько реально человек займуться выпиливанием валидатора. (обязательное условие частое его обновление например раз вдень)
И 70к объектов это не так много :), особенно если требуется проверить всего лишь правильность его положения по википедии. Или тут ещё какие-то тонкости?
Почему он вдруг некорректный? Какой язык используется, тот и будет транлитерироваться/транскрибироваться.
У меня вон есть плагин, который прогоняет названия через Яндекс.Перевод, тоже неплохой результат получается.
А как я потом, скачав базу, отличу, где устоявшееся название, а где результат транскрипции Васи Пупкина, с алгоритмом которого я, может быть, не согласен?
Точно так же, как и сейчас — никак. Но вы сможете исправить эти названия, если посчитаете нужным.
А сейчас ситуация лучше? Вы считаете, что те полторы тысячи русских названий, которые есть в базе — это устоявшиеся названия? Или они соответствуют какому-то ГОСТу?
Предполагаю, что нет Поэтому я бы предпочёл видеть карту вообще с оригинальными названиями на местном языке (за исключением стран с иероглифами, но туда я обычно не суюсь)