Привіт,
Хочу зробити невеличке оголошення, може занести на Вікі.
Будь-ласка, не витрачайте час на додавання англійських назв для вулиць, головне, щоби в name були українські, а в name:ru – російські. Я дороблю скоро програму для автоматичної транслітерації назв вулиць на англійську і запущу її по Україні. То ж просто не марнуйте час, краще додайте теґи до більшої кількості вулиць.
Eugene
edit1:
Бот вже працює. Дивіться правки _sevbot
edit2:
То, что делается сейчас:
Бот просматривает теги name, name:ru, name:uk, name:en.
-
Все сокращения в топонимах “разворачиваются”
-
Топонимы переносятся в конец названия
-
Все топонимы записываются с маленькой буквы
-
Исправляются типичные ошибки. тупік → тупик, вулица → вулиця, и ещё пяток других
-
Если в name записано русское название, и присутсвует “name:uk”, name записывается в name:ru (если опять же, его не было), и перетирается значением из “name:uk”
-
Если name:en отсутствует, и в “name” у нас обнаружен украинский язык, и назвнаие корректно (присутсвует топоним в конце), оно генерится транслитерацией плюс перевод топонимов
-
Если пишут “1-й провулок Васюкова”, оно превращается в “1-й Васюкова провулок”
-
Случаи, когда топоним не указан вообще и там одно слово на правильном языке, добавляется слово вулиця/улица
Что планируется делать:
-
Обработка 1-й, 2-й и т.п. для английского языка
-
Исправление английских топонимов – сокращения и title case. Там тоже часто пишут “str.”
-
Проверка некорректной транслитерации (тут ещё репу почесать надо, чтобы ни в коем случае не перетереть исправленное автором название, буду много тестировать)
-
Попытаться обработать остальные случаи, когда топоним не указан вообще
-
“Автоперевод” названий с русского языка. Если есть уже где-то улица с обоими названиями, взять оттуда. Но тут у меня большие сомнения
-
Обновлять английскую транслитерацию, когда улица переименована
-
Неверные теги. Бывают пишут “name:ua” и “name:rus”
-
Автодобавление “name:uk”, было обсуждено раньше, они нужны. Брать из “name”, если там действительно украинский язык
В общем, подход в боте такой: исправлять только явные, гарантированные ошибки.