Теґування найменувань вулиць

Привіт,

Хочу зробити невеличке оголошення, може занести на Вікі.

Будь-ласка, не витрачайте час на додавання англійських назв для вулиць, головне, щоби в name були українські, а в name:ru – російські. Я дороблю скоро програму для автоматичної транслітерації назв вулиць на англійську і запущу її по Україні. То ж просто не марнуйте час, краще додайте теґи до більшої кількості вулиць.

Eugene

edit1:

Бот вже працює. Дивіться правки _sevbot

edit2:

То, что делается сейчас:

Бот просматривает теги name, name:ru, name:uk, name:en.

  • Все сокращения в топонимах “разворачиваются”

  • Топонимы переносятся в конец названия

  • Все топонимы записываются с маленькой буквы

  • Исправляются типичные ошибки. тупік → тупик, вулица → вулиця, и ещё пяток других

  • Если в name записано русское название, и присутсвует “name:uk”, name записывается в name:ru (если опять же, его не было), и перетирается значением из “name:uk”

  • Если name:en отсутствует, и в “name” у нас обнаружен украинский язык, и назвнаие корректно (присутсвует топоним в конце), оно генерится транслитерацией плюс перевод топонимов

  • Если пишут “1-й провулок Васюкова”, оно превращается в “1-й Васюкова провулок”

  • Случаи, когда топоним не указан вообще и там одно слово на правильном языке, добавляется слово вулиця/улица

Что планируется делать:

  • Обработка 1-й, 2-й и т.п. для английского языка

  • Исправление английских топонимов – сокращения и title case. Там тоже часто пишут “str.”

  • Проверка некорректной транслитерации (тут ещё репу почесать надо, чтобы ни в коем случае не перетереть исправленное автором название, буду много тестировать)

  • Попытаться обработать остальные случаи, когда топоним не указан вообще

  • “Автоперевод” названий с русского языка. Если есть уже где-то улица с обоими названиями, взять оттуда. Но тут у меня большие сомнения

  • Обновлять английскую транслитерацию, когда улица переименована

  • Неверные теги. Бывают пишут “name:ua” и “name:rus”

  • Автодобавление “name:uk”, было обсуждено раньше, они нужны. Брать из “name”, если там действительно украинский язык

В общем, подход в боте такой: исправлять только явные, гарантированные ошибки.

name:ru будуть обов"язкові для роботи скрипта?
В майбутньому будуть додаткові запуски?

Ні, головне, щоб в name була саме українська назва, бо англійська транслітерація береться саме з неї.

Додатково у скрипті також буде трошки евристик, щоби визначити мову, записану в name, а також виправляти деякі типові помилки у найменуванні, тобто скорочення, або невірний порядок слів.

І так, я планую запускати скрипт регулярно. Тим більше, що я очикую наплив маперів після того, як Майкрософт владнає питання з правами на свої мапи.

Eugene

А за якими правилами буде транслітеровано? Ярославів Вал стане Yaroslaviv Val, Iaroslaviv Val чи Jaroslaviv Val? А якщо “я” в кінці складу - напр. Березняківська (Berezniakivska? Bereznyakivska? Bereznjakivska?)

За офіційним стандартом, до речі, досить зрозумілим і логічним.

Eugene

Шкода, що цей стандарт зробили таким недавно. Моє прізвище в закордонному паспорті виглядає жахливо.

А таке питання, Толстого вулиця в англійською звучить як Tolstoy street. Як таке враховується?

Ні, не враховується. Я пропоную зробити список виключень, їх не буде багато. Або, після першого проходу автоматичного найменуавання, вже не чіпати ті вулиці, де є англійська назва, тобто можна буде вручну виправити.

Eugene

Мені здається що це зараз ніде не враховується. Наприклад, у Google Maps все перекладається тільки транслітом: “Gor’kogo str.”, “Shchorsa str.”, тощо.
Та й чи треба взагалі перекладати назви за змістом? Наприклад, “Червоноармійська вулиця” перекладати як “Red Army street”?

Ну як-би є правило, що назви утворені від прізвища англійською мовою звучать так, як у прикладі, що я навів. Те що гугл так не робить, не означає, що то є правильно.

Це все одно, як Мангуш колись називали Першотравневое. Це було в ті часи коли він спочатку звався “Первомайскоє”, потім украінізація взяла своє і він став Першотравневе. Але через те, що тут більшість - російськомовне населення, утворився такий вот собі мовний мутантик.

Власне кажучи для того й потрібен теґ name:lang, щоб там була адаптована назва, а не просто транслітерація у чужинну мову.

загальне правило - назви транслітерують. не перекладають. якщо у мові сформовано традицією інша назва - використовують її. (монтенегро - чорногорія / пекін - північна столиця - бейджинг / берег слонової кістки - кот-д’івуар) загалом, проблема традиції має хвилювати носіїв закордонної мови а ми маємо повне (маральне і не лише) просто транслітувати, хоча, можемо і ввічливо подбати про гостей у межах власної ерудиції…

Україна != Ukraine, Russia !=Россия

Точно так само
name:ru= Горбенко улица
name:uk= Горбенка вулиця
ну відповідно name:en = Gorbenko street

На жаль зараз не можу навести посилань на правила, треба поспілкуватись з лінгвістами.

Але, на користь тих, хто за транслітерацію, говорить ось це:
В Донецке появились указатели улиц на английском языке
Там видно, що використовується трансліт.

У Москві теж є покажчики латиницею і ніде не бачив щоб прізвища вказувались у називному відмінку. Я не сперечаюся якщо в Україні є інши правила. Проте, загальне правило OSM – вказувати назви як вони позначени на місцевости. Можете також глянути російську гілку на тему “транслітерувати чи перекладати”: Чем Хэйлунцзян отличается от Нового Южного Уэльса

Трансліт потрібен туристу, який питає а його розуміють. Так, в Україні особливо складно з цим завдяки поширенню російської мови. З’ясувати та довести оригінальність назви не так вже і легко. Для багатьох об’єктів назви українською не було взагалі. Нам лишаться вказувати офіційний назви, хоча вони бувають досить кумедно перекладені з російської/польської.

Думаю, что лучше не изменять названия улиц для понимания иностранцами, т.к. при поиске кафе или театра иностранец найдет этот объект скорее на сайте на русском языке, и при копировании/вставке названия улицы в поиск карты или google translate, он ожидает увидеть тот же результат что и будет там.
Не нужно изменять названия улиц!

З.Ы. если переводить для иностранцев - как переводить Шелковичная или Краснозвездная?

Ладно. Переконали. Вас багато, я один :slight_smile:
Головний аргумент з яким я погоджуюсь, це

Так, на останок :slight_smile: :

http://translate.google.com/#ru|en|%D0%A2%D0%BE%D0%BB%D1%81%D1%82%D0%BE%D0%B3%D0%BE%20%D1%83%D0%BB%D0%B8%D1%86%D0%B0

Не зрозумійте нас неправильно. Я й сам в кількох місцях писав назву однієї зі своїх вулиць як Soviet Army street(що також відповідає Google Translate :slight_smile: ). Хто б заперечував якщо було би правило якому слідували в багатьох місцях? А так правило “як-би є”, але ніхто його не притримується і навіть ви не можете навести на нього посилань…

Взагалі-то, власні назви підлягають перекладу у дуже крайньому випадку.

Влучно про труднощі перекладу (читати з коментарями). Ще цікавий матеріал про застосування транслітерації або адаптації назв.

Навпаки, для тих, хто має сумніви як писати українською: “Правопис слів іншомовного походження”
http://www.madslinger.com/mova/pravopys-2007/rozdil-3.html#toc175
http://www.madslinger.com/mova/pravopys-2007/rozdil-4.html#toc204

Зараз перечитав топік, й задумався, чи про одне й теж саме ми говорили :slight_smile:

Я маю на увазі правило, що власні імена та прізвища в англійській мові мають тільки називний відмінок. Ще з 5-го класу нам червоною пастою виправляли таке.

Звичайно Шелковичная буде, щось на зразок Shelkovichnaja, або її транслітерація з Української мови (навіть не зовсім уявляю, як це буде звучати).

Правил дійсно сходу не можу навести, тому-що не лінгвіст, та і як показала практика, самі лінгвісти теж знають їх з ВУЗів, а першоджерело поки-що вказати не змогли…

Транслітерована назва, найбільше адаптована до національної мови, напевно, дійсно є кращим варіантом для іноземця, що опинився на чужинній території. Але це краще в них попитати :slight_smile:

Ну і проти виконання наведеного мною правила, дії органів влади, котрі офіційно закріплюють за вулицями назви, що не відповідають “стандарту”. Тут вже не попреш, тому-що якщо на вказівнику написано Gor’kogo, то Gorky можна довго шукати (більше того знайти вулицю Горки :wink: )

Прохання у кого в місті є надписи двома мовами, зверніть увагу, як воно транслітеровано.

В Бердянську, де таких табличок не має, думаю транслітерація буде краще ніж нічого.
Коли в нас такі таблички з’являться можна буде (або навіть потрібно буде) перевірити відповідність назв.

Головне щоб потім скрипт _sev-а їх не позатирав.