You are not logged in.

#26 2010-12-03 22:10:10

_sev
Moderator
Registered: 2010-10-12
Posts: 719

Re: Теґування найменувань вулиць

Я збираюся зробити наступне: 3 варіанти роботи програми -- запуск-перевірку; з переписуванням теґів name:en; та без переписування.

Таким чином, для міста буде робитися таке: перший запуск -- перевірка, дивлюся, наскільки погана ситуація з англійськими, якщо дуже погано, то переписую. А всі наступні запуски, тільки без переписування. Як результат, ручні правки після того, не будуть виправлятися, а періодичні запуски-перевірки допоможуть виявити, де скрипт має інакшу думку стосовно англійської назви, і мені виявляти виключення, які можна додати до аналізатора.

Вже планую зайнятися наступного тижня, бо трохи затягнулося.


Eugene

Offline

#27 2010-12-06 08:13:43

_sev
Moderator
Registered: 2010-10-12
Posts: 719

Re: Теґування найменувань вулиць

Первый пошёл: Дивіться правки _sevbot

Запустив скрипт один раз, пройшовся по всій Україні, модифіковано 7998 вулиць. Були конфлікти, десь біля 30, брав з конфліктів теґи, залишаючи вузли як є, але потенційно десь могло проскочити.

Вже після запуску подумав про конструкції типу 1-й, 2-й і т.п. Англійська має свої правила, виправлю при наступних прогонах.

У планах зробити наступне:

  1. Там, где в name тільки одне слово, додати "вулиця" або "улица", в залежності від мови

  2. Спробувати автоматичний переклад неперекладених назв, тобто, якщо десь є вже перекладена вулиця з такою самою назвою, взяти звідти. Можуть бути проблеми типу "червоний/красний"

  3. Пройтися по існуючим теґам name:en, і виправити транслітерацію. Там повний безлад. Причому додати туди трохи розуму, тобто перевіряти власне правильність транслітерації, а не вже обговорене Tolstogo -> Tolstoy


Eugene

Last edited by _sev (2010-12-06 08:22:41)

Offline

#28 2010-12-06 09:35:24

andygol
Moderator
From: Дніпро
Registered: 2009-07-31
Posts: 1,957
Website

Re: Теґування найменувань вулиць

_sev wrote:

Первый пошёл: Дивіться правки _sevbot

Так, подивився. Добре там де є назви українською — там є й транслітерація англійською, а там де в name=* стоїть російськомовна назва теґ name:en=* відсутній, так і повинно бути?
Ось і приклад http://www.openstreetmap.org/browse/changeset/6559010
перший рядок http://www.openstreetmap.org/browse/way/27232711

що будеш з цим робити?

Ще є, я сам ставив теги до того як була прийнята Угода про назви вулиць, скорочення «ул.» в name:ru=*. Чи можливо таке виправити автоматично, та впорядкувати слова в назвах згідно з Угодою?

Offline

#29 2010-12-06 10:57:45

_sev
Moderator
Registered: 2010-10-12
Posts: 719

Re: Теґування найменувань вулиць

andygol wrote:
_sev wrote:

Первый пошёл: Дивіться правки _sevbot

Так, подивився. Добре там де є назви українською — там є й транслітерація англійською, а там де в name=* стоїть російськомовна назва теґ name:en=* відсутній, так і повинно бути?

Так, так і повинно бути. Я транслітерував теґ тільки тоді, коли в name була детектована українська мова.

andygol wrote:

що будеш з цим робити?

Пункт другий у попередньому пості -- спробую подивитися у бік автоматичного перекладу. А так -- чекати, поки перекладуть, чи сам перекладу, і потім бот сам проставить англійську.

andygol wrote:

Ще є, я сам ставив теги до того як була прийнята Угода про назви вулиць, скорочення «ул.» в name:ru=*. Чи можливо таке виправити автоматично, та впорядкувати слова в назвах згідно з Угодою?

Мммм. Начебто теґи name:ru теж виправлялися у цьому проході. Наведи приклад.


Eugene

Last edited by _sev (2010-12-06 10:58:01)

Offline

#30 2010-12-06 11:14:48

Larry0ua
Member
Registered: 2010-09-19
Posts: 1,061

Re: Теґування найменувань вулиць

привіт. чи будуть переправлятись en-назви у випадку, коли name був змінений після їх створення? чи тепер вже потрібно вручну це буде робити?

Offline

#31 2010-12-06 11:53:26

_sev
Moderator
Registered: 2010-10-12
Posts: 719

Re: Теґування найменувань вулиць

Я можу прикрутити аналізатор, це неважко. Робити?


Eugene

Offline

#32 2010-12-06 14:59:37

andygol
Moderator
From: Дніпро
Registered: 2009-07-31
Posts: 1,957
Website

Re: Теґування найменувань вулиць

Larry0ua wrote:

привіт. чи будуть переправлятись en-назви у випадку, коли name був змінений після їх створення? чи тепер вже потрібно вручну це буде робити?

Я нещодавно перекладав нові рядки для JOSM. Повинен вже бути втулок TrustOSM, який на основі GPG дозволяє накладати цифрові підписи на дані. Тож можна доопрацювати бота таким чином, щоб він перевіряв наявність таких підписів.

_sev wrote:

Мммм. Начебто теґи name:ru теж виправлялися у цьому проході. Наведи приклад.

Ось наприклад http://www.openstreetmap.org/browse/way/33849369

Last edited by andygol (2010-12-06 15:59:02)

Offline

#33 2010-12-10 01:36:29

_sev
Moderator
Registered: 2010-10-12
Posts: 719

Re: Теґування найменувань вулиць

andygol wrote:

Ще є, я сам ставив теги до того як була прийнята Угода про назви вулиць, скорочення «ул.» в name:ru=*. Чи можливо таке виправити автоматично, та впорядкувати слова в назвах згідно з Угодою?

Done.


Eugene

Offline

#34 2010-12-10 10:53:44

_sev
Moderator
Registered: 2010-10-12
Posts: 719

Re: Теґування найменувань вулиць

Написал  шапку список того, что делает бот. Продублировал в шапке. Позже перенесу в Вики.

То, что делается сейчас:

  • Все сокращения в топонимах "разворачиваются"

  • Топонимы переносятся в конец названия

  • Все топонимы записываются с маленькой буквы

  • Исправляются типичные ошибки. тупік -> тупик, вулица -> вулиця, и ещё пяток других

  • Если в name записано русское название, и присутсвует "name:uk", name записывается в name:ru (если опять же, его не было), и перетирается значением из "name:uk"

  • Если name:en отсутствует, и в "name" у нас обнаружен украинский язык, и назвнаие корректно (присутсвует топоним в конце), оно генерится транслитерацией плюс перевод топонимов

  • Если пишут "1-й провулок Васюкова", оно превращается в "1-й Васюкова провулок"

Что планируется делать:

  • Обработка 1-й, 2-й и т.п.

  • Исправление английских топонимов -- сокращения и title case. Там тоже часто пишут "str."

  • Проверка некорректной транслитерации (тут ещё репу почесать надо, чтобы ни в коем случае не перетереть исправленное автором название, буду много тестировать)

  • Попытаться обработать случаи, когда топоним не указан вообще. "Герцена", "Карла Лібкнета" и т.п. Там нужно добавлять "улица"

  • "Автоперевод" названий с русского языка. Если есть уже где-то улица с обоими названиями, взять оттуда. Но тут у меня большие сомнения

  • Обновлять английскую транслитерацию, когда улица переименована

  • Неверные теги. Бывают пишут "name:ua" и "name:rus"

  • Исправлять ошибки в "name:uk"

  • Автодобавление "name:uk", было обсуждено раньше, они нужны. Брать из "name", если там действительно украинский язык

В общем, подход в боте такой: исправлять только явные, гарантированные ошибки.


Eugene

Last edited by _sev (2010-12-10 10:59:00)

Offline

#35 2010-12-10 11:28:16

Larry0ua
Member
Registered: 2010-09-19
Posts: 1,061

Re: Теґування найменувань вулиць

Если пишут "1-й провулок Васюкова", оно превращается в "1-й Васюкова провулок"

Впевнений, що цей варіант правильний? Якщо так, то додай ще плз правило
"Васюкова 1-й провулок" -> "1-й Васюкова провулок"

Offline

#36 2010-12-10 11:54:17

andygol
Moderator
From: Дніпро
Registered: 2009-07-31
Posts: 1,957
Website

Re: Теґування найменувань вулиць

_sev wrote:
  • Исправлять ошибки в "name:uk"

  • Автодобавление "name:uk", было обсуждено раньше, они нужны. Брать из "name", если там действительно украинский язык

Про name:uk. Цей теґ, на мою думку, краще використовувати для назв об'єктів за межами України, додаючи до них український відповідник.

PS дайте посилання на обговорення, що до застосування name:uk

Offline

#37 2010-12-10 12:12:03

_sev
Moderator
Registered: 2010-10-12
Posts: 719

Re: Теґування найменувань вулиць

andygol wrote:
_sev wrote:
  • Исправлять ошибки в "name:uk"

  • Автодобавление "name:uk", было обсуждено раньше, они нужны. Брать из "name", если там действительно украинский язык

Про name:uk. Цей теґ, на мою думку, краще використовувати для назв об'єктів за межами України, додаючи до них український відповідник.

PS дайте посилання на обговорення, що до застосування name:uk

Дивись у мене у щоденнику останній коментар, там є посилання на обговорення англомовної спільноти.

В двох словах, це допоможе рендереру, бо не буде потреби вияснювати мову території, де знаходиться вей. Але звичайно, якщо україномовна спільнота вирішить, що не треба, я цього робити не буду.


Eugene

Offline

#38 2010-12-10 12:38:58

Vort
Member
Registered: 2010-11-29
Posts: 512

Re: Теґування найменувань вулиць

я цю неприємну особливість osm примітив ще давно
вказування локальних імен дозволяє рендереру вибрати найбільш доречний варіант для відображення
але відсутність можливості вказати мову локального імені зводить нанівець всі переваги багатомовної підтримки
зараз маємо ситуацію коли набір тегов містить коди будь якої мови, але не локальної
якщо записати локальну назву у тому ж форматі що і іноземну, то в результаті отримаємо дублювання інформаціі та всі проблеми, з цим пов'язані
як можна вирішити цю проблему без глобальних змін я не уявляю

Offline

#39 2010-12-10 13:03:46

andygol
Moderator
From: Дніпро
Registered: 2009-07-31
Posts: 1,957
Website

Re: Теґування найменувань вулиць

_sev wrote:
andygol wrote:

PS дайте посилання на обговорення, що до застосування name:uk

Дивись у мене у щоденнику останній коментар, там є посилання на обговорення англомовної спільноти.

В двох словах, це допоможе рендереру, бо не буде потреби вияснювати мову території, де знаходиться вей. Але звичайно, якщо україномовна спільнота вирішить, що не треба, я цього робити не буду.


Eugene

Якщо це робитиме твій бот — то хай робить, я не заперечую. Руками таке робити — марна трата часу, який краще використати на  замаплення території smile

Offline

#40 2010-12-10 13:07:56

_sev
Moderator
Registered: 2010-10-12
Posts: 719

Re: Теґування найменувань вулиць

andygol wrote:
_sev wrote:

В двох словах, це допоможе рендереру, бо не буде потреби вияснювати мову території, де знаходиться вей. Але звичайно, якщо україномовна спільнота вирішить, що не треба, я цього робити не буду.


Eugene

Якщо це робитиме твій бот — то хай робить, я не заперечую. Руками таке робити — марна трата часу, який краще використати на  замаплення території smile

Во! Я з цього і починав. Тобто, "Не марнуйте час на name:en". У ході дискусії виявилося, що десь можуть бути виключення, але це мізерна частина, то ж бот буде виставляти name:uk та name:en.


Eugene

Offline

#41 2010-12-13 23:33:55

_sev
Moderator
Registered: 2010-10-12
Posts: 719

Re: Теґування найменувань вулиць

Сьогодні бо ще й зазирнув у всі name:uk і повиправляв помилки там. Було 101 помилка по країні. В основному це були виправлення скорочень, правильні апострофи, і у трьох випадках перестановка топоніму на кінець назви. Я також порівняв name та name:uk. У 22-ох випадках вони відрізнялися. Виправив руками, так було простіше.

До цього додалися 167 транслітерацій, і 14 виправлень. Непогано, бо це менше 10% помилкових нових назв.

Тож, на цей час ми маємо:
  1104 помилкових російських назв
  2966 помилкових українських назв
  1760 випадків російської мови у теґу name

Помилкові, це ті назви, де відсутній топонім. Значну їх частину буде виправлено в одному з майбутніх запусків бота.

Хочу ще раз підкреслити, що до цих пір я перевіряю всі виправлення перед завантаженням на сервер. Поки що не довелось виправляти те, що бот нагенерив, але вважаю повністю автоматичну роботу ще передчасною.


Eugene

Offline

#42 2010-12-17 21:53:08

_sev
Moderator
Registered: 2010-10-12
Posts: 719

Re: Теґування найменувань вулиць

Сьогодні додав слова вулиця та улица для тих веїв, де в назві було одне слово, і це не була назва траси.

Перевірив всі результати перед заватнаженням, було пару речей на кшталт "Гагарина вулиця", але залишив як є, простіше виправити вручну, ніж ліпити велику купу перевірок. Таких було може 3 на майже 2.5 тисячі найменувань.

Також було додано 75 англыйских назв, та зроблено 76 виправлень назв, з них 36 заміна "Ленина" на "Леніна" в українських назвах. Тобто, справжніх виправлень усього 29.


Eugene

Offline

#43 2011-01-04 22:49:25

yurkoy
Member
Registered: 2009-12-04
Posts: 8

Re: Теґування найменувань вулиць

_sev wrote:

За офіційним стандартом, до речі, досить зрозумілим і логічним.


Eugene

http://www.openstreetmap.org/browse/way … 50/history
Трнаслітерація Польова вулиця -> Polyova Street не відповідає офіційній.
Повинно бути Polova street. Толстой -> Tolstoi, а не Tolstoy

Offline

#44 2011-04-03 10:55:29

_sev
Moderator
Registered: 2010-10-12
Posts: 719

Re: Теґування найменувань вулиць

Так, треба буде виправляти. Я ще не реалізував виправлення невірної транслітерації.


Eugene

Offline

#45 2011-04-24 01:51:56

pivogol
Member
Registered: 2011-04-24
Posts: 23

Re: Теґування найменувань вулиць

Я редактирую карту в Potlatch, хочу чтобы были названия на русском языке, куда мне добавлять код "name:ru" в Alternative name? Или без всяких кодов там указывать название улицы на русском?

Offline

#46 2011-04-24 08:14:21

_sev
Moderator
Registered: 2010-10-12
Posts: 719

Re: Теґування найменувань вулиць

pivogol wrote:

Я редактирую карту в Potlatch, хочу чтобы были названия на русском языке, куда мне добавлять код "name:ru" в Alternative name? Или без всяких кодов там указывать название улицы на русском?

На территории Украины название должно быть на украинском. Если делать его на русском, это создавать работу другим, ибо кто-то должен будет это рано или поздно за вами исправлять. Код name:ru должен писаться в... name:ru! В потлаче его придётся добавлять руками в закладке Advanced.


Eugene

Offline

#47 2011-04-25 12:59:26

pivogol
Member
Registered: 2011-04-24
Posts: 23

Re: Теґування найменувань вулиць

_sev wrote:

На территории Украины название должно быть на украинском. Если делать его на русском, это создавать работу другим, ибо кто-то должен будет это рано или поздно за вами исправлять. Код name:ru должен писаться в... name:ru! В потлаче его придётся добавлять руками в закладке Advanced.

Понял, спасибо!
Тогда есть просьбочка не редактировать меня (Шахтёрский район Донецкой области), я лишь некоторое время подержу русскоязычные названия, потом пересниму карту и сменю названия на украинские.

Offline

#48 2011-04-25 14:41:23

andygol
Moderator
From: Дніпро
Registered: 2009-07-31
Posts: 1,957
Website

Re: Теґування найменувань вулиць

Для вывода любых присутствующих у объекта на званий на разных языках можешь воспользоваться http://toolserver.org/~osm/locale/__all.html (в правом верхнем "+" выбираешь нужные языки.
http://toolserver.org/~osm/locale/ru.html - только русский язык

Offline

#49 2011-04-25 16:37:13

pivogol
Member
Registered: 2011-04-24
Posts: 23

Re: Теґування найменувань вулиць

Спасибо, получилось! Значит буду сразу теперь названия переделывать на правильные, только кадастр улиц надо поискать, чтобы правильно названия писать по украински.

Last edited by pivogol (2011-04-25 16:37:39)

Offline

#50 2011-04-26 09:11:12

dudka
Member
From: Київ
Registered: 2011-04-22
Posts: 1,605

Re: Теґування найменувань вулиць

Як правильно тегувати перейменування вулиць?
Дехто записує стару назву в дужках в тег name (наприклад "Антоновича (Горького)" http://osm.org/go/0jfPMBkvZ--)
Дехто записує стару назву в old_name, що здається є більш правильним.
Тег old_name використовується тільки для пошуку? На карті не відображається?
Чи потрібен тег old_name:ru? Думаю що так, але ніде його не зустрічав.
Що робити якщо у вулиці декілька старих назв(наприклад "Січневого Повстання" -> "Мазепи" -> "Лаврська")?

І ще одне запитання що стосується переіменувань будинків (хтось же додумався):
   стара адреса "факультету Кібернетики, КНУ, Київ": проспект Глушкова, 2, корпус 6
   нова адреса: проспект Глушкова, 4д
Стара адреса вказана на сайті http://unicyb.kiev.ua/ua/contacts.
Нова адреса вказана на табличці на будинку.
Просто прописати новий номер?

Last edited by dudka (2011-04-26 09:13:30)

Offline

Board footer

Powered by FluxBB