'Я -> 'я

Привіт!

Помітив багато сіл з назвами, в яких є апостроф, а зразу за ним - велика буква. Виявляється, таке зустрічається по всій Україні. Можливо, в когось є ідеї, як то можна виправити все скопом, не правлячи кожну назву окремо?

Приклади: Остап’Є, Кам’Янки, Білогір’Я

Всі ці точки були додані у http://www.openstreetmap.org/browse/changeset/838890, коли додавали всі міста і села України, як я розумію.

Дійсно, є така проблема :(, раніше на очі таке не потрапляло. На мою думку є два варіанти вирішення:

  • написання сценарію будь-якою мовою (Python, Perl й т.і.) який би вибирав об’єкти за певним шаблоном по полю “name”, використовуючи API; сценарій виправлення по шаблонах, та інший сценарій, який би ці зміни надсилав до бази.
  • завантажити вище зазначений набір змін, у текстовому редакторі (на ваш смак) по шаблонах здійснити виправлення, відкрити файл із виправленим набором змін у JOSM, та надіслати його до бази засобами JOSM.

PS. потрібно звернути увагу на те щоб в назвах стояв «‘» - апостроф, а не «’» - одинарні лапки і у разі потреби теж виправити.

Схоже, пофіксив… якщо хтось помітив якісь неспівпадіння, напишіть, будь-ласка

Будь ласка, чекаємо на звіт. Щоб у разі виникнення чогось подібного вже мати перевірений алгоритм.

Боюсь, що нормального алгоритму не получиться :frowning:
Взяв документацію по API і в напівавтоматичному режимі пройшовся скриптами по всім змінах того чейнджсету і позаміняв ті великі букви на маленькі. Кому захочеться подивитись, вкладую файлики (паролі видалені) http://zalil.ru/29768229
Якщо файлик буде недоступний і раптом комусь потрібен, то короткий опис: php, simplexml, rest :slight_smile: якщо все ще потрібен, звертайтесь персонально…

Знайшов у Дніпропетровській області в назвах населених пунктів 'Я та 'Ї, що потрапило на очі виправив. Також виправив -На- в назвах на -на-

Може є який спосіб, щоб пройтись по всій території України та повиправляти такі помилки?

схоже, було кілька таких чейнджсетів з неправильними імпортами назв… спробую до того подивитись

Підфіксив ще два changeset-а - 839185, 858569. Результат тут: http://www.openstreetmap.org/browse/changeset/7595968
Можливо, щось пропустив, тоді підказуйте.

Дякую!

Если есть дамп Украины целиком, то можно пройтись скриптом по нему. Это более консистентно нежели вылавливать по чейджсетам.

В приципе скрипт можно было не писать, а воспользоваться плагином tagtransform к osmosis.

в общем-то по дампу сейчас проходил для сверки изменений - кому интересно, дамп брал на http://gis-lab.info/data/osm/ukraine/ - ukraine.osm.bz2 - ежедневный.
обнаружил, что есть еще несколько линий с такими названиями, исправил.

С осмозисом, увы, еще не сдружился :slight_smile: