Списки населенных мест с валидацией границ и адресов

Вкратце дело обстоит так:
Для группировки списка населенных пунктов в дерево (страна/область/район/поселение), используются следующие данные:

  1. subarea в отношениях не используются.
  2. теги addr:country /addr:region/ addr:district /addr:subdistrict (также s_in:*)
  3. геометрическое вхождение в ганица boundary=administrtive admin_level=2/4/6/8 (соответствующие соответственно addr:country/region/district/subdistrict)
  4. для идентификации городских округов сиспользуется offiscial_status=ru:городской округ (в них нет поселений)

Далее идет ставнение с перечнем ОКТМО
При этом происходит

  1. порождение не найденных поселение/районов
  2. растаскивание по этим поселениям/районам населенных пунктов, основываясь на их именах и статусах. Не найденные в перечне или неоднозначные остаются в “undefined subdistrict”/“undefined district”.

При сопоставлении НП из OSM и справочника для полных тезок, у которых совпадает имя и статус (ru:дереня/ruпосёлок), используется oktmo:user.

Тезки из соседней области не должны влиять/мешать.

Соседняя область может всплыть при поиске возможного местоположения ( ?==> ), но на результат сопоставления это оказывает влияния

О тезках
Если НП имеет и точку и границу мы можем получить два НП если

  • place не совпадают,
  • точка не попала в границы.

Что случилось с Сортавальским районом, куда вывалились 18 НП? Я все-таки что-то сломал или это опять не попало в вырезку?

На утреннем дампе всё нормально (проверил по бегущему у меня отчёту).

Да. После перехода на осмапдате и самостоятельную нарезку не ублал старое шаманство. Теперь лучше.

wowik, можешь посмотреть почему
здесь выпадает Шадымо-Рыскинское сельское поселение,
а здесь Берсеневское сельское поселение?

Да, что-то в другие районы попрятались.
Шадымо-Рыскинское в Рузаевский, Берсеневское в городской округ Саранск.

Угу. А есть предположения почему?

У меня вроде они сопоставились правильно:

http://atd.osm.rambler.ru/r1537977.html

http://atd.osm.rambler.ru/r1538218.html

Здесь надо уже wowik-у смотреть …

fserges, дык я знаю, что у тебя всё в порядке. Поэтому и спрашиваю Вовика. Это либо проблема его валидатора, либо какой-то очень хитрый косяк в данных ОСМ (потому что я уже проверил всё что мог), который так неожиданно выловился. В любом случае, будет интересно.

Какая-то бага у меня, похоже. На Мордовии что-то колбасит. Отлаживаю.

P.S. Отладил. Ложное попадание точки в строго вертикальное ребро границы.

Вау, круто! Спасибо.

Начал печатать ошибки, которые по ходу дела обнаруживаются при разбое данных.
Например, отношение type=boundary без boundary=xxx .

Добавил еще диагностирование несоответствия place=xxx у точки и границы.

Смотреть можно по ссылке “Ошибки” на странице региона.

Примерчик из Калужской области: http://wowik.000space.com/places/ru-klu/err.htm

Пока сделано для RU, UA и BY

С регистром как дела обстоят?
Я так понимаю в верхний не переводится при проверке.
Мне не нравятся вот такие октмошные названия: “кирпичного завода”.
http://wowik.000space.com/places/ru-mos/46643407.htm

alt_name проверяется? Может хоть туда эти маленькие буквы загнать…

p.s. однако: “кирпичного завода” но, “Малиновские Луга”.
http://wowik.000space.com/places/ru-mos/46643408.htm
Всё таки надо всё в верхний переводить при проверке.

Да, это будет работать. И это, как мне кажется, вполне верное решение.

Если регистр совсем игнорировать, то никогда правильно никто не напишет.

В name/alt_name заносят то что правильно писать и так и так. Т.е. в name идёт то что более часто используется (или наоборот, официальное название) а в alt_name - менее используемое но не менее правильное. Я таким сейчас в Чечне пользуюсь так как транслитерация названий на русский язык не всегда однозначна и одно и тоже село даже в официальных документах имеет разные но близкие названия.

Добавлены ошибки для EE, LT, LV, KZ, UZ

Ну ёмаё, поправь у себя http://wowik.000space.com/places/ru-uly/73639151.htm
Верное “Старокулаткинское”, сам же ссылку на вики дал с верным именем, но name переправил по валидатор :frowning:

Вики тоже может врать, а вот доки на оффсайте убеждают http://stkulatka.ulregion.ru/mz/992/997.html

wowik, сделай же нормальную границу Сколково - http://www.openstreetmap.org/relation/3876787
Уж очень оно нарисовано не глядя на границы Москвы и МО.

Там вообще всё поперек границ, вот Новоивановское http://www.openstreetmap.org/way/206640848.
Я не понял чего оно выперло в Москву. Та граница Москвы верная? А то не в ту сторону утресём.