Поскольку из-за массово порушенных границ валидатор навыдавал гору ошибок которые, как я надеюсь, неактуальны, то решил не выкладывать результаты текущего прогона. Сегодня попрофилирую самый медленный алгоритм, и или найду багу у себя или пойму что поломанные границы настолько критичны для текущей версии алгоритма. Завтра скачаю утренний дамп и на нём попробую получить более чистый прогон. Заодно и поймём насколько удалось восстановить границы.
Из мелочей - теперь обрабатываются isolated_dwelling, а admin_level=9 почему-то всё равно обрабатывается с ошибками - постараюсь сегодня ещё раз глянуть туда.
Все там режется правильно, просто обрезка осм-данных по полигону задача не тривиальная.
Единственный фокус - нужно обрезать с нахлестом. Это гарантирует попадание всех нужных данных.
Может не совсем по теме, но я правильно понимаю, что для того чтобы проверить принадлежность НП региону (в общем случае любой node любой area), нужно решить задачу локализации точки в многоугольнике?
Все равно было бы неплохо регулярно выкладывать данные, пусть часть и побита, но часть же должна обновиться нормально.
Я же не говорю что я гуру в ОСМ, понятно что в ОСМ куча разных полезных тулов. Всегда полезно спросить у сообщества что сейчас модно
Может тогда и годный файл обрезки России имеется? Я тогда смогу запускать валидатор не тогда когда скачаю дамп РФ а тогда когда мне это будет удобно по тем или иным причинам, хоть по заказу.
Имхо без разницы с какой тороны подставлять “сельские поселения”. Мне тоже привычно ставить его в конце, по крайней мере так в району у нас принято. По аналогии с областями, районами.
Из двух вариантов матчится будет любой. Какой предлагать по дефолту зависит от местных вкусов. Тут разборки хлеще, чем с улицами.
Анализ по стране показал, что если прилагательное оканчивается на -ское и -цкое, то это почти всегда именно название поселения, а не села/поселка, давшего имя поселению. Стало быть пишем натурально сзади. Остальные клеим спереди.
Могу для KHM умолчание поменять.
Запустил валидатор на новых данных … и загрустил. Он снова ползёт как черепаха и по прикидкам закончит где-то в районе полуночи, я не готов столько сидеть на работе … Границ сломанных у нас предостаточно - порядка 130, но там сельские поселения, не регионы. А валидатор еле ползёт. Начал смотреть логи системы и удивился, почему алгоритм так часто улетает на медленные проверки.
В общем проблема нашлась и со следующего прогона скорость должна вырасти. Оказалась что правильно построенный индекс по которому бежит оптимизационный алгоритм был грохнут мною перед запуском прогона. А алгоритм видя что данные не валидны идёт по самому надёжному но медленному пути.
В остатке - текущий прогон я прерывать не буду так как всё равно до ухода с работы он не завершится. Завтра я сгенерю текущий отчёт и попробую запуститься ещё раз, но уже с правильным индексом.