Всё, отработал новый прогон и первый анализ говорит что результаты стали лучше. К сожалению, выложить я пока не могу, т.к. выяснилось что на работе заблокированы как ftp так и ssh наружу, т.е. результаты станут доступны поздно вечером когда я это сделаю из дома.
Из новшеств:
Был запущен был оптимизированный а не стандартный алгоритм, в результате чего самая долгая часть его работы ускорилась на 2 часа, а это существенный прирост производительности. Теперь всё время работы валидатора стало строго меньше чем рабочий день, т.е. проблем с его регулярным обновлением быть не должно (за исключением того что нет ftp или ssh). Ошибок не было обнаружено.
Были найдены недостающие муниципальные районы и сельские поселения (раньше часть из них отсутствовала). Осталось только несколько НП находящихся в межселенных территориях - ими займусь позже
Добавился жёлтый статус, т.е. НП распозналось на уровне района а не на уровне поселения. Красным цветом выделены НП которые не удалось сопоставить (включая правда и НП с одним названием - это ещё нужно обрабатывать). И да, цвета теперь используется предложенные zetx16
Немного подкрутил сопоставление поселений
По сравнению со вчерашним прогоном сопоставилось на 600 НП больше.
Нет, это связано с тем что точки и полигоны обрабатываются разными алгоритмами Я вчера не хотел лезть в алгоритм с точками так как разбирался с оптимизационным алгоритмом и не хотел лишних изменений.
Потому что это валидатор полноты АТД в ОСМ. То есть наличие сельских/городских поселений является обязательным. С сегодняшней версии сопоставляются (выделяются жёлтым) и просто НП, без поселений, но в статистику “совпало” не попадают. Добавьте поселения и процент сразу резко вырастет.
Происхождение базы сложное, но для простоты можно считать что это ОКТМО, хотя и допиленный руками. Ранее это был ОКАТО, но допил был более серьёзный.
Процедуру устранения разночтения названий я вижу так. Если название в эталонной БД неверное (обычно это опечатки) то я исправляю у себя сам. Если название имеет вариации, то нужно использовать alt_name (пока не обрабатывается но в ближайших планах). Аналогичное поле заведено и у меня в БД, но в этом случае потребуется моё участие. Второе название можно будет отображать рядом с первым (для справки). Но такого рода вещи лучше обсудить, чтобы понять какое решение более разумное.
wowik, насчет выноса из отношения это еще вопрос. Там на контуре адм.гр. ГП 6-ой уровень висел, сейчас исправил на 8-й http://wiki.openstreetmap.org/wiki/RU:Key:boundary
Ну и по сути дела с какой вообще стати само ГП Белоярский должно выступать в роли inner в отношении http://www.openstreetmap.org/browse/relation/1128593
По моему в этом и есть основная причина, что ГП не валидируется, а некорректно втюхано в релейшин как ГО окружного подчинения, что соответствует 6-му уровню.