Валидатор населённых пунктов и границ (http://atd.openstreetmap.ru)

домен осм.рамблер.ру прекратил свою работу его перенесли http://atd.openstreetmap.ru/

Валидатор перешёл на новую версию ОКТМО. Чтобы найти разницу, в http://atd.openstreetmap.ru/old/ сегодняшний прогон по старому классификатору, в http://atd.openstreetmap.ru/new/ по новому.

P.S. ОКТМО никак не может угнаться за упразднением районов в Московской области, новые упразднения будут учтены в последующих обновлениях.

События в жизни иногда развиваются очень непредсказуемо. То что 1.5 года назад ожидалось как краткосрочный перерыв оказалось серьёзной остановкой. Остановленный летом 2017 года сервер был запущен только вчера и только в тестовом режиме.

Хорошая новость - валидатор можно запустить на двух компьютерах, т.е. нет зависимости от железа, что важно, так как ноут начал барахлить. Но железо находится во временном помещении, для каждого запуска его нужно разворачивать а после - убирать.

В сухом остатке - частота обновлений валидатора не меняется, 1-2 раза в неделю, но всё же сейчас больше надежды что через несколько месяцев он сможет перейти к более предсказуемому расписанию, а у меня появится время на развитие а не только на поддержку пусков.

Неожиданно возврат к десктопу после ноутбука положительно сказался на валидаторе. Десктоп оказался банально мощнее. При этом ноутбуку всего 1.5 года и он выбирался среди относительно мощных моделей, комп же был куплен почти 6 лет назад. Но судя по всему прогресс в вычислительной мощности не такой каким был раньше, а до-крымские цены и пост-крымские отличаются. За комп и за ноут я отдал примерно одинаковую долю зарплаты, при этом в долларах разница (2013 и 2017) очевидно немалая.

Пока перевожу валидатор на двухразовый прогон в неделю. Чаще это скорее всего никому не нужно, но требует некоторых усилий с моей стороны, реже … нет смысла. На этой неделе прогнал 3 раза. График буду держать примерно вторник-среда в первый раз и пятница-суббота второй раз. Единственно, сменилось время запуска. Раньше он запускался днём, теперь запускается поздно вечером. Т.е. раньше дамп снимался в 8-9 утра, результат был вечером, сейчас дамп снимается в 22-23, результат рано утром. Поэтому “дата дампа” сейчас может сбивать. Это дата по состоянию на конец какого дня он дамп снимался.

Валидатор стабильно работает в режиме 2 обновления в неделю. На днях был переход на последнюю версию ОКТМО.

В ОКТМО с глузду посъезжали

Муниципальный район входит в составе городского округа.

Так это теперь нормально. Во Владивостоке 5 муниципальных районов входят в состав ГО.

Они же одного уровня, как такая матрёшка получается

П.С. Да и в уставе ничего такого нет.

Я все перепутал - прошу прощения. Неправильно истолковал.

Я тоже сначала был удивлён, когда прочитал это. Но потом после анализа понял, что они хотели сказать.

Звучит так - “Серпуховский муниципальный район”, его центр - “г Серпухов”, при этом центр не входит в состав района а “Пояснение: входит в состав городского округа Серпухов”.

Во всяком случае именно это объяснение мне показалось наименее противоречивым. Пояснение сбивает с толку а не поясняет.

Когда планируется к включению последняя версия ОКТМО от сентября?

Через неделю. В этот прогон изменения ещё не вошли (не успел), следующий прогон планирую на следующую субботу.

Отличия сентябрьского ОКТМО относительно июньского невелики - три поселения упразднены, одно городское преобразовано в сельское, по мелочам изменения и в НП. Так что какого-то смысла в ускорении обновления не вижу.

Больше напрягают перемены, затеянные со сменой дизайна сайта Росстата - не всё работает. Просто по опыту, классификаторы активно обновляются в октябре-ноябре, когда начинается подготовка к работе над годовыми отчётами и накопившиеся изменения массово включаются. Затянувшегося бардака не хотелось бы.

Поскольку после каких-то перестановок в Росстате произошли изменения в выгрузках, позволил себе некоторое ожидание. Но поскольку два последних изменения довольно большие, то штучно импортировал.

Пробный прогон прошёл успешно, на сайте валидатора выложу при следующем прогоне - может на следующих выходных а может и в какой-нибудь рабочий день. Отпишусь как новый отчёт будет готов.

А можно ссылочку, с которой скачивается успешно. А то в связи с этой чехардой те ссылки, что у меня были не работают теперь.
Нашел только в виде .DOCX тут https://www.gks.ru/classification, а где же .CSV?

Место известное, но они всё забили результатами сельскохозяйственной переписи 2016 года.

Прямая ссылка - https://www.gks.ru/opendata/7708234640-oktmo2

Там важный комментарий:

Т.е. в январе скорее всего будет довольно большой апдейт.

Забавно, но валидатор временно остановлен. В доме начали делать ремонт и “реставраторы” просто отрезали все провода во всём доме, включая интернет. Через сотовый конечно я могу заходить, но для валидатора это не решение. Сколько времени может понадобиться чтобы восстановить кабель - неясно с учётом Нового года. У меня вот только год назад закончился ремонт - вся проводка была убрана, теперь всё придётся снова долбить.

Буду искать какое-то временное решение.

Интернет восстановили, но не известно, на сколько - судя по всему кабель пал жертвой какой-то многолетней борьбы ЖЭКа с интернет-провайдерами. Война может перейти в горячую фазу в любой день. Это же Петербург!

Валидатор запустил, но на неделе было зачищено много тегов по разным объектам, в результате валидатор отправил кучу областей за границу. Восстановил и перезапущу всё снова вечером.

Валидатор обновился, перешёл на последнюю версию ОКТМО. Если с кабелями в подъезде не будет приключений то валидатор будет обновляться штатно как и раньше.

В январе ожидаются большие изменения в ОКТМО (Росстат отложил ряд изменений до января, конца переходного периода по некоторым изменениям).

Анализируя работу валидатора заметил что наиболее неэффективно время тратится при подготовке данных, поэтому возникла идея ускорить именно эту часть (максимум выигрыша за минимальное время).

Не подскажет ли кто-нибудь на основе своего опыта, какой Java библиотекой лучше пользоваться чтобы читать pbf файл напрямую? Поиск показал что есть варианты, но анализа что лучше/быстрее нет, многие посты 2-3 летней давности. По каким-то библиотекам было замечание что они не поддерживаются, т.е. потенциально могут перестать работать после каких-то очередных изменений (формата, Java и т.п.).

Требования к Java библиотеке такие: нужно читать pbf, запись не нужна, хотя наличие такой возможности может быть потенциально полезной. Нужно просто быстро читать pbf файл и анализировать теги всех записей. Работать нужно с pbf России, т.е. 2.5Гб файлом (т.е. не planet-OSM), т.е. работа в оперативке вполне устраивает.

Если у кого-то есть опыт - поделитесь, пожалуйста!

pbf-формат и не менялся, поэтому нет ничего плохого в библиотеках такой давности.
Да и кратный прирост можно достичь, только из-за блочности формата, когда его можно читать в несколько потоков.
Так же не вижу смысла ворочить 2.5Гб файл, когда его можно предварительно отфильтровать и там останется мегабайт 100.