Импорт открытых данных министерства культуры

Сотрудник подведомственной Минкульту организации предлагает импортировать некоторые наборы открытых данных с и х портала: http://opendata.mkrf.ru/opendata/ . Атрибуции достаточно на соответствующей вики-странице.

Я подготовил импорт музеев: http://audit.osmz.ru/project/museums
3841 музей в наборе, ~1800 сматчились на осм, ~2000 новых.
Повалидируйте знакомые вам и просто случайные, пожалуйста. Я сам тоже просмотрю.

Обновление: открытые данные по музеям оказались плохи. Импортируем театры, они лучше: http://audit.osmz.ru/project/mrkf_theaters

Не нравится мне дублирование этим импортом тегов в contact:*, а так же addr:full там где он избыточен.

На 105 тегов contact:website на музеях в осме 1451 тег website. OSM Conflator не умеет выбирать правильный тег среди нескольких, поэтому я взял самый частый. Не ошибка, как по мне.

Addr:full во многих случаях помогает найти ошибку или, наоборот, уточнить адрес на местности. Избыточен — отметь, что не нужен.

Ещё по сайтам, предлагает заменить точный адрес, на корень
http://ulzapovednik.ru/muzei/nauchno-vystavochnyy-kompleks-na-moskovskoy/http://www.ulzapovednik.ru/

Не совсем понял, а схему он выбрать может, если уже есть contact: то работать с ней.

Я специально писал весь этот веб-интерфейс, чтобы в случае таких косяков можно было просто нажать на правильный адрес, и он не перезаписался при импорте.

Ты несколько переоцениваешь интеллект роботов :slight_smile: В смысле, нет, пока скрипт импорта не ожидает, что один и тот же атрибут может обозначаться разными тегами, в зависимости от религиозных взглядов активных мапперов в регионе.

Что-то я не понял, как корабль, причаленный к набережной, вдруг в лес унесло.

Да, дублирование - это прямая ошибка.

Есть два ярлыка, зеленый и синий, объясни, какой зачем. Первый я понял, двигаешь на точку… а второй? И вообще это хорошее дело и адреса новые и названия правильные.

Зелёный - новый, создаваемый объект. Синий - старый, изменяемый.

Часть музеев там не совсем музеи.
Например http://audit.osmz.ru/browse/museums/6242 - Галерея искусств KGallery
Координаты в 13 км от реального положения, откуда они такие вообще взялись?

В OSM отмечено как shop=art, что наверное тоже некорректно, более подходящий тег tourism=gallery - http://www.openstreetmap.org/node/3398900946

Аналогично и эта галерея: http://audit.osmz.ru/browse/museums/6249

Этот музей снесли вместе с заводом: http://audit.osmz.ru/browse/museums/6571
Вроде экспозиции переехали в другое место: http://lsrstena.ru/muzey-istorii-kirpicha-ot-gruppyi-lsr.html

Приостановил валидацию импорта. Хочу сделать кнопку «не мёржить, а сделать новую точку», потому что без неё слишком много неправильных сопоставлений. Заодно телефоны отформатирую.

Снова открыл валидацию — прокликайте пару десятков музеев, пожалуйста. Больше — лучше. Проверить нужно каждый, хотя бы по разу. Попутно отформатировал номера телефонов.

Насчёт phone против contact:phone — на изменяемых музеях 118 contact:phone и 281 phone. Заглянул в код скрипта по слиянию данных, но сделать поддержку такой нечёткой схемы тегирования непросто. После импорта можно будет скачать объекты с дублирующимися тегами из overpass и обновить скопом.

В валидаторе появилась кнопка «сделать новый объект», после нажатия на «Don’t Change». Нажимайте её, когда музей сматчился неправильный. При необходимости пишите в fixme насчёт правильного музея ну и вообще, что нужно поправить потом в JOSM.

Я бы очень хотел, чтобы картой OpenStreetMap могли пользоваться туристы для планирования маршрутов. Для этого объекты Минкульта важны. Заходите время от времени и прокликивайте объекты. Пусть не в этом году, но мы импортируем набор.

http://audit.osmz.ru/project/museums

Я как-то обрабатывал такого рода данные. Получилось Garbage In - Garbage Out. Качество исходных данных оказалось сильно ниже ожидаемого. Как раз куча ситуаций типа приведённых выше. Пришлось каждый музей проходить отдельно “ручками”.

прачечные?

На tourism=gallery никак не реагирует?

Офис учреждения, которое этими музеями управляет, например.

Остров Новая Голландия весь целиком - музей?
http://audit.osmz.ru/browse/museums/7995

Есть даже то, что я сам удалял, например
Музей живых бабочек «Тропический рай»
http://audit.osmz.ru/browse/museums/8374

Валидатор всегда после обработки всегда в случайное место посылает? Я не знаю, какие музеи есть в Иркутске и т.п.

Так, ладно, я понял. Снова остановил проверку, на этот раз — навсегда. Дам ссылку на эту тему сотруднику, который предложил импортировать. Большое спасибо всем за комментарии и извините за потраченное время. «Новая Голландия» убила, конечно.

Зря, так бы потихоньку что в ручную, что автоматом бы, да сделали. Так куда удобнее, да и не надо рыть по всем поселкам.