Импорт открытых данных министерства культуры

Что-то я не понял, как корабль, причаленный к набережной, вдруг в лес унесло.

Да, дублирование - это прямая ошибка.

Есть два ярлыка, зеленый и синий, объясни, какой зачем. Первый я понял, двигаешь на точку… а второй? И вообще это хорошее дело и адреса новые и названия правильные.

Зелёный - новый, создаваемый объект. Синий - старый, изменяемый.

Часть музеев там не совсем музеи.
Например http://audit.osmz.ru/browse/museums/6242 - Галерея искусств KGallery
Координаты в 13 км от реального положения, откуда они такие вообще взялись?

В OSM отмечено как shop=art, что наверное тоже некорректно, более подходящий тег tourism=gallery - http://www.openstreetmap.org/node/3398900946

Аналогично и эта галерея: http://audit.osmz.ru/browse/museums/6249

Этот музей снесли вместе с заводом: http://audit.osmz.ru/browse/museums/6571
Вроде экспозиции переехали в другое место: http://lsrstena.ru/muzey-istorii-kirpicha-ot-gruppyi-lsr.html

Приостановил валидацию импорта. Хочу сделать кнопку «не мёржить, а сделать новую точку», потому что без неё слишком много неправильных сопоставлений. Заодно телефоны отформатирую.

Снова открыл валидацию — прокликайте пару десятков музеев, пожалуйста. Больше — лучше. Проверить нужно каждый, хотя бы по разу. Попутно отформатировал номера телефонов.

Насчёт phone против contact:phone — на изменяемых музеях 118 contact:phone и 281 phone. Заглянул в код скрипта по слиянию данных, но сделать поддержку такой нечёткой схемы тегирования непросто. После импорта можно будет скачать объекты с дублирующимися тегами из overpass и обновить скопом.

В валидаторе появилась кнопка «сделать новый объект», после нажатия на «Don’t Change». Нажимайте её, когда музей сматчился неправильный. При необходимости пишите в fixme насчёт правильного музея ну и вообще, что нужно поправить потом в JOSM.

Я бы очень хотел, чтобы картой OpenStreetMap могли пользоваться туристы для планирования маршрутов. Для этого объекты Минкульта важны. Заходите время от времени и прокликивайте объекты. Пусть не в этом году, но мы импортируем набор.

http://audit.osmz.ru/project/museums

Я как-то обрабатывал такого рода данные. Получилось Garbage In - Garbage Out. Качество исходных данных оказалось сильно ниже ожидаемого. Как раз куча ситуаций типа приведённых выше. Пришлось каждый музей проходить отдельно “ручками”.

прачечные?

На tourism=gallery никак не реагирует?

Офис учреждения, которое этими музеями управляет, например.

Остров Новая Голландия весь целиком - музей?
http://audit.osmz.ru/browse/museums/7995

Есть даже то, что я сам удалял, например
Музей живых бабочек «Тропический рай»
http://audit.osmz.ru/browse/museums/8374

Валидатор всегда после обработки всегда в случайное место посылает? Я не знаю, какие музеи есть в Иркутске и т.п.

Так, ладно, я понял. Снова остановил проверку, на этот раз — навсегда. Дам ссылку на эту тему сотруднику, который предложил импортировать. Большое спасибо всем за комментарии и извините за потраченное время. «Новая Голландия» убила, конечно.

Зря, так бы потихоньку что в ручную, что автоматом бы, да сделали. Так куда удобнее, да и не надо рыть по всем поселкам.

Я согласен, что набор важный и что его хорошо бы импортировать, так или иначе. Но выбранный инструмент для этого импорта не подходит. Валидатор импортов хорош, когда данные хорошие: кликаешь good-good-good-good-здесь тег не меняем-good-на снимке нет-good-good-good… А не как с музеями, когда получаешь очередную точку и «блин, а с этой-то что делать?». За время импорта обнаружили:

  • проблемы геокодирования, когда в деревнях точка ложится на середину улицы (и у нас тоже нет адресов);
  • улёты на многие километры — например, Изборский музей в Псковской области улетел в центр Печор;
  • отдельные залы музея обозначены как отдельные музеи, в результате получается куст;
  • в дополнение, одна из этих точек главная (музей + его экспозиции), и сматчится на OSM, конечно, не она;
  • вместо музея в базе какие-то другие достопримечательности, типа церквей или «Новой Голландии»;
  • некоторые музеи давно закрыты, иногда вместе с сайтами;
  • неконсистентные названия и операторы: иногда название два слова, иногда — три строки, для карты это плохо;
  • в данных Минкульта далеко не все музеи, и часто музей матчится на какой-то частный музей, которого у них нет.

По-моему, тут больше задача для валидатора типа как CupIvan написал, либо нужно писать отдельный плагин для JOSM или iD. Чтобы вместе с очередной точкой выдавал редактор, и точку сразу встраивать в окружающую карту.

В JOSM же богатый удалённый доступ. Ссылкой из браузера можно создать новый объект и напихать туда тегов.

в josm мне как-то попадалась чтото типа апи универсального валидатора. но что к чему не помню :frowning:

Полностью поддерживаю! Информация действительно полезная, но для валидации а не импорта.

Я знаю, вы уже успели соскучиться по нажатию на теги и на кнопку «Record changes» :slight_smile:

Попробовал аналогичным образом обработать открытые данные по театрам — и их качество значительно лучше! Театров в базе всего 600, из них 450 сматчились. Сейчас прокликал около двадцати, в целом всё здраво. Отдельные проблемы встречаются, чаще из-за плохого геокодирования, но на то и валидатор импорта, чтобы их отлавливать и либо перетаскивать маркер в правильное место, либо жать «Duplicate».

Посмотрите и прощёлкайте десяток-другой театров сами: http://audit.osmz.ru/project/mrkf_theaters