Импорт открытых данных министерства культуры

Да, это офис театра.

Это shop=ticket + operator=Большой театр

  • tickets:theatre=yes

Отправил им запрос, если представления есть по этому или возможно другому адресу, театра, если только офис, shop=ticket + operator.
В случае Большого театра, указанных вами тегов, не наблюдаю. Зато налеплено куча переводов.

Пожалуйста, помните, что люди разные. Мне, например, поднять телефонную трубку и уточнить очень сложно, я это сделаю только если это моя работа и дедлайн по этой задаче был две недели назад.

Из сайта очевидно, что выступают они не на Марата. Нажали «Not There» и закончили тему, зачем демагогию разводить.

По многочисленным просьбам, добавил поддержку пространства имён “contact:”. Теперь изменяются правильные теги, независимо от наличия префикса в осме или во внешнем наборе данных. Пример.

Ну можно и какой-нибудь office=theater ставить. Теги то у нас все есть (amenity=theater|office=company/theater|shop=ticket), если чего не хватает - можно и новый придумать. Беда в том, что в данных для импорта эти категории не разделяются… У некоторых театров и площадок то постоянных нет, один юр. адрес, выше пример приводил.
С музеями, кстати, тоже самое было, с теми же галереями и прочим.

В данных классификации нет, к сожалению. Вернее, есть, но 100% театры. Поэтому остаётся гуглить подозрительные театры и жать «Not There».

Если всё ещё интересно, то юридический адрес у них действительно на Марата (191025, ГОРОД САНКТ-ПЕТЕРБУРГ, УЛИЦА МАРАТА, ДОМ 10, КВАРТИРА 15), но на местности никаких обозначений, что там театр, нет. То есть желающие могут офис там отметить.

Юридический адрес абсолютно не равен наличию офиса. Многие конторы имеют стандартный юридический адрес, обычно компании-регистратора (бывают такие адреса, являющиеся юридическими для тысяч компаний), не имеющий никакого отношения к местоположению офиса. Так что ничего не надо отмечать.

У некоторых это время работы касс, например
http://audit.osmz.ru/browse/mrkf_theaters/9542

У некоторых других - нет, например
http://audit.osmz.ru/browse/mrkf_theaters/15840

В данном случае скорее всего это не стандартный адрес. А про отмечать я сказал потому что amenity=theater уже отмечен, и если он так и останется, то я его потру, когда доберусь до этого места, а если его на офис поменяют, то оставлю.

Семизначных городов (трёхзначный код) не так много wikipedia
Другой вопрос что могут быть четёрёхзначные коды и номера на двойку (у нас такие есть) и т.д.

Мой usecase: посмотреть телефон на сайте/2gis и набрать со стационарного короткий (у нас не Мск и 11 знаков пока не обязательны, достаточно 6-ти).

PS У бабушки был трёхзначный номер :slight_smile:

Это всё круто, но где чёткие правила по форматированию номеров?
Для импорта заправок в Великобритании я нашёл такие правила в вики, и в семь строк запрограммировал на питоне. Для России есть только дао лебедева про пробелы и дефисы.

Однако у истории есть продолжение …

Посмотрел их выступление на дне открытых данных. Так-то похоже, что ребята знают своё дело, даже нейронные сети приделывали. В общем-то они призывали сообщать им об ошибках. А ещё у каждого отделения культуры есть свой личный кабинет, а значит они куда ближе к конечным данным.

П.С. Да, и ещё, они сказали, что загнали музеи в Яндекс.Справочник. Кто готов проверить их геопревязку на кривых объектах.

Спустя два года после начала, импорт завершён. Спасибо Валерию за «неделю театров», которая помогла завершить валидацию.

После загрузки у нас 103 театра с тегом fixme. Ссылка ведёт на проект MapRoulette, где вы не спеша можете править по несколько театров за раз.

103 тега fixme это, безусловно, победа.

Согласен, нечасто увидишь импорт, в котором все проблемы помечены и их можно исправить.

Спарсил музеи, кинотеатры, дома культуры и библиотеки из датасета Министрества культуры в проект alltheplaces. Скрипт забирает данные еженедельно. Чтобы скачать данные надо перейти по этой ссылке и в поиске вбить mkrf_ru.