Москва и Московская область (обсуждение)

Но ведь не один же ты, весь ОСМ наполнен проставленных и непонятно кем отслеживаемых, и непонятно работающих или нет POI.

Напоминаю, что в соответствии с Import Guidelines, ответственность за качество данных в импорте несет импортирующий, а принцип “не пойман - не вор”, он же “найдите ошибку, тогда я ее признаю” тут не применим. Если пресловутое сообщество хочет видеть хотя бы оценку качества данных не в виде слов “я глянул и мне кажется, что все нормально” - это право сообщества.

Самый простой способ оценить качество и дать другим в этом убедиться - набросать ссылок на десяток паркоматов в одной какой-то области и соответствующих им ссылок на панорамы Яндекса или Mapilliary.

А это не коллега to4ka2 придумал, что к действиям живых пользователей в OSM принято по умолчанию относиться с определенной степенью доверия, а к импортам - наоборот.

“Найдите ошибку, тогда я ее признаю” — это общий принцип OpenStreetMap. Мы ни у кого не требуем предъявить доказательства наличия объектов на местности, но правим или откатываем, если объекты нанесены неправильно или не те.

Разумеется, это не повод лить шлак в базу, и я — разумеется — проверил данные после сборки. И собирал их не меньше десяти раз, настраивая теги и сравнивая с данными в OSM. Все знакомые мне паркоматы там есть, погрешность, на мой взгляд, небольшая. Если я сделаю ссылки на панорамы, тут точно так же будут претензии, что а что насчёт остальных 740 паркоматов. Куда эффективнее будет заинтересованным открыть файл в JOSM, подложить слой OSM и посмотреть знакомые паркоматы, как это делал я.

Давайте не все сразу загрузим и посмотрим?

Этот принцип, как я уже сказал выше, распространяется только на частные правки. В отношении импортов существует вполне понятная презумпция виновности.

Что касается проверки по выборке, это вполне нормальный способ предварительной оценки. Главное - устранить selection bias, то есть взять сплошную выборку в какой-то случайной области. Это вполне научно, а если кому-то не нравится - пусть спорят с принципами математической статистики или укажут на ошибку в принципе выборки. Происхождение этого набора данных - однородное (речь не идет, как в случае с тем же каталогом зданий, о составном наборе с разными исходными источниками), потому взять, условно, квадрат 1х1 км и посмотреть, что в нём, будет вполне репрезентативной выборкой. Если у кого-то есть соображения, почему не будет - я готов их услышать.

Я всего-навсего предлагаю подойти к вопросу со строгой, не побоюсь этого слова - научной точки зрения, вместо того, чтобы меряться личным авторитетом или другими органами.

Сначала я дам несколько ссылок на Mapillary с паркоматами. Случайная выборка изо всех концов Москвы.

Новые, нашёл рядом с точками: 1, 2, 3, 4, 5 (ошибка в 25 метров: не тот угол дома),
Есть в OSM, нет в базе: слева на тротуаре, прямо перед носом, рядом со знаком, на месте мусорки

Из-за тормознутости плагина для JOSM я потратил слишком много времени на выборку. Снимков в Mapillary очень мало и часто смотрят не туда. В яндекс.панорамах большей части паркоматов нет, т.к. они очень старые. Других источников я не знаю. Ногами квадрат 1×1 км обегайте сами.

И теперь я хочу сказать, что это всё зря, потому что вот прямо сейчас у нас эталонное обсуждение импорта, чего ещё, кажется, никто никогда не делал. Ссылки будут давать именно сюда. Другие, кто захочет что-то залить в осм, посмотрят на придирки, плюнут и продолжат заливать втихую, потому что сообщество OpenStreetMap не умеет доверять. Данные организации, которая ответственна за расстановку паркоматов, — не авторитет, доверяем только своим глазам. Условная «пятёрочка» представит спор на несколько страниц, где она доказывает, что не верблюд, то есть, что их набор данных действительно содержит актуальную информацию по всем магазинам, и не станет ввязываться. OSM не получает данных, пользователи не могут найти магазин, поставщики видят этот детский сад, продолжаем вносить только то, что видим глазами.

Да, у нас эталонное обсуждение импорта, с предложенным открыто критерием оценки качества данных, как, в общем, и предписывают Import Guidelines.
А вы его используете для того, чтобы перевернуть все с ног на голову и убедить присутствующих, что эти guidelines - не просто ерунда, а зло, потому что “мы пугаем владельцев данных”.

Чем это отличается от ситуации, когда какой-нибудь индивидуум хочет “облагодетельствовать” проект и внести данные, скажем, из Википедии, используя избитую демагогию про “OSM много теряет” и так далее? Практически - ни чем. Ну, кроме того, что этот индивидуум отстаивает свое собственное мнение, а тут речь идет также о возможности для проекта maps.me похвастаться потом: “а теперь у нас и паркоматы” (это к вопросу о возможном конфликте интересов).

На квадрате именно 1х1 км я не настаивал - там было слово “условно”.
А произвольная несплошная выборка, к большому сожалению, не обладает нужным свойством исключения collection bias, потому что она, с тем же успехом, может оказаться вовсе не случайной.
Я не могу вам запретить это импортировать, но вынужден констатировать, что предложенный критерий проверки вы использовать так или иначе не смогли или не захотели.

2Zverik
Не, а как иначе, чем через скепсис? Бушман дело говорит же - не нужно с наскока добавлять такую кучу данных. Я вот лично не знаю откуда у ДИЦа данные по их аппаратам и не знаю какова у них процедура регистрации и оформления. Может там дядя Вася сгрузил из самосвала, а потом растащил по улице, расставив галочки в пунктах с адресами у себя в наряде, позвонил тёте Маше о выполненной работе. Всё - можно вносит в OSM. А может каждый аппарат по встроенному GPS передаёт свои координаты и путём хитрых программ они встраиваются в общую схему. Допустим захочет Почта России внести в базу OSM свои почтовые ящики (синии такие), а зная, какой там бардак я могу только догадываться, что они сюда натыкают из своих баз.
2ALL Но, что бы не было я только за развитие и данные, которые идут на пользу. Давайте внесём. Проблемы будут только у пользователей, которые не определят терминал на своём гаджете. По факту такие терминалы должны находится в лютый ливень в 1 ночи без проблем (указатели там всякие и подсветки), а карты лишь удобное подспорье. Ни кто не мешает потом всё откатить, насколько я понимаю систему.

Если условия осуществления импорта соблюдены (отдельный акаунт, другие средства идентификации changeset-ов или объектов), откатить можно всегда.

Меня в этой истории смущает еще один момент - затевается ведь не одномоментный импорт, а импорт с обновлением. При этом довольно неясно, как будет разрешаться ситуация, когда паркомат был, а потом его в очередной выгрузке нет. Его снесли или его Вася случайно удалил? Вроде как очевидное решение - не удалять, а пометить fixme=resurvey и note=“возможно, убран” - а как пользователи данных об этом узнают?

Да, я не спорю с фактом того, что к импортам отношение более строгое, чем к внесенным индивидуально данным. Но исходят, в данном случае, из соображения того, что вероятность индивидуального внесения сразу большого объема кривых данных - мала. А с импортами - наоборот. Но раз делается это один раз, то считается, что от “семь раз отмерь” автор импорта не развалится. В конце концов, речь вроде все еще идет о создании лучшей свободной карты мира, а не самой наполненной данными (неизвестного качества).

Про аргументы против - добавлю: если коллега Zverik обладает знанием о том, что кто-то “плюнул и продолжил заливать втихую” - почему бы на это не указать прямо? Иначе - это выдача возможного за действительное, логическая уловка.

Повторю: я ни в коем случае не против внесения новых данных, я всего лишь за соблюдение принятых при этом мер. И не понимаю, ради чего менять установленный порядок (который до того никого не смущал). Тем более странно выглядит все это, учитывая, что Zverik сам не раз и не два критиковал желающих импортировать что-либо.

Имея опыт работы с разного рода списков POI из разных мест, могу с уверенностью сказать - абсолютное их большинство очень низкого качества, в которых присутствуют как давно неактуальные так и просто изначально ошибочные данные. Координаты в этих списках как правило получаются при помощи разного рода геокодеров из адресов, что привносит свои дополнительные ошибки.

Поэтому эти “придирки” - увы, это вполне обоснованные сомнения в качестве. Чем меньше времени потратится на проверку - тем обычно хуже результат. Доверия ДИТ-у тоже не очень много. К примеру, имел опыт работы с данными остановок общественного транспорта от того же ДИТ-а, встречались ошибки в 100 метров от реального их положения, приходилось по панорамам Яндекса их искать, чтобы исправить на реальное, иначе транспортная работа по GPS/ГЛОНАСС нормально не считалась.

Номер телефона будет добавлен в виде +7 495 539-54-54. Лучше использовать формат, предлагаемый в вики:

  • Использовать один тип разделителя вместо двух (только пробел или только дефис).
  • Не использовать разделители в номере телефона.

В этом формате номер имел бы вид +7 495 5395454.

Поскольку автор предлагаемого импорта предпочитает вставать в позу и рассказывать всем, какие тут все недоверчивые, а не искать практическое решение, я взял на себя смелость проверить часть этих данных. Для этого использовал сайт Электронный Атлас Москвы, где открытые (и не очень) московские данные выложены все в одном месте. Панорамы центра Москвы (по крайней мере) там датируются началом октября 2016 года. Метод выбора - начал со случайного паркомата в центре и просматривал все соседние, не пропуская ничего специально, открыв обзорную карту на 10-м зуме. Подчеркну, что в данном случае речь идет о сравнении содержимого двух наборов (панорам и паркоматов), так что вопрос лицензионной чистоты панорам не стоит.

Результат можете оценить сами:

http://atlas.mos.ru/?lang=ru&z=10&ll=37.63914181546353%2C55.760227573242354&l=417&pa=-48.3&pp=37.63914495%2C55.76022716&o=1774768
http://atlas.mos.ru/?lang=ru&z=10&ll=37.63909890012027%2C55.76065617365335&l=417&pa=285.7&pp=37.63758555%2C55.76063289&o=1774768
http://atlas.mos.ru/?lang=ru&z=10&ll=37.63563348607255%2C55.76033019630577&l=417&pa=225.2&pp=37.63563467%2C55.76032963&o=1774768
http://atlas.mos.ru/?lang=ru&z=10&ll=37.63430847481901%2C55.761280955953026&l=417&pa=139.8&pp=37.63431256%2C55.76128053&o=1774768
http://atlas.mos.ru/?lang=ru&z=10&ll=37.63504340008919%2C55.76225131054715&l=417&pa=229.6&pp=37.63504631%2C55.76224848&o=1774768
http://atlas.mos.ru/?lang=ru&z=10&ll=37.63205005482821%2C55.76378753018503&l=417&pa=267.3&pp=37.63205177%2C55.76378243&o=1774768
http://atlas.mos.ru/?lang=ru&z=10&ll=37.626642721454644%2C55.76329860240659&l=417&pa=-17.9&pp=37.6265067%2C55.76329524&o=1774768
http://atlas.mos.ru/?lang=ru&z=10&ll=37.623499172488756%2C55.76335896419248&l=417&pa=131.6&pp=37.62349991%2C55.7633584&o=1774768
http://atlas.mos.ru/?lang=ru&z=10&ll=37.62239946679251%2C55.7637724399133&l=417&pa=-33.9&pp=37.62240022%2C55.76376975&o=1774768
http://atlas.mos.ru/?lang=ru&z=10&ll=37.617324727335635%2C55.76402897374039&l=417&pa=-34.3&pp=37.61732901%2C55.76402828&o=1774768
http://atlas.mos.ru/?lang=ru&z=10&ll=37.618000644008085%2C55.76226941957886&l=417&pa=260.1&pp=37.6180008%2C55.76226657&o=1774768
http://atlas.mos.ru/?lang=ru&z=10&ll=37.61820985631065%2C55.76187705533608&l=417&pa=76.7&pp=37.61821237%2C55.76187664&o=1774768
http://atlas.mos.ru/?lang=ru&z=10&ll=37.61672391251619%2C55.762326764790295&l=417&pa=146.8&pp=37.61672401%2C55.76232528&o=1774768
http://atlas.mos.ru/?lang=ru&z=10&ll=37.609868186274774%2C55.76312355269816&l=417&pa=-32.9&pp=37.6098685%2C55.76312308&o=1774768
http://atlas.mos.ru/?lang=ru&z=10&ll=37.60655297593191%2C55.76261047144208&l=417&pa=112.6&pp=37.60655326%2C55.7626102&o=1774768
http://atlas.mos.ru/?lang=ru&z=10&ll=37.60250284031887%2C55.76259839886064&l=417&pa=125.8&pp=37.60250632%2C55.76259826&o=1774768

Итого: в центре положение большинства (не всех) паркоматов “в пределах видимости” от точки, где они обозначены. Тех, чья реальная проекция на осевую дороги совпадала бы с проекцией в этом наборе данных - где-то половина. Есть и такие, которые находятся в паре десятков метров (вероятно, это единицы процентов). Откровенный бред в данных я не обнаружил, по крайней мере - в этой выборке.

Править, вероятно, придётся все точки. Потому импорт в полуручном режиме (при наличии возможности увидеть живьем или где-то еще истинное положение) - предпочтительнее. Иначе, большинство точек имеют шанс оказаться “на домах” или “на другой стороне дороги”. Как вариант, импортировать все точки с тегом fixme=resurvey, пусть мозолят глаза в keepright и JOSM, пока не встанут на место.

Да, кто-нибудь помнит, что там с лицензией на эти панорамы?

Да, к слову - не знаю, кто там делал дизайн этих паркоматов, вероятно - как всегда, жульническая конторка Артемия Лебедева (не знаю, это educated guess), но сделали их так, чтобы их как можно сложнее было увидеть. Какая-то серо-пятнистая тумба ниже роста человека, в центре, который заставлен машинами и черт знает чем - это просто гениально.

Прошу прощения, но не могу найти как обозначаются собственно паркоматы.
Автомат по продаже парковочных билетов нашел:
amenity=vending_machine
vending=parking_tickets
Но одно дело купить парковочный билет, другое оплатить парковку на месте наличными, по банковской карте, по той же парковочной карте.
Или все под одну дуду?

Прочитав дискуссию поутру, признаю, что погорячился. Извините.

BushmanK, спасибо за поиск паркоматов на atlas.mos.ru. Он роняет мой браузер, поэтому на нём не проверял. Согласен, что дизайн паркоматов ужасен для поиска на панорамах, но на местности их не очень сложно заметить: быстро вырабатываешь привычку.

Mavl, в каждой стране свои конвенции по записи телефонного номера. Кучу цифр подряд читать сложно, поэтому я пользуюсь русской конвенцией, про которую 15 лет назад понятно написал Тёма Лебедев. Вики, очевидно, придерживается британской конвенции, даже в переводе. Почти все смартфоны умеют удалять лишние символы.

Сергей, я понимаю твои сомнения. Сам наслышан о базе остановок. Поэтому я сравнивал с OSM и своими знаниями. Если бы нашёл много расхождений — не полез бы. Максимальное отклонение, что видел, — 25 метров, обычно же в пределах 5-8. По-моему, терпимо: паркоматы, расставленные осмерами, имеют такую же точность, иногда хуже. Напомню, что когда паркомат нарисован в OSM, координаты берутся от него.

to4ka2, спасибо, что понимаешь практическую пользу от данных. Куча данных в контексте OSM — это десятки и сотни тысяч точек, а не меньше тысячи. Данные данным рознь, и базу почтовых ящиков или даже отделений я бы не стал импортировать: в масштабах страны у госпредприятий очень плохо получается получать координаты. Да что там — даже магазины «Ашан» на сайте имеют километровую погрешность, хотя их всего пара десятков.

Maps.Me тут не при чём, у меня не было задания что-либо импортировать, и никто в компании не в курсе импорта паркоматов. Хотя, конечно, пользователям приложения станет лучше от их наличия, как и пользователям OsmAnd и других приложений.

Фраза про «OSM много теряет», конечно, сомнительна. Я сам не раз показывал слабость подобной аргументации. Что я хотел сказать: за четыре года, когда в Москве работает платная парковка, осмеры нанесли на карту 200 паркоматов, из них, судя по результатам матчинга, почти половина демонтирована. Такими темпами вносить остальные 765 паркоматов мы будем до 2032 года — и, конечно, к тому времени устареет ещё больше данных. Инициативы типа MapRoulette, как проверял Лев (его блог взломан, не могу дать ссылку), не работают для несрочных задач. К тому же, на спутниковых снимках паркоматов не видно, на Mapillary можно найти примерно один из десяти, так что валидация получится сомнительной. Короче, либо импорт, либо найдётся маньяк, который будет дважды в год обходить сам все паркоматы, либо никогда.

Обновляться данные будут по значению тега ref:mos_parking с уникальным идентификатором в базе. Паркоматы из OSM, которых нет в базе, по совету literan обозначены тегами fixme и was:amenity. Профилем импорта забыл поделиться, вот он. В нём написаны все используемые теги. Паркоматы импортировал. Если кто-то откатит, повторных попыток делать не буду, но про актуальность предупредил.

Как бы это покороче? Редко бываю в центре. И вот потребность возникла - Нижняя Масловка 5к3. Где припарковаться, как оплатить?
Иду в OSM - http://www.openstreetmap.org/node/4691343337 - ref=3165 - zone:parking=3212
Иду в Якарты - нахожу нечто - то, не то?! Не важно. Приезжаю паркуюсь бесплатно…
Осознаю важность наличия в навикарте паркоматов. Разбираюсь, в том числе с порядком оплаты и выхожу ещё на результат - http://parking.mos.ru/ - Улица Нижняя Масловка, Дом 5, Корпус 1 - **Парковка №3212 (88) **
Тут же вижу - Парковка №3212 (87) - Улица Правды, Дом 26. Иду в OSM и не вижу этого паркомата (парковки).

P.S. тут к месту обсуждение, цепляюсь, вникаю и понимаю что уже ничего не понимаю:

  • При первичном поиске в OSM был паркомат возле Нижняя Масловка 5к3, теперь нет, да и реально нет, и стоять там нет где. Наверное приснилось.
  • Номера паркоматов не совпадают в OSM и на портале услуги. Благо Зоны совпадают. Хотя что указывать при оплате, так и не понял. В одном месте пишут № паркомата, в другом № зоны, в третьем № парковки.
  • Все говорят о чем угодно, типа о ДИТ который должен добросовестно следить за своими аппаратами, но не о Московском паркинге?

P.S.P.S. база OSM не помогла мне припарковаться. И хорошо что я нашел альтернативное решение. 40-60-80 ре не жалко за час парковки. Трудно найти черную кошку в темной комнате.

del Вопрос решен

На сайте parking.mos.ru отмечены и подписаны парковочные места, а не паркоматы. 3212 — это номер парковочной зоны, к которой приписаны несколько парковочных мест и паркоматов. (88) — это номер парковочного места, который не имеет практической пользы. В тегах это zone:parking. Паркомат в реальности именно там, где показывает точка из «иду в OSM», я его видел год назад.

Номера паркоматов совершенно резонно не совпадают с номерами парковочных мест. При оплате нужно указывать номер зоны. Советую поставить приложение, оно автоматически заполняет номер по координатам GPS. К сожалению, в OSM зоны парковки не внести, а размечать парковочные места долго, никто этим не занимается.

literan, спасибо за пояснение. Попробую найти и вернуть теги на таких паркоматах. Жаль, что они были протегированы так же, как уличные. (upd: вернул)

Вообще, исходя из семантики, сочетание тегов amenity=vending_machine + vending=parking_tickets ближе как раз к таким аппаратам в ТЦ и на стоянках - они, по крайней мере, пластиковые карты выдают. Для московских паркоматов, которые, в отличие от европейских, парковочные чеки не выдают, еще надо постараться придумать, что они vending= (да и вообще, vending_machine ли это)