Москва и Московская область (обсуждение)

Нет, про внесенные вами POI.

Разница в том, что для импортов есть определенные особые критерии.

Мои единичные точки достаточно просто исправить и верифицировать в отличии от сотен точек в данном случае, да ещё на фоне уже проставленных и непонятно кем отслеживаемых, и непонятно работающих или нет. Если ДИТ заинтересован в точках то это его ответственность и работа, а главное с госорганизации спроса нет - разведут руками если что не так. Делов то.

  1. Ты уверен, что ДИТ этого не делает?
  2. Этот набор данных полнее, точнее и обновляется чаще, чем то, что есть в OSM. Например, парковочная зона не обозначена ни на одном паркомате, а номер паркомата отмечен только на шести, три из которых внёс я сам.

Эта претензия подходит для абсолютно любого импорта и на неё почти никогда невозможно ответить. Так что прошу вопрос по конкретным ошибкам (файл osc я дал).

Полнее и обновляется чаще - вполне может быть. Точнее - по этому поводу мы не видели никакого объективного анализа, потому утверждать это (как и обратное, впрочем) реальных оснований нет.

Давайте без демагогических аргументов. Это типичный ad hominem, он же - “сначала добейся”.

Нет не уверен, но немного знаком с работой госорганов в которых всё через зад делают. Да мне как то без разницы, что и как добавят, Зверик и Ко в этом вопросе авторитеты и ни чета мне. Тут проблемы нет наверное. Тем более, что любой паркомат в пределах 100м от парковки и его видно или есть указатели на него. Мне они что есть, что нет на карте без разницы - это если в пустыне мне пишут на карте, что до песка 20 м. Карта скорее ДИТу и будет полезна.

Но ведь не один же ты, весь ОСМ наполнен проставленных и непонятно кем отслеживаемых, и непонятно работающих или нет POI.

Напоминаю, что в соответствии с Import Guidelines, ответственность за качество данных в импорте несет импортирующий, а принцип “не пойман - не вор”, он же “найдите ошибку, тогда я ее признаю” тут не применим. Если пресловутое сообщество хочет видеть хотя бы оценку качества данных не в виде слов “я глянул и мне кажется, что все нормально” - это право сообщества.

Самый простой способ оценить качество и дать другим в этом убедиться - набросать ссылок на десяток паркоматов в одной какой-то области и соответствующих им ссылок на панорамы Яндекса или Mapilliary.

А это не коллега to4ka2 придумал, что к действиям живых пользователей в OSM принято по умолчанию относиться с определенной степенью доверия, а к импортам - наоборот.

“Найдите ошибку, тогда я ее признаю” — это общий принцип OpenStreetMap. Мы ни у кого не требуем предъявить доказательства наличия объектов на местности, но правим или откатываем, если объекты нанесены неправильно или не те.

Разумеется, это не повод лить шлак в базу, и я — разумеется — проверил данные после сборки. И собирал их не меньше десяти раз, настраивая теги и сравнивая с данными в OSM. Все знакомые мне паркоматы там есть, погрешность, на мой взгляд, небольшая. Если я сделаю ссылки на панорамы, тут точно так же будут претензии, что а что насчёт остальных 740 паркоматов. Куда эффективнее будет заинтересованным открыть файл в JOSM, подложить слой OSM и посмотреть знакомые паркоматы, как это делал я.

Давайте не все сразу загрузим и посмотрим?

Этот принцип, как я уже сказал выше, распространяется только на частные правки. В отношении импортов существует вполне понятная презумпция виновности.

Что касается проверки по выборке, это вполне нормальный способ предварительной оценки. Главное - устранить selection bias, то есть взять сплошную выборку в какой-то случайной области. Это вполне научно, а если кому-то не нравится - пусть спорят с принципами математической статистики или укажут на ошибку в принципе выборки. Происхождение этого набора данных - однородное (речь не идет, как в случае с тем же каталогом зданий, о составном наборе с разными исходными источниками), потому взять, условно, квадрат 1х1 км и посмотреть, что в нём, будет вполне репрезентативной выборкой. Если у кого-то есть соображения, почему не будет - я готов их услышать.

Я всего-навсего предлагаю подойти к вопросу со строгой, не побоюсь этого слова - научной точки зрения, вместо того, чтобы меряться личным авторитетом или другими органами.

Сначала я дам несколько ссылок на Mapillary с паркоматами. Случайная выборка изо всех концов Москвы.

Новые, нашёл рядом с точками: 1, 2, 3, 4, 5 (ошибка в 25 метров: не тот угол дома),
Есть в OSM, нет в базе: слева на тротуаре, прямо перед носом, рядом со знаком, на месте мусорки

Из-за тормознутости плагина для JOSM я потратил слишком много времени на выборку. Снимков в Mapillary очень мало и часто смотрят не туда. В яндекс.панорамах большей части паркоматов нет, т.к. они очень старые. Других источников я не знаю. Ногами квадрат 1×1 км обегайте сами.

И теперь я хочу сказать, что это всё зря, потому что вот прямо сейчас у нас эталонное обсуждение импорта, чего ещё, кажется, никто никогда не делал. Ссылки будут давать именно сюда. Другие, кто захочет что-то залить в осм, посмотрят на придирки, плюнут и продолжат заливать втихую, потому что сообщество OpenStreetMap не умеет доверять. Данные организации, которая ответственна за расстановку паркоматов, — не авторитет, доверяем только своим глазам. Условная «пятёрочка» представит спор на несколько страниц, где она доказывает, что не верблюд, то есть, что их набор данных действительно содержит актуальную информацию по всем магазинам, и не станет ввязываться. OSM не получает данных, пользователи не могут найти магазин, поставщики видят этот детский сад, продолжаем вносить только то, что видим глазами.

Да, у нас эталонное обсуждение импорта, с предложенным открыто критерием оценки качества данных, как, в общем, и предписывают Import Guidelines.
А вы его используете для того, чтобы перевернуть все с ног на голову и убедить присутствующих, что эти guidelines - не просто ерунда, а зло, потому что “мы пугаем владельцев данных”.

Чем это отличается от ситуации, когда какой-нибудь индивидуум хочет “облагодетельствовать” проект и внести данные, скажем, из Википедии, используя избитую демагогию про “OSM много теряет” и так далее? Практически - ни чем. Ну, кроме того, что этот индивидуум отстаивает свое собственное мнение, а тут речь идет также о возможности для проекта maps.me похвастаться потом: “а теперь у нас и паркоматы” (это к вопросу о возможном конфликте интересов).

На квадрате именно 1х1 км я не настаивал - там было слово “условно”.
А произвольная несплошная выборка, к большому сожалению, не обладает нужным свойством исключения collection bias, потому что она, с тем же успехом, может оказаться вовсе не случайной.
Я не могу вам запретить это импортировать, но вынужден констатировать, что предложенный критерий проверки вы использовать так или иначе не смогли или не захотели.

2Zverik
Не, а как иначе, чем через скепсис? Бушман дело говорит же - не нужно с наскока добавлять такую кучу данных. Я вот лично не знаю откуда у ДИЦа данные по их аппаратам и не знаю какова у них процедура регистрации и оформления. Может там дядя Вася сгрузил из самосвала, а потом растащил по улице, расставив галочки в пунктах с адресами у себя в наряде, позвонил тёте Маше о выполненной работе. Всё - можно вносит в OSM. А может каждый аппарат по встроенному GPS передаёт свои координаты и путём хитрых программ они встраиваются в общую схему. Допустим захочет Почта России внести в базу OSM свои почтовые ящики (синии такие), а зная, какой там бардак я могу только догадываться, что они сюда натыкают из своих баз.
2ALL Но, что бы не было я только за развитие и данные, которые идут на пользу. Давайте внесём. Проблемы будут только у пользователей, которые не определят терминал на своём гаджете. По факту такие терминалы должны находится в лютый ливень в 1 ночи без проблем (указатели там всякие и подсветки), а карты лишь удобное подспорье. Ни кто не мешает потом всё откатить, насколько я понимаю систему.

Если условия осуществления импорта соблюдены (отдельный акаунт, другие средства идентификации changeset-ов или объектов), откатить можно всегда.

Меня в этой истории смущает еще один момент - затевается ведь не одномоментный импорт, а импорт с обновлением. При этом довольно неясно, как будет разрешаться ситуация, когда паркомат был, а потом его в очередной выгрузке нет. Его снесли или его Вася случайно удалил? Вроде как очевидное решение - не удалять, а пометить fixme=resurvey и note=“возможно, убран” - а как пользователи данных об этом узнают?

Да, я не спорю с фактом того, что к импортам отношение более строгое, чем к внесенным индивидуально данным. Но исходят, в данном случае, из соображения того, что вероятность индивидуального внесения сразу большого объема кривых данных - мала. А с импортами - наоборот. Но раз делается это один раз, то считается, что от “семь раз отмерь” автор импорта не развалится. В конце концов, речь вроде все еще идет о создании лучшей свободной карты мира, а не самой наполненной данными (неизвестного качества).

Про аргументы против - добавлю: если коллега Zverik обладает знанием о том, что кто-то “плюнул и продолжил заливать втихую” - почему бы на это не указать прямо? Иначе - это выдача возможного за действительное, логическая уловка.

Повторю: я ни в коем случае не против внесения новых данных, я всего лишь за соблюдение принятых при этом мер. И не понимаю, ради чего менять установленный порядок (который до того никого не смущал). Тем более странно выглядит все это, учитывая, что Zverik сам не раз и не два критиковал желающих импортировать что-либо.

Имея опыт работы с разного рода списков POI из разных мест, могу с уверенностью сказать - абсолютное их большинство очень низкого качества, в которых присутствуют как давно неактуальные так и просто изначально ошибочные данные. Координаты в этих списках как правило получаются при помощи разного рода геокодеров из адресов, что привносит свои дополнительные ошибки.

Поэтому эти “придирки” - увы, это вполне обоснованные сомнения в качестве. Чем меньше времени потратится на проверку - тем обычно хуже результат. Доверия ДИТ-у тоже не очень много. К примеру, имел опыт работы с данными остановок общественного транспорта от того же ДИТ-а, встречались ошибки в 100 метров от реального их положения, приходилось по панорамам Яндекса их искать, чтобы исправить на реальное, иначе транспортная работа по GPS/ГЛОНАСС нормально не считалась.

Номер телефона будет добавлен в виде +7 495 539-54-54. Лучше использовать формат, предлагаемый в вики:

  • Использовать один тип разделителя вместо двух (только пробел или только дефис).
  • Не использовать разделители в номере телефона.

В этом формате номер имел бы вид +7 495 5395454.

Поскольку автор предлагаемого импорта предпочитает вставать в позу и рассказывать всем, какие тут все недоверчивые, а не искать практическое решение, я взял на себя смелость проверить часть этих данных. Для этого использовал сайт Электронный Атлас Москвы, где открытые (и не очень) московские данные выложены все в одном месте. Панорамы центра Москвы (по крайней мере) там датируются началом октября 2016 года. Метод выбора - начал со случайного паркомата в центре и просматривал все соседние, не пропуская ничего специально, открыв обзорную карту на 10-м зуме. Подчеркну, что в данном случае речь идет о сравнении содержимого двух наборов (панорам и паркоматов), так что вопрос лицензионной чистоты панорам не стоит.

Результат можете оценить сами:

http://atlas.mos.ru/?lang=ru&z=10&ll=37.63914181546353%2C55.760227573242354&l=417&pa=-48.3&pp=37.63914495%2C55.76022716&o=1774768
http://atlas.mos.ru/?lang=ru&z=10&ll=37.63909890012027%2C55.76065617365335&l=417&pa=285.7&pp=37.63758555%2C55.76063289&o=1774768
http://atlas.mos.ru/?lang=ru&z=10&ll=37.63563348607255%2C55.76033019630577&l=417&pa=225.2&pp=37.63563467%2C55.76032963&o=1774768
http://atlas.mos.ru/?lang=ru&z=10&ll=37.63430847481901%2C55.761280955953026&l=417&pa=139.8&pp=37.63431256%2C55.76128053&o=1774768
http://atlas.mos.ru/?lang=ru&z=10&ll=37.63504340008919%2C55.76225131054715&l=417&pa=229.6&pp=37.63504631%2C55.76224848&o=1774768
http://atlas.mos.ru/?lang=ru&z=10&ll=37.63205005482821%2C55.76378753018503&l=417&pa=267.3&pp=37.63205177%2C55.76378243&o=1774768
http://atlas.mos.ru/?lang=ru&z=10&ll=37.626642721454644%2C55.76329860240659&l=417&pa=-17.9&pp=37.6265067%2C55.76329524&o=1774768
http://atlas.mos.ru/?lang=ru&z=10&ll=37.623499172488756%2C55.76335896419248&l=417&pa=131.6&pp=37.62349991%2C55.7633584&o=1774768
http://atlas.mos.ru/?lang=ru&z=10&ll=37.62239946679251%2C55.7637724399133&l=417&pa=-33.9&pp=37.62240022%2C55.76376975&o=1774768
http://atlas.mos.ru/?lang=ru&z=10&ll=37.617324727335635%2C55.76402897374039&l=417&pa=-34.3&pp=37.61732901%2C55.76402828&o=1774768
http://atlas.mos.ru/?lang=ru&z=10&ll=37.618000644008085%2C55.76226941957886&l=417&pa=260.1&pp=37.6180008%2C55.76226657&o=1774768
http://atlas.mos.ru/?lang=ru&z=10&ll=37.61820985631065%2C55.76187705533608&l=417&pa=76.7&pp=37.61821237%2C55.76187664&o=1774768
http://atlas.mos.ru/?lang=ru&z=10&ll=37.61672391251619%2C55.762326764790295&l=417&pa=146.8&pp=37.61672401%2C55.76232528&o=1774768
http://atlas.mos.ru/?lang=ru&z=10&ll=37.609868186274774%2C55.76312355269816&l=417&pa=-32.9&pp=37.6098685%2C55.76312308&o=1774768
http://atlas.mos.ru/?lang=ru&z=10&ll=37.60655297593191%2C55.76261047144208&l=417&pa=112.6&pp=37.60655326%2C55.7626102&o=1774768
http://atlas.mos.ru/?lang=ru&z=10&ll=37.60250284031887%2C55.76259839886064&l=417&pa=125.8&pp=37.60250632%2C55.76259826&o=1774768

Итого: в центре положение большинства (не всех) паркоматов “в пределах видимости” от точки, где они обозначены. Тех, чья реальная проекция на осевую дороги совпадала бы с проекцией в этом наборе данных - где-то половина. Есть и такие, которые находятся в паре десятков метров (вероятно, это единицы процентов). Откровенный бред в данных я не обнаружил, по крайней мере - в этой выборке.

Править, вероятно, придётся все точки. Потому импорт в полуручном режиме (при наличии возможности увидеть живьем или где-то еще истинное положение) - предпочтительнее. Иначе, большинство точек имеют шанс оказаться “на домах” или “на другой стороне дороги”. Как вариант, импортировать все точки с тегом fixme=resurvey, пусть мозолят глаза в keepright и JOSM, пока не встанут на место.

Да, кто-нибудь помнит, что там с лицензией на эти панорамы?

Да, к слову - не знаю, кто там делал дизайн этих паркоматов, вероятно - как всегда, жульническая конторка Артемия Лебедева (не знаю, это educated guess), но сделали их так, чтобы их как можно сложнее было увидеть. Какая-то серо-пятнистая тумба ниже роста человека, в центре, который заставлен машинами и черт знает чем - это просто гениально.