Москва и Московская область (обсуждение)

to4ka2 Вот то что написал, я с таки же успехом могу адресовать в твой адрес, что на это ответишь?

Не понял, вы на меня работу ДИТа по остлеживанию своих устройств перекладываете?

Что бы это значило?

Нет, про внесенные вами POI.

Разница в том, что для импортов есть определенные особые критерии.

Мои единичные точки достаточно просто исправить и верифицировать в отличии от сотен точек в данном случае, да ещё на фоне уже проставленных и непонятно кем отслеживаемых, и непонятно работающих или нет. Если ДИТ заинтересован в точках то это его ответственность и работа, а главное с госорганизации спроса нет - разведут руками если что не так. Делов то.

  1. Ты уверен, что ДИТ этого не делает?
  2. Этот набор данных полнее, точнее и обновляется чаще, чем то, что есть в OSM. Например, парковочная зона не обозначена ни на одном паркомате, а номер паркомата отмечен только на шести, три из которых внёс я сам.

Эта претензия подходит для абсолютно любого импорта и на неё почти никогда невозможно ответить. Так что прошу вопрос по конкретным ошибкам (файл osc я дал).

Полнее и обновляется чаще - вполне может быть. Точнее - по этому поводу мы не видели никакого объективного анализа, потому утверждать это (как и обратное, впрочем) реальных оснований нет.

Давайте без демагогических аргументов. Это типичный ad hominem, он же - “сначала добейся”.

Нет не уверен, но немного знаком с работой госорганов в которых всё через зад делают. Да мне как то без разницы, что и как добавят, Зверик и Ко в этом вопросе авторитеты и ни чета мне. Тут проблемы нет наверное. Тем более, что любой паркомат в пределах 100м от парковки и его видно или есть указатели на него. Мне они что есть, что нет на карте без разницы - это если в пустыне мне пишут на карте, что до песка 20 м. Карта скорее ДИТу и будет полезна.

Но ведь не один же ты, весь ОСМ наполнен проставленных и непонятно кем отслеживаемых, и непонятно работающих или нет POI.

Напоминаю, что в соответствии с Import Guidelines, ответственность за качество данных в импорте несет импортирующий, а принцип “не пойман - не вор”, он же “найдите ошибку, тогда я ее признаю” тут не применим. Если пресловутое сообщество хочет видеть хотя бы оценку качества данных не в виде слов “я глянул и мне кажется, что все нормально” - это право сообщества.

Самый простой способ оценить качество и дать другим в этом убедиться - набросать ссылок на десяток паркоматов в одной какой-то области и соответствующих им ссылок на панорамы Яндекса или Mapilliary.

А это не коллега to4ka2 придумал, что к действиям живых пользователей в OSM принято по умолчанию относиться с определенной степенью доверия, а к импортам - наоборот.

“Найдите ошибку, тогда я ее признаю” — это общий принцип OpenStreetMap. Мы ни у кого не требуем предъявить доказательства наличия объектов на местности, но правим или откатываем, если объекты нанесены неправильно или не те.

Разумеется, это не повод лить шлак в базу, и я — разумеется — проверил данные после сборки. И собирал их не меньше десяти раз, настраивая теги и сравнивая с данными в OSM. Все знакомые мне паркоматы там есть, погрешность, на мой взгляд, небольшая. Если я сделаю ссылки на панорамы, тут точно так же будут претензии, что а что насчёт остальных 740 паркоматов. Куда эффективнее будет заинтересованным открыть файл в JOSM, подложить слой OSM и посмотреть знакомые паркоматы, как это делал я.

Давайте не все сразу загрузим и посмотрим?

Этот принцип, как я уже сказал выше, распространяется только на частные правки. В отношении импортов существует вполне понятная презумпция виновности.

Что касается проверки по выборке, это вполне нормальный способ предварительной оценки. Главное - устранить selection bias, то есть взять сплошную выборку в какой-то случайной области. Это вполне научно, а если кому-то не нравится - пусть спорят с принципами математической статистики или укажут на ошибку в принципе выборки. Происхождение этого набора данных - однородное (речь не идет, как в случае с тем же каталогом зданий, о составном наборе с разными исходными источниками), потому взять, условно, квадрат 1х1 км и посмотреть, что в нём, будет вполне репрезентативной выборкой. Если у кого-то есть соображения, почему не будет - я готов их услышать.

Я всего-навсего предлагаю подойти к вопросу со строгой, не побоюсь этого слова - научной точки зрения, вместо того, чтобы меряться личным авторитетом или другими органами.

Сначала я дам несколько ссылок на Mapillary с паркоматами. Случайная выборка изо всех концов Москвы.

Новые, нашёл рядом с точками: 1, 2, 3, 4, 5 (ошибка в 25 метров: не тот угол дома),
Есть в OSM, нет в базе: слева на тротуаре, прямо перед носом, рядом со знаком, на месте мусорки

Из-за тормознутости плагина для JOSM я потратил слишком много времени на выборку. Снимков в Mapillary очень мало и часто смотрят не туда. В яндекс.панорамах большей части паркоматов нет, т.к. они очень старые. Других источников я не знаю. Ногами квадрат 1×1 км обегайте сами.

И теперь я хочу сказать, что это всё зря, потому что вот прямо сейчас у нас эталонное обсуждение импорта, чего ещё, кажется, никто никогда не делал. Ссылки будут давать именно сюда. Другие, кто захочет что-то залить в осм, посмотрят на придирки, плюнут и продолжат заливать втихую, потому что сообщество OpenStreetMap не умеет доверять. Данные организации, которая ответственна за расстановку паркоматов, — не авторитет, доверяем только своим глазам. Условная «пятёрочка» представит спор на несколько страниц, где она доказывает, что не верблюд, то есть, что их набор данных действительно содержит актуальную информацию по всем магазинам, и не станет ввязываться. OSM не получает данных, пользователи не могут найти магазин, поставщики видят этот детский сад, продолжаем вносить только то, что видим глазами.

Да, у нас эталонное обсуждение импорта, с предложенным открыто критерием оценки качества данных, как, в общем, и предписывают Import Guidelines.
А вы его используете для того, чтобы перевернуть все с ног на голову и убедить присутствующих, что эти guidelines - не просто ерунда, а зло, потому что “мы пугаем владельцев данных”.

Чем это отличается от ситуации, когда какой-нибудь индивидуум хочет “облагодетельствовать” проект и внести данные, скажем, из Википедии, используя избитую демагогию про “OSM много теряет” и так далее? Практически - ни чем. Ну, кроме того, что этот индивидуум отстаивает свое собственное мнение, а тут речь идет также о возможности для проекта maps.me похвастаться потом: “а теперь у нас и паркоматы” (это к вопросу о возможном конфликте интересов).

На квадрате именно 1х1 км я не настаивал - там было слово “условно”.
А произвольная несплошная выборка, к большому сожалению, не обладает нужным свойством исключения collection bias, потому что она, с тем же успехом, может оказаться вовсе не случайной.
Я не могу вам запретить это импортировать, но вынужден констатировать, что предложенный критерий проверки вы использовать так или иначе не смогли или не захотели.

2Zverik
Не, а как иначе, чем через скепсис? Бушман дело говорит же - не нужно с наскока добавлять такую кучу данных. Я вот лично не знаю откуда у ДИЦа данные по их аппаратам и не знаю какова у них процедура регистрации и оформления. Может там дядя Вася сгрузил из самосвала, а потом растащил по улице, расставив галочки в пунктах с адресами у себя в наряде, позвонил тёте Маше о выполненной работе. Всё - можно вносит в OSM. А может каждый аппарат по встроенному GPS передаёт свои координаты и путём хитрых программ они встраиваются в общую схему. Допустим захочет Почта России внести в базу OSM свои почтовые ящики (синии такие), а зная, какой там бардак я могу только догадываться, что они сюда натыкают из своих баз.
2ALL Но, что бы не было я только за развитие и данные, которые идут на пользу. Давайте внесём. Проблемы будут только у пользователей, которые не определят терминал на своём гаджете. По факту такие терминалы должны находится в лютый ливень в 1 ночи без проблем (указатели там всякие и подсветки), а карты лишь удобное подспорье. Ни кто не мешает потом всё откатить, насколько я понимаю систему.

Если условия осуществления импорта соблюдены (отдельный акаунт, другие средства идентификации changeset-ов или объектов), откатить можно всегда.

Меня в этой истории смущает еще один момент - затевается ведь не одномоментный импорт, а импорт с обновлением. При этом довольно неясно, как будет разрешаться ситуация, когда паркомат был, а потом его в очередной выгрузке нет. Его снесли или его Вася случайно удалил? Вроде как очевидное решение - не удалять, а пометить fixme=resurvey и note=“возможно, убран” - а как пользователи данных об этом узнают?

Да, я не спорю с фактом того, что к импортам отношение более строгое, чем к внесенным индивидуально данным. Но исходят, в данном случае, из соображения того, что вероятность индивидуального внесения сразу большого объема кривых данных - мала. А с импортами - наоборот. Но раз делается это один раз, то считается, что от “семь раз отмерь” автор импорта не развалится. В конце концов, речь вроде все еще идет о создании лучшей свободной карты мира, а не самой наполненной данными (неизвестного качества).

Про аргументы против - добавлю: если коллега Zverik обладает знанием о том, что кто-то “плюнул и продолжил заливать втихую” - почему бы на это не указать прямо? Иначе - это выдача возможного за действительное, логическая уловка.

Повторю: я ни в коем случае не против внесения новых данных, я всего лишь за соблюдение принятых при этом мер. И не понимаю, ради чего менять установленный порядок (который до того никого не смущал). Тем более странно выглядит все это, учитывая, что Zverik сам не раз и не два критиковал желающих импортировать что-либо.

Имея опыт работы с разного рода списков POI из разных мест, могу с уверенностью сказать - абсолютное их большинство очень низкого качества, в которых присутствуют как давно неактуальные так и просто изначально ошибочные данные. Координаты в этих списках как правило получаются при помощи разного рода геокодеров из адресов, что привносит свои дополнительные ошибки.

Поэтому эти “придирки” - увы, это вполне обоснованные сомнения в качестве. Чем меньше времени потратится на проверку - тем обычно хуже результат. Доверия ДИТ-у тоже не очень много. К примеру, имел опыт работы с данными остановок общественного транспорта от того же ДИТ-а, встречались ошибки в 100 метров от реального их положения, приходилось по панорамам Яндекса их искать, чтобы исправить на реальное, иначе транспортная работа по GPS/ГЛОНАСС нормально не считалась.