Обсуждение массовых правок по Российской Федерации

Зачем ударяться в крайности? Есть более взвешенная альтернатива: договориться, что можно улучшать данные (как в плане полноты, так и системности), но нельзя ухудшать или препятствовать улучшению. Поэтому внесение новой информации допустимо хоть по-старому, хоть по-новому, так как наличие информации всегда лучше, чем её отсутствие. Никто, как на НЯКе, не придерётся и за нарушение правил картирования не забанит. Но и приведение накопленного разрозненного массива данных к единообразному виду, замена устаревших и ошибочных тегов - это тоже движение в положительную сторону. В противном случае мы просто перекладываем эту задачу и головную боль на потребителей данных, только и всего.

Даже если с определённой натяжкой согласиться с этим тезисом, есть одно “но”: это применимо лишь для старых проектов. Новые же пользователи данных в OSM появляются постоянно. И им, кто начинает использовать данные OSM вот только сейчас, наличие системности позволит не тянуть обработку лишних данных и не погружаться в долгие исследования, как развивалась система тегов для интересующих их объектов за всю историю проекта.

Почему с “натяжкой” - потому что если старая схема встречается в 0.01% случаев (а новая в 99.99%), то этим хвостом вполне можно перенебречь, как статистической ошибкой - и дропнуть поддержку этой схемы даже в давно живущем проекте. Всё равно абсолютной полноты в каждый момент времени достичь невозможно. Где-то кто-то по ошибке стёр тег или сам объект, где-то кто-то навандалил, то есть определённые флуктуации в данных всё равно будут происходить постоянно. Бороться за то, чтобы учесть каждый конкретный объект (и переживать, что 10 подъездов по стране, условно, в какой-то момент времени не попадут на карту) - большого смысла нет.

Кто с кем будет договариваться?
Все со всеми - невозможно в таком большом проекте.

Потому что этот “хаос” – это степень разнообразия, необходимая чтобы отобразить реальный мир. Ситуаций в реальном мире много, и они все разные. Кроме того, это та степень свободы, необходимая для того что бы осм хоть как то развивался. Перейти от одной жесткой системы к другой будет вовсе не возможно.

Выдерни этот “хаос”, и все развалится. Это логическая основа осм, так сказать “анархо-синдикализм”.

Жалобы на хаос из той же категории, что типа мне очень нравится закат на море, но мне не нравится что вода мокрая.

Как не странно, осм не такой уж и большой, и активных акторов, с которыми надо договариваться можно пересчитать по пальцам рук. Остальным по большому всё равно, какие теги использовать.

Проблема в другом.

  1. Логические проблемы, которые массовые замены были призваны решать, не решаются. Стороны часто просто не понимают друг друга.

  2. Вопреки декларациям, многие и не хотят договариваться. Пример: вот AnakinNN считает, что пользователи данных – это просто лохи, которые виноваты уже тем, что связались с ОСМ. Договариваться с ними ни о чем не надо, а надо просто ставить перед фактом (см выше).

мне неясно, каким образом наличие двух тегов для одного и того же, с абсолютно одинаковым определением, помогает осму не развалиться.

AnakinNN,
вы все время путаете сущее и должное (желаемое).
Если бы системность была, она позволила бы, далее по тексту.

Такой системности, о которой вы говорите, просто нет. Соответственно, и позволить она ничего не может.

building=entrance встречается не в 0.01% случаев, а в 0.3% (т.е. в 30 раз чаще вашего порога). так что просто так пренебречь ей нельзя.

Так новый пользователь данных (по факту) оказывается в еще более тяжелом положении, нежели старый опытный.
Новому пользователю еще только предстоит узнать, что кроме правил есть исключения.
Что highway=* это далеко не всегда дороги, что landuse=forest и natural=wood это одно и тоже, что building=no - это не здание, и.т.д и т.п.

Теперь еще раз про саму замену building=entrance → entrance=*, ретроспективно, за 9 (девять) лет.

1. Удалось ли провести полную замену building=entrance → entrance=*?
Нет, не удалось. исходный вариант остается еще в базе в заметных количествах.
Автоматическая замена скриптом вызывает возражения, и вообще находится в известном противоречии с существующими правилами, а ручная, то есть рассмотрение оставшихся случаев каждого в отдельности по существу не входит в интересы исправляторов.

2. Можно ли дропнуть building=entrance из старых конфигов?
нет, нельзя, поскольку он встречается в заметных количествах. Входит в топ 60 популярных значений тега building. Это может быть много. building=entrance сравним с building=kiosk

3. Можно ли удалить страницу из вики tag:building=entrance?
нет, нельзя. этот тег сохраняет свое старое значение.

*4. Можно ли использовать при редактировании тег building=entrance в новом значении, т.е. в значении “здание”? на точечных зданиях или даже на полигональных? **
“Чистка семантики” была одной из целей. Предполагалось, что все building=
(кроме no) можно будет интерпретировать как здания.
Нет, нельзя так делать, получится путаница.

Нельзя ли теперь повесить building=entrance например на главный вход на ВДНХ? В конце концов, это здание, и это вход.

Нет, нельзя, см. пункт 3. Семантика, такзать, так и осталось неочищенной.

Вот такие дела.

Что можно было бы сделать в 2020 году? В ручную поправить оставшиеся случаи. Но будет ли это кому-то интересно?

Помогает осму не развалиться принцип Any Tags You Like. Появление же двух полных синонимов – это издержки этого принципа.

highway=path вовсе не шоссе, а waterway=dam вообще без воды.

Не надо переводить мнемонику

Дело не в мнемонике. Без building = entrance тег building = * обозначал бы только здания.

Так у меня и был план. Но начались возражения ("building = entrance нужен кому-то, и т.д.).

Ок, тогда зафиксируем, что наличие двух полных синонимов никак не помогает ОСМу не развалиться. Соответственно, это аргументом против замены устаревшего тега ЗАГСа (которая никак не отменит принцип Any Tags You Like) на новый не является.

Напомню, что принцип Any Tags You Like относится к фичам, которые еще не зафиксированы в вики (и он не означает, что вы можете выдумывать бесконечное числео тегов-синонимов - в противном случае “other users might eventually convert your contributions to fit that scheme”) https://wiki.openstreetmap.org/wiki/Any_tags_you_like

Порог был назван условно. Ситуация та же, что и с консенсусом: в подавляющем большинстве случаев используется entrance=*. Вот если бы buiding=entrance встречался в 20% случаев - тогда им точно было бы проблематично пренебречь.

А почему вхождение именно в топ-60 является достаточным признаком значимости тега? Почему, например, не в топ-50 (куда он уже, кажется, не входит)?

Не надо ничего удалять из вики. Надо указать, что тег устарел и привести ссылку на замену. Это в статье сделано, в самом верху.

Про этот принцип literan уже расписал в предыдущем сообщении. Он про отсутствие излишней бюрократии и согласований, но почему-то некоторые участники его понимают как green light to chaos.

Системность не появляется сама по себе, для этого надо приложить усилия. Само по себе всё только может свалиться в бардак. А если его отстаивать, то понятно, что ничего кроме него и не будет.

Я вот ещё какой момент не понимаю: как вы пишете, потребителям данных всё равно поддерживать обе схемы. Окей. Тогда, получается, для вас никакой разницы, как именно будет меняться соотношение между ними в базе. А основной принцип OSM - have fun. Если другому пользователю доставляет удовольствие, что база будет в системности - ну пусть сделает. В OSM приветствуется инициатива. Но нет, почему-то вы отстаиваете позицию, что именно что нельзя убирать хаос из базы, это пошатнёт основы проекта. Хаос ради хаоса. Как будто новичок, увидев, что все ЗАГСы обозначены одинаково (какая неожиданность!) подумает: “Ой, да тут у них всё строго, никакой свободы, полный ГУЛАГ и я сюда не пойду”.

Или убрать поддержку оставшихся случаев из софта. Тогда мотивации исправить данные в базе будет гораздо больше, чтобы всё заработало :wink:

Начнём с того, что SLA с потребителями данных никто не подписывал. Вон когда принимали в ЕС закон об авторских правах, overpass в знак протеста вообще сутки не работал, и не только он. Я больше скажу - пункт про отказ от гарантий есть в любом коммерческом EULA (с которым обычно все соглашаются, не читая), только с вас за этот отказ ещё и денег возьмут. И да, у нас добровольный проект, а не serious business, где клиент всегда прав, и надо вывернуться наизнанку, но ублажить его.

А то недавно был один такой “потребитель данных”, который увидел, что адресов мало, потратил аж целых три часа своего драгоценного бизнесменского времени на передирание их с кадастра, а когда правки откатили, то у него знатно подгорел фитиль. Пользователь данных - это хорошо, но до тех пор, пока он не начинает требовать, чтобы проект подстраивался под его бизнес-нужды. Пускай присоединяется на равных условиях (а других у нас нет) с остальными участниками, принимает участие в обсуждениях, голосует. А не так, что “я пользователь, у меня бизнес, поэтому я всегда прав и это не обсуждается, вы тут ботаники-задроты хернёй страдаете, а я бабки кую”.

Это пожалуйста в Sticky: на верх форума,
тут такие “партнеры” тоже встречаются.

Да, действительно, нет никакой разницы, как меняется соотношение в базе. Пока тег присутствует в базе, и сохраняет свою семантику (т.е. известно, что он обозначает), его приходится поддерживать.

Ну да, have fun. Но вы так пишете про системность, как будто вы ее когда то видели. Когда последний раз вы ее видели в реальном мире? Когда она последний раз встречалась в ОСМ?

Если этому другому участнику нравится системность, ну пусть сделает. Но почему он ее за 10 лет не сделал? Вы понимаете, что мы обсуждаем одно и тоже десять лет? Где же ты моя системность?

Позиция не в том, что порядок хуже беспорядка.

Позиция в том, что такая системность, которую вы хотите достичь, просто не существует в реальном мире, и недостижима в языке, который этот мир должен описывать (т.е. в системе тегов осм).

То что на первый взгляд кажется системностью, это игнорирование реальной сложности, переупрощение.

С building=entrance полемика вертелась вокруг (игнорируемой) разницы между входом и подъездом.
Загсы (замену amenity=register_office → government=register_office) я не готов обсуждать, но подозреваю что там будут свои сложности.

Ну например, все ли загсы во всех странах государственные? Могут ли быть частные, или муниципальные? Это не так смешно, как кажется, например, частные камеры контроля скорости уже существуют. Ну, и еще почему register_office – это именно загс? как обозначать всякие отделения регистрации ГИБДД? Не ждет ли amenity=police таже участь?

Если честно логика в отношении “amenity” отсутствует напрочь.
Сказано - Инфраструктура, благоустройство (amenity=*). И вдруг - Теги для указания общественных мест. К ним относят аптеки, банки, уличные телефоны, школы и т.п.

Я бы отдал предпочтение “building” для здания и “amenity” для территории на которой стоит здание. Тем более что ключ building=* используется для указания здания.
А пока каша - тут тебе и amenity=bar (помещение), и amenity=biergarten (открытое пространство). Ну и amenity=drinking_water как бельмо в глазу.

Так ведь ещё есть и тег “leisure=*” используется для обозначения мест, где люди проводят своё свободное время. А разве в баре люди не проводят своё свободное время?

Конкретно в РФ частных не существует. Муниципальные органы власти – это также government. За все страны мира не знаю, конкретно в этой ветке обсуждается только РФ.

Вы абсолютно правы. leisure = bar был бы более уместен.

Я в OSM менее 10 лет.

Речь идет об обозначении одной сущности одним методом, не более того.

Изначально туда помещали все POI. Поэтому и существуют amenity = register_office/shop, т.е. до введения *office = ** и *shop = ** офисы и магазины обозначались через *amenity = **. Тенденция отказа от него имеет место, например количество amenity = embassy сейчас уменьшается, а office = diplomatic увеличивается, есть PR для osm-carto, который удалит рендеринг amenity = embassy.

В том-то и дело, что речь идет о чем-то другом, что как раз и приводит к размножению методов.
Были building=entrance и amenity=register_office, вот и пользуйся ими, одна сущность – один метод. Но нет :smiley:

Это тоже проблема. Системность/порядок должен быть глобальным, а если каждая страна будет упорядочиваться как-то по-своему, на глобальном уровне опять возникнет беспорядок. Не карта *всего *мира, которую может редактировать каждый, а совокупность локальных нарисуек (с).

Всё еще впереди. :slight_smile:
Пословица вспомнилась:
*Кто в молодости не был реформатором — у того нет сердца, кто в зрелости не стал консерватором — у того нет ума. *
не спрашивайте к чему она ))

Я не имею возможности обеспечить глобальный порядок, но я могу приблизить OSM к нему. Этого достаточно.

Тут Вы не правы.

В погоне за системностью отдаю предпочтение стабильности. А здравый смысл направляю на второй план. Здравый смысл элемент не стабильный. Сегодня демократы, завтра республиканцы. Но пока они не меняют конституцию - порядок незыблем.

Признаком значимости тега является конечно не вхождение в топ-N, наличие определенной семантики (описания на вики) и его частотность относительно опечаток.

Вот давайте посмотрим как устроен тег building=*

Всего в базе есть 400 миллионов вхождений ключа building, и принимает он 12,643 различных значений. 12 тысяч тегов – это сопоставимо с числом слов в языке.

В первом, самом грубом приближении можно обрабатывать все значения building=* единообразно, например для того чтобы отрисовывать дома полигонами на карте.

Дальше пользователи начнут жаловаться, что повылезали не-здания, building=no и building=entrance. Их придется исключить.

Если вы захотите сделать какую-то классификацию зданий, например чтобы их отрисовывать разным цветом, или втыкать разные 3D-модели для разных тегов, как это делают некоторые 3D-рендеры (X-Europe так делает), то придется посмотреть какие теги популярные, и где заканчиваются кодифицированные теги и начинаются опечатки.

Львиную долю занимает building=yes – 81%
Уже четвертый тег building= garage – меньше процента.
39-й тег building=semi пробивает психологическую границу 0.01%. Можно ли отбросить хвост тут? нет, это только начало кодифицированных и используемых тегов.
building=cathedral, две с половиной тысячи вхождений, это уже 0.001% одна тысяча вхождений. это как не странно, тоже популярный тег.
Полезные теги, которые могут быть использованы, продолжаются и дальше, где-то до топ-250.

Дальше начинают доминировать опечатки и издержки гуманитарного мапинга, типа такого. По хорошему этот хвост надо чистить, но это почему-то вообще никого не беспокоит.

Вывод из всего этого: частотность тегов сама по себе не очень важна. Если что-то встречается в 10 случаях из миллиона, его стоит поддержать. Может это что-то такое, что придает этому месту уникальность. Это как словами в языке. Сколько слов нужно выучить, чтобы понимать иностранный язык. тысячу, десять тысяч, сто-тысяч, миллион? при этом чем слов больше, тем их относительная частота меньше. Если понятие, стоящее за словом, входит в круг твоих интересов, то хорошо бы его знать.

P.S.
С highway=* ситуация получше, всего 954 разных значения.