Теги: стандартизация и исправление ошибок.

Забавно, но половину исправили а половину - нет :slight_smile:

Выскажу своё мнение по поводу неизвестных и “не стандартизированных” тегов. Итак, сама структура OSM очень удобна для хранения фактически любой информации об объекте на карте. То-есть изначально любую сущность имеющую гео координаты мы можем описать сколь угодно разнообразными тегами. Такой вид хранения информации хорошо подходит для открытых, свободных и главное развивающихся проектов, чем и является OSM. Более того, жесткая стандартизация тегов административными методами не только противоречила-бы духу проекта, но и создавала-бы дополнительные трудности на пути развития опентритмапа.

Далее на основании объектов и тегов к ним, мы пытаемся создать карту (а то и множество других полезных сервисов). И тут уже сообщество начинает договариваться между собой какие теги где использовать. Для этого организуются обсуждения на форуме, создаются голосовалки, пишутся статьи в вики и т.д. В общем идёт работа, мапперы рисуют, база потихонечку наполняется. Что мы имеем в итоге в базе: 1) объекты на карте обозначенные корректными согласованными тегами. 2) Объекты отмеченные тегами с ошибками (опечатками) либо не совместимыми между собой тегами (будь-то дорога-река ручей-линия электропередач и т.д.) 3) объекты с “неизвестными” и новыми тегами.

А дальше думаем что с этим добром делать:
1 - это наше достояние, та самая ценность ОСМ. Бережно храним, поддерживаем актуальность и т.д.
2 - это работа для ботов (исправление опечаток) и людей (уточнение на местности что это всё-же такое).
3 - потенциально полезные данные. Рассылка роботами информационных писем авторам с просьбой уточнить что это за объекты и зачем нужен тот или иной тег. А дальше уже согласовывать, обсуждать писать статьи на вики и т.д., конечно если целесообразно.

Фактически вся работа по обработке непонятных тегов сводится к 1) созданию робота который-бы исправлял явные опечатки в тегах и рассылал информационные письма авторам с просьбой разобраться и уточнить свои данные в случае если теги корректны но противоречивы, а так-же в случае “новых” тегов 2) работе людей. Есть те-же сервисы-валидаторы которые наглядно показывают ошибки (в том числе и в тегах). Так-что, увидел ошибку которую не может исправить робот, исправь сам, уточни на местности или по спутниковым снимкам, если это возможно, свяжись с автором.

Резюмируя: явные ошибки исправлять можно и нужно, любыми методами. Грамотная автоматизация, здесь хорошее подспорье. Неизвестные теги - уточнять у авторов, выносить на голосование, обсуждать, и т.д., но ни в коем случае не удалять, места они занимают не много, да и в самой базе данных даже после удаления они останутся, ибо история правок. Чем больше мапперов, тем выше точность и корректность данных, несмотря ни на что. Ну и конечно-же помогать новичкам, писать грамотные статьи, хаутушки, создавать видеоуроки и т.д., что-бы изначально уменьшить количество ошибок, а не исправлять их потом.

Спам технологии на службу миру!

А можно лично Вам делегировать эти функции что бы не было проблем со спамом.
Или спам это все же массовая рассылка информации, несущей рекламный характер?
Тогда это автоматизация. Мне вот от гугл приходят служебные письма от роботов, не уверен что все, кроме меня, метят их как спам

Где вы здесь узрели спам? Это, как я понимаю, робот, сообщающих пользователю о ЕГО ОШИБКАХ. У нас на работе такая система используется годами и действует так:

  1. Если то что должно быть сделано пользователем не делается в течение недели, то приходит ему письмо
  2. Если то что должно быть сделано пользователем не делается в течение нескольких недель, то приходит ему письмо раз в неделю ему и его супервайзеру с напоминанием
  3. Если то что должно быть сделано пользователем не делается в течение месяца, то приходит письмо ему, супервайзеру и его начальнику

Никакого спама, зато порядок на работе :slight_smile: Понятно что эта система разработана в коммерческой фирме и не может быть перенесена жёстко на развлекательный проект, но тем не менее …

Если хотите то это можно рассматривать как часть антивандального бота.

Есть-же бот который рассылает письма, о том, что ты создал дубликаты точек, и рассказывающий тебе, что надо-бы быть внимательнее к таким ошибкам. Вряд-ли кто-то воспринимает письма от него как спам, скорее наоборот, как полезные сведения.

Спам - массовая рассылка, не рассчитанная на конкретную целевую аудиторию.
Индивидуальное письмо не имеет к спаму никакого отношения. Точно так же, как и ответ робота на входящее письмо, что хозяин в отъезде.
Более того, не имеет отношения к спаму даже массовая рассылка, при составлении списка адресатов которой был осуществлен отбор по какому-либо критерию.

Неправда. “Отбор по критерию” практикует много спамеров.

а было интересно бы создать на просторах осм не существующий город-учебник. С примерами.
А наши потомки по этой схеме город построят 8)

То есть если я загружаю в OSM свой трек и мне зачем-то приходит сообщение что трек загружен то это СПАМ? Срочно на борьбу со спамом!! :slight_smile: Засудить их мало!!

Я так подозреваю что ключевое слово - массовая :slight_smile: Сообщение об ошибках автору никак сюда не подходит …

Ну смотри. Кто-то нарисовал сто лет назад много чего, например, стопицот зданий в разных углах страны. А сейчас к нему начнут приставать, что он там не так, сям не так…

Что-то не нравится - исправь. Не можешь исправить - напиши список и предложи исправить другим (это и делают обычно валидаторы). Но приставать к авторам кроме как по конкретным вопросам и только личным путём не надо ни в коем случае!

Сообщения робота в данном случае по своему содержанию и сути ничем не отличаются от индивидуальных сообщений от настоящих людей. не несут какого-то рекламного характера, не носят массовый характер, а в добавок ещё и ведут конструктивный диалог с новичком пользователем, который недавно зарегистрировался в системе и начинает вносить какие-то правки с ошибками. Наша задача, с помощью робота в конструктивной форме показать пользователю его ошибки, либо понять зачем пользователь добавил тот или иной тег. Например в случае нового тега, попросить пользователя заполнить небольшую анкету с формальными вопросами для чего нужен новый тег, потом эти данные так или иначе обрабатывать и т.д. Вопрос в следующем, на каком этапе вы видите тут спам? Информационные автоматические письма практикуют очень множество веб проектов.

Мне хватает критики от плагина валидатора в josm, если бы ещё после каждой загрузки приходило письмо с перечислением сделанных ошибок — osm бы пошёл лесом.

Zverik какая проблема, отключил присылание сообщений в настройках профиля, у нас-же демократия, свобода выбора

«какая проблема, напишите заявление в установленной форме, чтобы полиция не избивала вас по утрам, у нас же демократия»

не нужно навязывать пользователям вещи, которые они не просят. Иначе и без того высокий порог вхождения станет нечеловеческим: будут у нас только бородатые линуксоиды, привыкшие к виртуальным самоистязаниям.

что-бы понизить порог вхождения нужно писать более человеческие онлайн редакторы, которые оперируют более человеческими и высокоуровнеными понятиями чем теги и ключи. Редакторы, которые в принципе не позволят совершать подобные ошибки, фактически редакторы для “домохозяек” которые хотят отметить свой магазин по соседству. А коль ты уж решил освоить тот-же josm и всё-таки добавил неизвестный тег, то удели уж пару минут времени для того, что-бы рассказать сообществу о нём, темболее такая ситуация не является штатной.

Ну так напишите более человеческий редактор. А описывать каждый тег — описывалка отвалится. И это штатная ситуация, весь проект стоит на вводе новых тегов.

Zverik ты сам часто придумываешь новые уникальные теги, для каких-то объектов которые ещё сообщество не умеет тегировать, и по которым не нашлось информации в wiki?

конечно.

Ну вот а большинство новичков вряд-ли такие-же изобретательные… А если уж и изобретательные настолько, то я считаю как минимум хорошим тоном рассказать сообществу для чего эти изобретения.