Выскажу своё мнение по поводу неизвестных и “не стандартизированных” тегов. Итак, сама структура OSM очень удобна для хранения фактически любой информации об объекте на карте. То-есть изначально любую сущность имеющую гео координаты мы можем описать сколь угодно разнообразными тегами. Такой вид хранения информации хорошо подходит для открытых, свободных и главное развивающихся проектов, чем и является OSM. Более того, жесткая стандартизация тегов административными методами не только противоречила-бы духу проекта, но и создавала-бы дополнительные трудности на пути развития опентритмапа.
Далее на основании объектов и тегов к ним, мы пытаемся создать карту (а то и множество других полезных сервисов). И тут уже сообщество начинает договариваться между собой какие теги где использовать. Для этого организуются обсуждения на форуме, создаются голосовалки, пишутся статьи в вики и т.д. В общем идёт работа, мапперы рисуют, база потихонечку наполняется. Что мы имеем в итоге в базе: 1) объекты на карте обозначенные корректными согласованными тегами. 2) Объекты отмеченные тегами с ошибками (опечатками) либо не совместимыми между собой тегами (будь-то дорога-река ручей-линия электропередач и т.д.) 3) объекты с “неизвестными” и новыми тегами.
А дальше думаем что с этим добром делать:
1 - это наше достояние, та самая ценность ОСМ. Бережно храним, поддерживаем актуальность и т.д.
2 - это работа для ботов (исправление опечаток) и людей (уточнение на местности что это всё-же такое).
3 - потенциально полезные данные. Рассылка роботами информационных писем авторам с просьбой уточнить что это за объекты и зачем нужен тот или иной тег. А дальше уже согласовывать, обсуждать писать статьи на вики и т.д., конечно если целесообразно.
Фактически вся работа по обработке непонятных тегов сводится к 1) созданию робота который-бы исправлял явные опечатки в тегах и рассылал информационные письма авторам с просьбой разобраться и уточнить свои данные в случае если теги корректны но противоречивы, а так-же в случае “новых” тегов 2) работе людей. Есть те-же сервисы-валидаторы которые наглядно показывают ошибки (в том числе и в тегах). Так-что, увидел ошибку которую не может исправить робот, исправь сам, уточни на местности или по спутниковым снимкам, если это возможно, свяжись с автором.
Резюмируя: явные ошибки исправлять можно и нужно, любыми методами. Грамотная автоматизация, здесь хорошее подспорье. Неизвестные теги - уточнять у авторов, выносить на голосование, обсуждать, и т.д., но ни в коем случае не удалять, места они занимают не много, да и в самой базе данных даже после удаления они останутся, ибо история правок. Чем больше мапперов, тем выше точность и корректность данных, несмотря ни на что. Ну и конечно-же помогать новичкам, писать грамотные статьи, хаутушки, создавать видеоуроки и т.д., что-бы изначально уменьшить количество ошибок, а не исправлять их потом.