Машиночитаемый справочник тегов для программ [TOSM]

На недавней встрече в Питере была поднята проблема того, что в разных программах, включая JOSM древние или неполные или запутанные шаблоны тегов для объектов. Больше 50% реально нужных тегов нет вообще, нужно о них знать, потому новички лепят всякую фигню.

Вообщем готов взяться на создание этого в виде веб-приложения и генерировать после очередных изменений данный xml файлик, а в перспективе протолкнуть его как способ получения шаблонов для JOSM, Potlach и других программ, в частности в некоторых навигационках есть функции расстановки POI…

Описание тега не должно быть копи-пастом вики, а кратко и ясно описывать реальную суть в наших реалиях + может какой то совет по тегированию, ибо например что landuse=grass разрывается когда его пересекает дорога, а не пролегает под асфальтом и т.п.

Естественно один я базу не наполню, потому предлагаю людям с опытом помочь, я выдам доступ в добавлялку, когда она появится.

И ещё хочется спросить есть ли смысл под это закладывать multi-language?

Все теги аля справочник будут доступны в виде легкого web 2.0 сайтика онлайн, на случай если редактор не использует TOSM.

Ну и наверное хотелось бы предложений о структуре XML файлика, ибо я мало с ними сталкиваюсь, я вижу это так:

UPD: забыл что нужно категории ещё какие-то завести, тут не знаю как лучше, либо сделать их древовидными, либо фиксированные скажем 3 уровня. Как лучше? Если с категориями, то в тег добавляем её номер, а до описания тегов будет описание категорий тегов.

Конечно стоит. Ведь это не так трудно сделать.

А можно перенести предыдущие посты из паралельной темы?

Если добавить базу данных самих poi - т.е. самих отделений банка или кафе с уже растановленными тегами. То растановка будет сводить просто к постановке точки, выбор из списка определенного poi и беглой проверки на правильность.

То получим бардак. Давайте следуя unix way будем делать. Конкретная штука под конкретную задачу вытекающую из проблемы.

Проблема: бардак с шаблонами
Задача: поправить
Штука: систематизированный машиной читаемый справочник тегов, который обновляется хоть раз в день хоть при запуске редактора и всем хорошо

Но unix-way это и когда из небольших кусков собирается целое. Просто я смотрю на преспективу:
Проблема: бардак с названиями POI
Задача: поправить
Штука: систематизированный машиной читаемый справочник тегов, который обновляется и всем хорошо

upd: я не предлагаю все собрать в кучу. poi - отдельно, теги - отдельно.

и я предлагал GitHub - для того чтобы почти невозможно было попртить данные - и легко посмотреть изменения. Сайтик же можно оставить для отбражения справочника.

Всеми лапами за идею.

А если будет централизованное хранилище с более-менее официальным статусом, куда как легче будет проталкивать массовые замены тегов.
Станет возможным привести структуру тегов в более вменяемый вид.
Так победим!

Ну а если без пафоса, то будет неплохой справочник с пресетами.

Ну так создайте тему и решайте свою проблему, причем тут я и зачем флудить в данную тему?!

Предлагать вы вправе что угодно, я против гит-хаба для данной задачи. И чтобы эти 2 задачи обсуждались в одной теме. Хватит.

Похоже проблема действительно назрела, раз уже две головы как минимум о ней думали. Только по разному.

В моей голове было что-то вроде гитхаба, только для пресетов в JOSM-е. Если не устраивает официальный набор, то надо просто зайти и форкнуть его, там же подправить нужные теги под себя, или добавить новые наборы, и кнопкой экспортировать в JOSM.

На всё это навесить диффы (с официальной версией или с любым пользователем), возможность выбрать самые популярные изменения для определённого тега среди всех форков, ещё мерджи, переводы на разные языки и т.п.

С одной стороны эта реализация намного сложнее и в ней больше хаоса, а с другой скорость появления изменений будет намного выше, так как не надо ждать допущенных редакторов официального источника тегов. Форкай, меняй, никому не мешай :slight_smile:

Только всегда есть шансы, что дофоркаются)) Как уже и с вики, как и с самим ОСМ, бардака и так хватает.

Справочник сложно составить лишь с нуля, а когда теги будут вбиты, что же сложного их менять паре человек?

Вчера озадачился этой темой (каталогом тэгов) в рамках работы над всемирным экспортом пои. В результате был найден единственный приличный источник инфы по тэгам из вики - выгрузка для taginfo. Она в sqlite, я ее выгрузил в постгре. Могу поделиться данными.

Теги и так с мапфьючерса взять можно, ведь смысл не во всех используемых с опечатками включая, а в нормализованном списке. Опять же ни постгре ни скьюлайт мне давать мало смысла, если бы в json, но опять же полезность то информации какова?

С нуля не надо, можно импортировать пресеты с JOSM-а.

Обновлять будет мешать примерно то же, что сейчас мешает редакторам JOSM-а держать свои официальные пресеты в самом актуальном и полном состоянии, так сказать bleeding edge.

Потому что суть та же: изменения нужны одним, а делать должны другие, у которых семья, работа, дети, другие увлечения, кино, да и то, что просят добавить, нужно всего 10 человекам где-то в Зимбабве.

А разрешить всем править официальный источник, это уже точно бардак, споры, удаления.

Это не ИСПОЛЬЗУЕМЫЕ, это ИЗ ВИКИ выгрузка.

Мммм, тогда давай. Только форматец попроще вроде JSON могешь? Как доколдую мониторинг займусь импортом тегов, чтобы осталось по категориям распихать и описания сделать.

Вы их давно открывали? Там теги устарели на год так точно многие. Ещё теги с потлача предлагайте)))

Дофоркаются, конечно. Но кому это мешает? Кому какая-разница что там у какого-то user-а в тегсетах, если он не портит официальный.

Зато из форков можно вынести пользу. Например открываем /Shop/Clothes, делаем поиск “как там у других” и видим грубо говоря три столбика:

  • официальный вариант для этого пресета,
  • потом наш,
  • а потом самые популярные изменения: 120 человек добавили brand в свой /Shop/Clothes, ещё 100 добавили age, ещё 10 добавили новый тип одежды “валенки”. И на каждое новшество кнопки “утянуть себе”.

Таким образом из облака форков можно вытянуть самые популярные новшества в свои пресеты. А те, кто рулит официальным пресетом, могут просто просматривать самые популярные изменения. Например, если изменение набирает 100 и больше редакторов, то автоматически идёт pull request :slight_smile:

Хз, правда, как это реализовать.

xml файл - править просто. И стоит использовать уже имеищися опыт - того же линукса. Что-то нужно - сделай сам и пришли тем кто поддерживает.

Не стоит автоматически делать pull request, если сотня потлачеров, что-то сделала, то это не означает, что это правильно.

Формат могу примерно любой, только зачем там json? Там же пара - key-value. Проще в CSV выгрузить.

Давай CSV, ещё проще. Мне главное всосать это средствами php :slight_smile: Не более)))

Точно такая же идеология у JOSM-а. Исходники открыты, а на пресеты даже исходники не нужны. XML файл - надо просто залезть и поправить, а потом отправить изменения тем кто поддерживает. Однако, отстаёт на год.

Pull request, это не merge. Можно и отклонить.