Нормализация данных по областям

В сфере нормализации, пришло время для очевидных вещей, которые надеюсь споров не вызовут, а именно удаление той информации из базы, которая никаким образом не может быть полезна, а только увеличивает объем данных. Речь в данном случае об архаичных тегах created_by на самих объектах, оставшиеся со времён предыдущей версии API. В текущей версии API created_by пишется исключительно в свойствах самого ченжсета, а на объектах постепенно удаляется по мере правок.

Удаление будет произведено в несколько этапов:

  1. удаление всех created_by=Potlach|Josm|Merkaartor (99%)
  2. анализ остальных и если содержимое тега применимо к source, но source отсутсвует, то перенос в source

Уже производится

http://www.openstreetmap.org/browse/way/104487506/history
в таких случаях может алгоритм усложнить и добавлять layer=1
с layer очень много ошибок, которые наверное возможно и ботом поправить, во многих случаях.

Залит (относительно небольшой) ченжсет, сокративший число различных написаний bridge=* примерно вдвое, где-то до 130 штук.

http://www.openstreetmap.org/browse/changeset/9550255

глобальные правки с моей стороны пока прекращаются, если есть желающие обработать какую-то конкретную область и помочь в этом - обращайтесь. :3

Сам же себе и отвечаю: судя по вики
тег landuse=reservoir устарел

господа нормализаторы, что за обострение теперь становится уже нормой единоличное принятие решения в глобальных масштабах?
Достаточно, что-ли вот так “объявить”

и тут же начать косить
http://www.openstreetmap.org/user/Max%20Vasilev/edits
?
Раньше считалось хорошим тоном, хотя бы, попытаться обсудить.

вот нафиг, за такое руки вырвут с корнем
а придумавшему нужно меньше за компьютером сидеть

обороты сбавь, лучше себе вырвите и начните с языка
если я здесь не верно понял, можно спокойно объяснить, не 1984 за мыслепреступления - расстреливать

Просто что-то многие стали увлечённо шашкой махать базу править, не дожидаясь обсуждения.

Общий принцип таков - не нужно пихать умолчания в базу. Не нужно проставлять всем объектам layer=0, а всем мостам - layer=1. Если вам это нужно - это элементарно делается в конвертере или через простенький препроцессинг перед ним. Потому что кому-нибудь другому могут потребоваться другие умолчания для своих целей. Простановленный тег не равно его отсутствию.

Далеко не сразу и совершенно не единолично. Тема уже очень давно обсуждалась на главном англоязычном канале IRC, после чего вчера была ещё раз поднята на русскоязычном канале и не нашла ни одного противоречия. После этого уже был сделал анонс и на форуме и взято несколько часов на ожидание.

Спешка, как известно, нужна только в двух случаях…

Год с выхода версии api 0.6, где created_by на объектах объявлен вне закона и подлежащим выкашиванию - это спешка?

Пожалуйста, если у кого-то есть какие возражения или кто-то использует теги created_by=JOSM, на нодах, для навигации, я готов выслушать.

Год - не спешка, а вот несколько часов, по сравнение, это спешка.
Раз год ждали, то смысл в “нескольких часах” — нулевой. Могли бы с тем же успехом на форум и вовсе наплевать, да и на форуме с такой скоростью реакция не происходит.
Получился бы такой иркин междусобойчик :wink:

wowik, есть конкретные предложения по полезному использованию тега created_by на нодах и веях?

См. последний пункт Guidance to software developers http://wiki.openstreetmap.org/wiki/Key:created_by
В результате, например, сильно исказится статистика принятия ODBL.

Да, я рассматривал этот аспект, но статистика не исказится, потому что учитывается не только последняя правка, но и первая версия тоже.

Что касается последней версии, то из почти 1 миллиона объектов только 3 (три штуки) принадлежат пользователю отклонившему ODbL. не думаю, что это сильное изменение статистики.

Текущая статистика в основном использует только объекты с одной версией, их станет существенно меньше…

Быть рано или поздно модифицированными - судьба любых данных в OSM

Это довольно спорное утверждение, при том что сейчас данных больше добавляется нежели изменяется. Но ведь речь не об этом.
А о том какие негативные последствия будут сейчас. Они будут. Что еще нужно чтобы этого не делать?

Не могли бы вы тогда более детально расписать негативные последствия? Кроме некоторых, замечу по своим подсчётам, незначительных в процентном отношении колебаний в статистике по ODbL, каких либо других изменений не вижу.