Нормализация данных по областям

landuse=reservoir - это не фонтаны. Фонтаны - amenity=fountain.
Описание схемы water=: http://wiki.openstreetmap.org/wiki/Key:water

Убедительнейшая просьба: не надо валить “сотню вещей” в одну кучу.
В получившихся многостраничных ченджсетах хрен разберёшься теперь.

… и номинатума. Решили бы сначала эти проблемы, а потом сносили. Есть добровольцы? Нету? Ну вот не трогайте, пожалуйста.

Кстати да - для подобных массовых правок думаю было бы лучше заливать отдельными коммитами по каждому типу исправлений. Скрипту-то всё равно один ченджсет сгенерировать или двадцать, а людям понимать, что именно на что было заменено и проверить на наличие ошибок будет гораздо легче. Ну и хорошим тоном было бы конечно обсудить изменения на форуме перед заливкой.

Номинатим вообще обновляется? Он вроде же уже несколько месяцев не обновлялся.

Да я не про то.
Сейчас он находит и точку, и полигон, если они имеют тэг name - возникает дублирование результатов.

После обсуждаемой “нормализации” таких дублей рано или поздно вылезет заметно больше.

Это неисправимая проблема номинатима. Чтобы адресный поиск имел смысл, он должен вестись по адресному реестру, а из данных осм его нужно предварительно построить, чего номинатим даже близко не делает. Он ищет просто объекты осм по имени.

Я не про фонтаны, а воду, там где фонтан, точнее резервуар с водой

В сфере нормализации, пришло время для очевидных вещей, которые надеюсь споров не вызовут, а именно удаление той информации из базы, которая никаким образом не может быть полезна, а только увеличивает объем данных. Речь в данном случае об архаичных тегах created_by на самих объектах, оставшиеся со времён предыдущей версии API. В текущей версии API created_by пишется исключительно в свойствах самого ченжсета, а на объектах постепенно удаляется по мере правок.

Удаление будет произведено в несколько этапов:

  1. удаление всех created_by=Potlach|Josm|Merkaartor (99%)
  2. анализ остальных и если содержимое тега применимо к source, но source отсутсвует, то перенос в source

Уже производится

http://www.openstreetmap.org/browse/way/104487506/history
в таких случаях может алгоритм усложнить и добавлять layer=1
с layer очень много ошибок, которые наверное возможно и ботом поправить, во многих случаях.

Залит (относительно небольшой) ченжсет, сокративший число различных написаний bridge=* примерно вдвое, где-то до 130 штук.

http://www.openstreetmap.org/browse/changeset/9550255

глобальные правки с моей стороны пока прекращаются, если есть желающие обработать какую-то конкретную область и помочь в этом - обращайтесь. :3

Сам же себе и отвечаю: судя по вики
тег landuse=reservoir устарел

господа нормализаторы, что за обострение теперь становится уже нормой единоличное принятие решения в глобальных масштабах?
Достаточно, что-ли вот так “объявить”

и тут же начать косить
http://www.openstreetmap.org/user/Max%20Vasilev/edits
?
Раньше считалось хорошим тоном, хотя бы, попытаться обсудить.

вот нафиг, за такое руки вырвут с корнем
а придумавшему нужно меньше за компьютером сидеть

обороты сбавь, лучше себе вырвите и начните с языка
если я здесь не верно понял, можно спокойно объяснить, не 1984 за мыслепреступления - расстреливать

Просто что-то многие стали увлечённо шашкой махать базу править, не дожидаясь обсуждения.

Общий принцип таков - не нужно пихать умолчания в базу. Не нужно проставлять всем объектам layer=0, а всем мостам - layer=1. Если вам это нужно - это элементарно делается в конвертере или через простенький препроцессинг перед ним. Потому что кому-нибудь другому могут потребоваться другие умолчания для своих целей. Простановленный тег не равно его отсутствию.

Далеко не сразу и совершенно не единолично. Тема уже очень давно обсуждалась на главном англоязычном канале IRC, после чего вчера была ещё раз поднята на русскоязычном канале и не нашла ни одного противоречия. После этого уже был сделал анонс и на форуме и взято несколько часов на ожидание.

Спешка, как известно, нужна только в двух случаях…

Год с выхода версии api 0.6, где created_by на объектах объявлен вне закона и подлежащим выкашиванию - это спешка?

Пожалуйста, если у кого-то есть какие возражения или кто-то использует теги created_by=JOSM, на нодах, для навигации, я готов выслушать.

Год - не спешка, а вот несколько часов, по сравнение, это спешка.
Раз год ждали, то смысл в “нескольких часах” — нулевой. Могли бы с тем же успехом на форум и вовсе наплевать, да и на форуме с такой скоростью реакция не происходит.
Получился бы такой иркин междусобойчик :wink: