Нормализация данных по областям

6 октября Котяра начал нормализацию данных по областям. Он не составил описания процесса, что и на что меняется, поэтому предлагаю местным самим оценить полезность этих ченджсетов:

Мурманская область
Дагестан
Чувашия
Челябинская область
Чечня
Бурятия
Брянская область
Белгородская область
Башкирия
Амурская область
Алтайский край
Алтай
Адыгея
Ярославская область
Архангельская область

По некоторым областям несколько ченджсетов, я дал ссылку на один из.

Miroff: «Komzpa, зачем place_name на name заменил?»
Komzpa: «а ещё я, такой плохой, снёс кладр-названия-суффиксы, проставил name:ru, снёс кладрокоды со зданий, убрал “р.” из рек, посносил name=гаражи c landuse=gareges и ещё примерно сотня других вещей»
Komzpa: «ах да, адреса. разброс схем от is_in:city до name=addr:housenumber тоже нормализуется.»

Лично я пока против только замены place_name на name, но подробно ченджсеты ещё не изучал.

Да, в планах пройтись по всем регионам.

Исходники лежат в открытом виде по адресу https://github.com/Komzpa/fuzzy-osm - об этом неоднократно упоминалось в IRC.

Правятся в основном очевиднын ошибки потлач-новичков, типа labduse=garages building=yes для описания одного гаража, и тому подобное.

Place_name действительно меняется на name. Я в курсе, что в мапнике это рендерится некрасиво, разъяснительная работа с мейнтейнерами стиля мапника уже ведётся. Других причин сохранять place_name мне не было названо.

Если есть другие замечания или предложения, что можно исправить - велкам.

Можно ссылку на хотя бы одно упоминание этих исходников в IRC, в контексте осм-бота? Я не нашёл.

Даже сложный xybot имеет подробное описание. Если собираешься натравить бота на чужие области — не поленить написать человекопонятное описание всех замен, которые он делает. Это уж всяко проще, чем программировать.

Замена слегка деструктивная…
Перешёл по первой же ссылке на вей из чейнджсета Ярославской области.
Номер дома помещён в name=, что есть не гуд.
Да и не надо менять place_name на name, если угодно, просто добавьте name=
, но place_name трогать не надо.
Да и вообще у 7 из 12 домов в этом районе произошла такая неправильная замена.

place_name трогать надо, но, наверное, лучше в два этапа. Сначала добавить name, перенастроить рендеры, поубивать place_name.

ладно, помониторим, чё. Глюки починим, при необходимости

Честно говоря цензурных слов нет. Совсем. Теперь все должны освоить Питон для понимания кто и что массово правит в осме? Котяра, мне кажется ты конкретно неправ. Вроде 100500 раз обсуждалось, что массовые правки хорошо бы согласовывать с сообществом.

2 модераторы - тему нужно от оффтопа отклеить, очевидно что она не оффтоп ниразу.

place_name надо сносить без вариантов, тега такого нет и быть не должно, проблема рендеров - это проблема рендеров. А вот перенос номера дома в name - это грубейшая ошибка, ломающая все схемы адресного поиска.

2 Max Vasilev:
Безотносительно к правкам Котяры вопрос: такого тэга нет где? В осме появился фиксированный список тэгов? Можно ссылочку?

http://www.openstreetmap.org/browse/way/110845973/history
Почему-то снят source=bing. created_by вроде как тоже рекомендуют удалять только косвенно, когда правится сам объект.

там до этого было

addr:housenumber = 8/24
addr:street = Заводская улица
building = yes
name = 8/24

т.е. не перенос, а вынос не того тега.

Но в форуме неплохо было бы загодя отписаться, в IRC не все регулярно бывают.

В осме появился принцип «не рисуем под рендер». Причём очень давно.

В IRC об этом тоже не предупреждали. Неплохо было бы хоть где-нибудь написать заранее.

А, сори, что-то не усмотрел… невнимательный стал. Но тег-то всё равно не лишним был.

Про addr:housenumber при наличии name: сейчас полностью числовые номера остаются в addr:housenumber, остальные - в name. Исправил на проверку первого символа, чтобы дроби и корпуса не уходили в name.

Про created_by и source: было замечено просто огромнейшее число нодов только с ними, в основном - в составе импортированных русел рек. При том, что русла после этого уже перемещались, а теги на них всё равно оставались, хоть и были продублированы на самом вее. Добавил проверку на то, что объект - узел. Если на объекте есть какие-то ещё теги, кроме, собственно, source=, то он остаётся.

Это неправильно - есть номера типа “вл11” или просто “А”. Я как-то делал то же самое (удалял name и housename совпадающие с housenumber) - перед этим, просмотре список замен, я не нашёл ни одного случая, где надо было сделать наоборот. Думаю, достаточно безопасно удалять name, но для спокойствия можно грепнуть на что-то имяобразное типа \w{4,} хотя думаю таких не будет.

А вообще, давайте договоримся - никаких массовых изменений/заливок без предварительной темы на форуме. Это не только неуважение к сообществу - это упущенная возможность найти ошибки типа упомянутых до заливки и плохой пример в целом.

Если place_name меняется на name, тогда почему исчезли все name?

я ЗА нормализацию

но ПРОТИВ того, как это начал делать Котяра

может это и глупо, но предлагаю откатить эти ченджсеты и начать “с чистого листа”

  if tags.get("entrance") == "yes":
    tags["building"] = "entrance"
    del tags["entrance"]

WTF?

Ну вроде по вики он building=entrance а не entrance=yes
по entrance=* вроде был пропозал но для мапинга запасных, главных, служебных и т.п. входов. Но вроде не принят еще.

(он - это вход конечно)