Заметил в одном месте обозначал ооочень ужасную грунтовку http://www.openstreetmap.org/browse/way/29200732/history track, а после Котяры стало просто road… то есть моё определение дороги не понравилось скрипту? мне не понятно почему так получилось и кажется мне это не в одном месте… тоесть туча вполне определенных траков стало роад и теперь снова нужно их найти и менять на трак? не верю что люди по второму кругу пойдут определятся… хотя прикольно, раз в год скидывать всю классификацию дорог и пусть ее заново делают… вдруг где чего поменялость
Конкретно по name/addr:housenumber: можно и нужно исправить и без отката.
Снесенный source на объектах без прочих тегов считаю откатывать нецелесообразным, их всё равно надо пересматривать местным руками - source наверняка изменится.
Прочие нормализации - также считаю откатывать бессмысленным.
Komяpa, делать замену тега без анализа по сути - вообще неправильно. Уверен, что в 99,9% случаев должно быть наоборот, даже если значение addr:housenumber начинается с буквы.
+1. Причина этого проста. ОSM процесс коллективный, и если ты хочешь чтобы было “так-то” нужно хотя бы довести до широких народных масс.
Ну так исправь, пожалуйста. Я всю ночь писал откатывалку, а мог бы писать streetmangler который ты сам же просил. Или поспать, например.
К source и много чему ещё у меня лично претензий нет, поэтому я и не хочу откатывать changeset’ы целиком, а выбрать объекты по тэгам.
Давай для начала ты их все перечислишь и мы их обсудим.
Мне совершенно не нравятся, как минимум:
адреса которые стали name
entrance
удаление name у почт и заправок
Что там было с той грунтовкой, и что ещё у тебя нормализуется?
А исправить без отката это нельзя, потому что данные уже похерены и в историю надо лезть в любом случае. Last good версии всех объектов до твоих правок я уже скачал, так что можно выбрать и откатить нужные объекты. После этого ты сможешь прогнать поверх исправленный нормализатор и будет счастье. Ну либо сам всё исправь - с откатом ли, без отката, но чтобы ошибок не было.
для адресного поиска нужны те дома, на которых уже есть addr:street.
Наличие на контуре addr:street, отсутствие addr:housenumber (или его равенство name), первый символ addr:housenumber - цифра, отсутствие amenity= или shop= на контуре (против name=6-й корпус СГУ, 1000 мелочей) - оказались вполне неплохим ключом для выборки.
Это не совсем так. В addr:housenumber мог быть в самом деле номер дома, при том что addr:street отсутствует. В Москве такого много. Такие дома показывались в адресном валидаторе как ошибки.
Я уже сказал почему первый символ не канает. При совпадении name и housenumber лучше проверять что это название, а не наоборот, т.к. это проще и таких случаев меньше. А название проверяется банальным \w{4,}.
Вот с этого и надо было начинать. Ok, это адреса. Остальное?
Слушайте, это уже за гранью. «По просьбе AMDmi3». Да вы хоть вдесятером там соберитесь, свои building=entrance я не согласен менять на entrance=yes. Вики лежит, но сомневаюсь, что там есть пропозал на такую замену. Я сейчас пытаюсь откатить этот ченджсет.
Я должен извиниться, ибо настойчиво просил Котяру исправить ошибки, в том числе откатить замену entrance=yes на building=entrance, что в итоге по моей вине превратилось в обратную замену. Я руководствовался тем что entrance, являясь надмножеством building=entrance во всех случаях является лучшей ему заменой, хотя на деле оказалось что building=entrance используется на полтора порядка шире entrance (и на два порядка шире чем я думал) и где-то по нему даже строится адресация, в то время как entrance=* даже не принят. Итого я напоролся на то за что боролся, что в очередной раз подтверждает насколько плохо делать массовые правки без предварительного уведомления и обсуждения.
Замену действительно стоит откатить, либо добавить к каждому из building=entrance и entrance=yes второй. Только не надо больше спешить.