Эти тэги вообще не взаимозаменяемы, ибо первое - устаревший метод обозначения входа, а по-хорошему должен обозначать подъезд http://osm.org/go/0t21OPznF– , а второе - конкретно и однозначно вход.
Пожалуйста, не ломайте теги entrance: в них содержится порой достаточно полезная информация о том, какой вход основной, какой пожарный, а какой служебный. Пример.
Если кто-то очень любит откаты и считает, что откат тут просто необходим - пусть откатывает; заодно оценит количество явной лажи как нормализатора, так и собственно базы.
Исходники нормализатора продолжают лежать в том же месте, желающие навести порядок в своей области могут воспользоваться.
Заметил в одном месте обозначал ооочень ужасную грунтовку http://www.openstreetmap.org/browse/way/29200732/history track, а после Котяры стало просто road… то есть моё определение дороги не понравилось скрипту? мне не понятно почему так получилось и кажется мне это не в одном месте… тоесть туча вполне определенных траков стало роад и теперь снова нужно их найти и менять на трак? не верю что люди по второму кругу пойдут определятся… хотя прикольно, раз в год скидывать всю классификацию дорог и пусть ее заново делают… вдруг где чего поменялость
Конкретно по name/addr:housenumber: можно и нужно исправить и без отката.
Снесенный source на объектах без прочих тегов считаю откатывать нецелесообразным, их всё равно надо пересматривать местным руками - source наверняка изменится.
Прочие нормализации - также считаю откатывать бессмысленным.
Komяpa, делать замену тега без анализа по сути - вообще неправильно. Уверен, что в 99,9% случаев должно быть наоборот, даже если значение addr:housenumber начинается с буквы.
+1. Причина этого проста. ОSM процесс коллективный, и если ты хочешь чтобы было “так-то” нужно хотя бы довести до широких народных масс.
Ну так исправь, пожалуйста. Я всю ночь писал откатывалку, а мог бы писать streetmangler который ты сам же просил. Или поспать, например.
К source и много чему ещё у меня лично претензий нет, поэтому я и не хочу откатывать changeset’ы целиком, а выбрать объекты по тэгам.
Давай для начала ты их все перечислишь и мы их обсудим.
Мне совершенно не нравятся, как минимум:
адреса которые стали name
entrance
удаление name у почт и заправок
Что там было с той грунтовкой, и что ещё у тебя нормализуется?
А исправить без отката это нельзя, потому что данные уже похерены и в историю надо лезть в любом случае. Last good версии всех объектов до твоих правок я уже скачал, так что можно выбрать и откатить нужные объекты. После этого ты сможешь прогнать поверх исправленный нормализатор и будет счастье. Ну либо сам всё исправь - с откатом ли, без отката, но чтобы ошибок не было.
для адресного поиска нужны те дома, на которых уже есть addr:street.
Наличие на контуре addr:street, отсутствие addr:housenumber (или его равенство name), первый символ addr:housenumber - цифра, отсутствие amenity= или shop= на контуре (против name=6-й корпус СГУ, 1000 мелочей) - оказались вполне неплохим ключом для выборки.
Это не совсем так. В addr:housenumber мог быть в самом деле номер дома, при том что addr:street отсутствует. В Москве такого много. Такие дома показывались в адресном валидаторе как ошибки.
Я уже сказал почему первый символ не канает. При совпадении name и housenumber лучше проверять что это название, а не наоборот, т.к. это проще и таких случаев меньше. А название проверяется банальным \w{4,}.
Вот с этого и надо было начинать. Ok, это адреса. Остальное?