Нормализация данных по областям

А, сори, что-то не усмотрел… невнимательный стал. Но тег-то всё равно не лишним был.

Про addr:housenumber при наличии name: сейчас полностью числовые номера остаются в addr:housenumber, остальные - в name. Исправил на проверку первого символа, чтобы дроби и корпуса не уходили в name.

Про created_by и source: было замечено просто огромнейшее число нодов только с ними, в основном - в составе импортированных русел рек. При том, что русла после этого уже перемещались, а теги на них всё равно оставались, хоть и были продублированы на самом вее. Добавил проверку на то, что объект - узел. Если на объекте есть какие-то ещё теги, кроме, собственно, source=, то он остаётся.

Это неправильно - есть номера типа “вл11” или просто “А”. Я как-то делал то же самое (удалял name и housename совпадающие с housenumber) - перед этим, просмотре список замен, я не нашёл ни одного случая, где надо было сделать наоборот. Думаю, достаточно безопасно удалять name, но для спокойствия можно грепнуть на что-то имяобразное типа \w{4,} хотя думаю таких не будет.

А вообще, давайте договоримся - никаких массовых изменений/заливок без предварительной темы на форуме. Это не только неуважение к сообществу - это упущенная возможность найти ошибки типа упомянутых до заливки и плохой пример в целом.

Если place_name меняется на name, тогда почему исчезли все name?

я ЗА нормализацию

но ПРОТИВ того, как это начал делать Котяра

может это и глупо, но предлагаю откатить эти ченджсеты и начать “с чистого листа”

  if tags.get("entrance") == "yes":
    tags["building"] = "entrance"
    del tags["entrance"]

WTF?

Ну вроде по вики он building=entrance а не entrance=yes
по entrance=* вроде был пропозал но для мапинга запасных, главных, служебных и т.п. входов. Но вроде не принят еще.

(он - это вход конечно)

Ну на building=entrance вообще никакого пропосала не было насколько я знаю. Да и недостатки такого обозначения очевидны. Даже если бы и был пропосал, то все равно менять одно на другое таким способом как-то по хамски что-ли. Поясню, я обозначал не очень много подъездов, но те что обозначал последнее время специально обозначал entrance=yes, т.к. считаю такой вариант более правильным, а теперь приходит Котяра и конвертирует скриптом.

Список name, которые нужно удалять, конечно, далеко неполный.
Вот ещё несколько случаев, массово встречающихся в RU-ME.
landuse: farmland
name: пашня

landuse: farmyard
name: ферма

name: лес
natural: wood

landuse: allotments
name: частные участки

landuse: industrial
name: школьная территория

Удаление у дорог name вида Населённый пункт 1 - Населённый пункт 2 (Астрахань - Волгоград, например) присутствует? Если нет, стоит добавить, а то это так же мешает.

+1, я думал, стоит это предлагать или нет. Хорошо бы откатить, чтобы в следующий раз перед заливкой люди думали, а изменения проверялись. Тем более что находится всё больше и больше проблем.

Для точек однозначно должно быть наоборот.

building=entrance — 153 тысячи точек
entrance=yes — 4 тысячи точек
я за первый вариант
но против автоматического преобразования в любую сторону.

/// entrance=yes — 4 тысячи точек

enrtance=main\public\fire_exit\private\etc
не так давно его предложили, поэтому еще мало отмечено и переделано

/// против автоматического преобразования в любую сторону.

+500

вообще, не ожидал такого от Котяры :confused:

upd:

// Хорошо бы откатить

кто возьмется?

На самом деле сравнивать надо с entrance=*

Эти тэги вообще не взаимозаменяемы, ибо первое - устаревший метод обозначения входа, а по-хорошему должен обозначать подъезд http://osm.org/go/0t21OPznF– , а второе - конкретно и однозначно вход.

Может автор и откатит?

Пожалуйста, не ломайте теги entrance: в них содержится порой достаточно полезная информация о том, какой вход основной, какой пожарный, а какой служебный. Пример.

Если кто-то очень любит откаты и считает, что откат тут просто необходим - пусть откатывает; заодно оценит количество явной лажи как нормализатора, так и собственно базы.

Исходники нормализатора продолжают лежать в том же месте, желающие навести порядок в своей области могут воспользоваться.

Любит-не любит… При чем тут это? Вещь хорошая, но спросить стоило бы. А то бах-бах и name даже пропали

Вот только детских обид тут не хватало… Ну да, найти в себе мужество признаться в том, что облажался, это непросто.

Ты сам-то как считаешь? Что десять тысяч удалённых source перевешивает сотню добавленных реальных ошибок, или просто “и так сойдёт”?

Заметил в одном месте обозначал ооочень ужасную грунтовку http://www.openstreetmap.org/browse/way/29200732/history track, а после Котяры стало просто road… то есть моё определение дороги не понравилось скрипту? мне не понятно почему так получилось и кажется мне это не в одном месте… тоесть туча вполне определенных траков стало роад и теперь снова нужно их найти и менять на трак? не верю что люди по второму кругу пойдут определятся… хотя прикольно, раз в год скидывать всю классификацию дорог и пусть ее заново делают… вдруг где чего поменялость :slight_smile:

приношу свои извинения :frowning:

Я посмотрю на неделе что там наворочено и откачу явную хрень.