Нормализация данных по областям

Komяpa, делать замену тега без анализа по сути - вообще неправильно. Уверен, что в 99,9% случаев должно быть наоборот, даже если значение addr:housenumber начинается с буквы.

+1. Причина этого проста. ОSM процесс коллективный, и если ты хочешь чтобы было “так-то” нужно хотя бы довести до широких народных масс.

Ну так исправь, пожалуйста. Я всю ночь писал откатывалку, а мог бы писать streetmangler который ты сам же просил. Или поспать, например.

К source и много чему ещё у меня лично претензий нет, поэтому я и не хочу откатывать changeset’ы целиком, а выбрать объекты по тэгам.

Давай для начала ты их все перечислишь и мы их обсудим.

Мне совершенно не нравятся, как минимум:

  • адреса которые стали name
  • entrance
  • удаление name у почт и заправок

Что там было с той грунтовкой, и что ещё у тебя нормализуется?

А исправить без отката это нельзя, потому что данные уже похерены и в историю надо лезть в любом случае. Last good версии всех объектов до твоих правок я уже скачал, так что можно выбрать и откатить нужные объекты. После этого ты сможешь прогнать поверх исправленный нормализатор и будет счастье. Ну либо сам всё исправь - с откатом ли, без отката, но чтобы ошибок не было.

  1. для адресного поиска нужны те дома, на которых уже есть addr:street.
    Наличие на контуре addr:street, отсутствие addr:housenumber (или его равенство name), первый символ addr:housenumber - цифра, отсутствие amenity= или shop= на контуре (против name=6-й корпус СГУ, 1000 мелочей) - оказались вполне неплохим ключом для выборки.

  2. Отсмотрел список глазами, исправил руками: http://www.openstreetmap.org/browse/changeset/9538701

Не очень понял, а в чем вот здесь заключалось исправление http://www.openstreetmap.org/browse/way/48574148/history ?
Был housename=1, и куда-то исчез… :frowning:

Это не совсем так. В addr:housenumber мог быть в самом деле номер дома, при том что addr:street отсутствует. В Москве такого много. Такие дома показывались в адресном валидаторе как ошибки.

1728 линий на 87 страницах. Всего-то …
охренеть благодетельство

Я уже сказал почему первый символ не канает. При совпадении name и housenumber лучше проверять что это название, а не наоборот, т.к. это проще и таких случаев меньше. А название проверяется банальным \w{4,}.

Вот с этого и надо было начинать. Ok, это адреса. Остальное?

Слушайте, это уже за гранью. «По просьбе AMDmi3». Да вы хоть вдесятером там соберитесь, свои building=entrance я не согласен менять на entrance=yes. Вики лежит, но сомневаюсь, что там есть пропозал на такую замену. Я сейчас пытаюсь откатить этот ченджсет.

По просьбе AMDmi3 и в результате обсуждений сегодня днём в IRC залито:

Номер раз: http://www.openstreetmap.org/browse/changeset/9541061 - вернуты на место те name, которые были при нормализации разнесены по другим тегам.
Номер два: http://www.openstreetmap.org/browse/changeset/9541529 - в пределах РФ building=entrance преобразован в entrance=*.

По поводу второй правки:

Начато голосование по пропозалу entrance=yes: http://wiki.openstreetmap.org/wiki/Proposed_features/entrance
Вторую правку я сейчас пытаюсь откатить. Это явный пример рисования под рендерер, от авторов рендереров.

Явно поторопились что-то всё править, +1 за откат.

Я должен извиниться, ибо настойчиво просил Котяру исправить ошибки, в том числе откатить замену entrance=yes на building=entrance, что в итоге по моей вине превратилось в обратную замену. Я руководствовался тем что entrance, являясь надмножеством building=entrance во всех случаях является лучшей ему заменой, хотя на деле оказалось что building=entrance используется на полтора порядка шире entrance (и на два порядка шире чем я думал) и где-то по нему даже строится адресация, в то время как entrance=* даже не принят. Итого я напоролся на то за что боролся, что в очередной раз подтверждает насколько плохо делать массовые правки без предварительного уведомления и обсуждения.

Замену действительно стоит откатить, либо добавить к каждому из building=entrance и entrance=yes второй. Только не надо больше спешить.

Что-то страсти накаляются)

(написал, удалил)

лучше пойду спать все-таки.

А с чего вообще решили, что entrance=* является эквивалентом building=entrance и отменяет его? А почему не barrier=entrance ?

Это же общепринятая схема теггирования последовательным уточнением свойств:

x=y => x=y + y=z => x=y + y=z + z=k

и так далее.

building=entrance/barrier=entrance/*=entrance - общая категория входа внутрь куда-то и вполне могут иметь разные свойства.
К примеру add:flats имеют смысл на building=entrance, но для barrier=entrance скорей всего неприменимы.

entrance=* - уточнение типа и предназначения входа.

Оставляя один entrance вы теряете информацию и схема рассыпается.

  • снёс -
    опездал. в смысле опоздал

Я даже комментировать не буду.

Эта тема — рекордсмен по количеству написанных и сразу удалённых ответов :slight_smile:

Заметил еще там, где фонтаны, вода из
landuse=reservoir
стала
natural=water
water=reservoir

landuse=reservoir - это не фонтаны. Фонтаны - amenity=fountain.
Описание схемы water=: http://wiki.openstreetmap.org/wiki/Key:water