Нормализация данных по областям

  1. для адресного поиска нужны те дома, на которых уже есть addr:street.
    Наличие на контуре addr:street, отсутствие addr:housenumber (или его равенство name), первый символ addr:housenumber - цифра, отсутствие amenity= или shop= на контуре (против name=6-й корпус СГУ, 1000 мелочей) - оказались вполне неплохим ключом для выборки.

  2. Отсмотрел список глазами, исправил руками: http://www.openstreetmap.org/browse/changeset/9538701

Не очень понял, а в чем вот здесь заключалось исправление http://www.openstreetmap.org/browse/way/48574148/history ?
Был housename=1, и куда-то исчез… :frowning:

Это не совсем так. В addr:housenumber мог быть в самом деле номер дома, при том что addr:street отсутствует. В Москве такого много. Такие дома показывались в адресном валидаторе как ошибки.

1728 линий на 87 страницах. Всего-то …
охренеть благодетельство

Я уже сказал почему первый символ не канает. При совпадении name и housenumber лучше проверять что это название, а не наоборот, т.к. это проще и таких случаев меньше. А название проверяется банальным \w{4,}.

Вот с этого и надо было начинать. Ok, это адреса. Остальное?

Слушайте, это уже за гранью. «По просьбе AMDmi3». Да вы хоть вдесятером там соберитесь, свои building=entrance я не согласен менять на entrance=yes. Вики лежит, но сомневаюсь, что там есть пропозал на такую замену. Я сейчас пытаюсь откатить этот ченджсет.

По просьбе AMDmi3 и в результате обсуждений сегодня днём в IRC залито:

Номер раз: http://www.openstreetmap.org/browse/changeset/9541061 - вернуты на место те name, которые были при нормализации разнесены по другим тегам.
Номер два: http://www.openstreetmap.org/browse/changeset/9541529 - в пределах РФ building=entrance преобразован в entrance=*.

По поводу второй правки:

Начато голосование по пропозалу entrance=yes: http://wiki.openstreetmap.org/wiki/Proposed_features/entrance
Вторую правку я сейчас пытаюсь откатить. Это явный пример рисования под рендерер, от авторов рендереров.

Явно поторопились что-то всё править, +1 за откат.

Я должен извиниться, ибо настойчиво просил Котяру исправить ошибки, в том числе откатить замену entrance=yes на building=entrance, что в итоге по моей вине превратилось в обратную замену. Я руководствовался тем что entrance, являясь надмножеством building=entrance во всех случаях является лучшей ему заменой, хотя на деле оказалось что building=entrance используется на полтора порядка шире entrance (и на два порядка шире чем я думал) и где-то по нему даже строится адресация, в то время как entrance=* даже не принят. Итого я напоролся на то за что боролся, что в очередной раз подтверждает насколько плохо делать массовые правки без предварительного уведомления и обсуждения.

Замену действительно стоит откатить, либо добавить к каждому из building=entrance и entrance=yes второй. Только не надо больше спешить.

Что-то страсти накаляются)

(написал, удалил)

лучше пойду спать все-таки.

А с чего вообще решили, что entrance=* является эквивалентом building=entrance и отменяет его? А почему не barrier=entrance ?

Это же общепринятая схема теггирования последовательным уточнением свойств:

x=y => x=y + y=z => x=y + y=z + z=k

и так далее.

building=entrance/barrier=entrance/*=entrance - общая категория входа внутрь куда-то и вполне могут иметь разные свойства.
К примеру add:flats имеют смысл на building=entrance, но для barrier=entrance скорей всего неприменимы.

entrance=* - уточнение типа и предназначения входа.

Оставляя один entrance вы теряете информацию и схема рассыпается.

  • снёс -
    опездал. в смысле опоздал

Я даже комментировать не буду.

Эта тема — рекордсмен по количеству написанных и сразу удалённых ответов :slight_smile:

Заметил еще там, где фонтаны, вода из
landuse=reservoir
стала
natural=water
water=reservoir

landuse=reservoir - это не фонтаны. Фонтаны - amenity=fountain.
Описание схемы water=: http://wiki.openstreetmap.org/wiki/Key:water

Убедительнейшая просьба: не надо валить “сотню вещей” в одну кучу.
В получившихся многостраничных ченджсетах хрен разберёшься теперь.

… и номинатума. Решили бы сначала эти проблемы, а потом сносили. Есть добровольцы? Нету? Ну вот не трогайте, пожалуйста.

Кстати да - для подобных массовых правок думаю было бы лучше заливать отдельными коммитами по каждому типу исправлений. Скрипту-то всё равно один ченджсет сгенерировать или двадцать, а людям понимать, что именно на что было заменено и проверить на наличие ошибок будет гораздо легче. Ну и хорошим тоном было бы конечно обсудить изменения на форуме перед заливкой.