Нормализация данных по областям

Список name, которые нужно удалять, конечно, далеко неполный.
Вот ещё несколько случаев, массово встречающихся в RU-ME.
landuse: farmland
name: пашня

landuse: farmyard
name: ферма

name: лес
natural: wood

landuse: allotments
name: частные участки

landuse: industrial
name: школьная территория

Удаление у дорог name вида Населённый пункт 1 - Населённый пункт 2 (Астрахань - Волгоград, например) присутствует? Если нет, стоит добавить, а то это так же мешает.

+1, я думал, стоит это предлагать или нет. Хорошо бы откатить, чтобы в следующий раз перед заливкой люди думали, а изменения проверялись. Тем более что находится всё больше и больше проблем.

Для точек однозначно должно быть наоборот.

building=entrance — 153 тысячи точек
entrance=yes — 4 тысячи точек
я за первый вариант
но против автоматического преобразования в любую сторону.

/// entrance=yes — 4 тысячи точек

enrtance=main\public\fire_exit\private\etc
не так давно его предложили, поэтому еще мало отмечено и переделано

/// против автоматического преобразования в любую сторону.

+500

вообще, не ожидал такого от Котяры :confused:

upd:

// Хорошо бы откатить

кто возьмется?

На самом деле сравнивать надо с entrance=*

Эти тэги вообще не взаимозаменяемы, ибо первое - устаревший метод обозначения входа, а по-хорошему должен обозначать подъезд http://osm.org/go/0t21OPznF– , а второе - конкретно и однозначно вход.

Может автор и откатит?

Пожалуйста, не ломайте теги entrance: в них содержится порой достаточно полезная информация о том, какой вход основной, какой пожарный, а какой служебный. Пример.

Если кто-то очень любит откаты и считает, что откат тут просто необходим - пусть откатывает; заодно оценит количество явной лажи как нормализатора, так и собственно базы.

Исходники нормализатора продолжают лежать в том же месте, желающие навести порядок в своей области могут воспользоваться.

Любит-не любит… При чем тут это? Вещь хорошая, но спросить стоило бы. А то бах-бах и name даже пропали

Вот только детских обид тут не хватало… Ну да, найти в себе мужество признаться в том, что облажался, это непросто.

Ты сам-то как считаешь? Что десять тысяч удалённых source перевешивает сотню добавленных реальных ошибок, или просто “и так сойдёт”?

Заметил в одном месте обозначал ооочень ужасную грунтовку http://www.openstreetmap.org/browse/way/29200732/history track, а после Котяры стало просто road… то есть моё определение дороги не понравилось скрипту? мне не понятно почему так получилось и кажется мне это не в одном месте… тоесть туча вполне определенных траков стало роад и теперь снова нужно их найти и менять на трак? не верю что люди по второму кругу пойдут определятся… хотя прикольно, раз в год скидывать всю классификацию дорог и пусть ее заново делают… вдруг где чего поменялость :slight_smile:

приношу свои извинения :frowning:

Я посмотрю на неделе что там наворочено и откачу явную хрень.

Откат необходим как минимум чтобы вот это правильно бы отработало

Сам же исправил в 15-й версии объекта, а на Котяру гонишь! :slight_smile:

Конкретно по name/addr:housenumber: можно и нужно исправить и без отката.

Снесенный source на объектах без прочих тегов считаю откатывать нецелесообразным, их всё равно надо пересматривать местным руками - source наверняка изменится.

Прочие нормализации - также считаю откатывать бессмысленным.

Будьте, пожалуйста внимательнее - track на этой дороге был всего несколько часов 2.5 года назад.

  1. Как? Я, к сожалению, не вижу алгоритма, который бы это починил. Приведите, если не сложно.
  2. Когда? Базу по факту этим перекосило. Когда она вернется в нормальное состояние?

Komяpa, делать замену тега без анализа по сути - вообще неправильно. Уверен, что в 99,9% случаев должно быть наоборот, даже если значение addr:housenumber начинается с буквы.

+1. Причина этого проста. ОSM процесс коллективный, и если ты хочешь чтобы было “так-то” нужно хотя бы довести до широких народных масс.

Ну так исправь, пожалуйста. Я всю ночь писал откатывалку, а мог бы писать streetmangler который ты сам же просил. Или поспать, например.

К source и много чему ещё у меня лично претензий нет, поэтому я и не хочу откатывать changeset’ы целиком, а выбрать объекты по тэгам.

Давай для начала ты их все перечислишь и мы их обсудим.

Мне совершенно не нравятся, как минимум:

  • адреса которые стали name
  • entrance
  • удаление name у почт и заправок

Что там было с той грунтовкой, и что ещё у тебя нормализуется?

А исправить без отката это нельзя, потому что данные уже похерены и в историю надо лезть в любом случае. Last good версии всех объектов до твоих правок я уже скачал, так что можно выбрать и откатить нужные объекты. После этого ты сможешь прогнать поверх исправленный нормализатор и будет счастье. Ну либо сам всё исправь - с откатом ли, без отката, но чтобы ошибок не было.

  1. для адресного поиска нужны те дома, на которых уже есть addr:street.
    Наличие на контуре addr:street, отсутствие addr:housenumber (или его равенство name), первый символ addr:housenumber - цифра, отсутствие amenity= или shop= на контуре (против name=6-й корпус СГУ, 1000 мелочей) - оказались вполне неплохим ключом для выборки.

  2. Отсмотрел список глазами, исправил руками: http://www.openstreetmap.org/browse/changeset/9538701