Санкт-Петербург и область

Надо бы всё-таки литерные вариации отдельно учитывать.
Лучше всего, как мне кажется, был бы такой алгоритм:

  1. Если дом есть в OSM, ищем его в реестре с учётом литер (по умолчанию литера “А”).
  2. Если дом c литерой “А” (или без литеры) есть в реестре, но нет в OSM - отмечаем его как отсутствующий,
  3. Если дом c литерой, отличной от “А” есть в реестре, но нет в OSM - считаем его как необязательный к отметке.

Процент лучше считать среди адресов без учёта литер. А то промзоны всю статистику сейчас портят.
Как яркий пример - Орджоникидзе 46. Закрытая территория водопроводной станции, 20 сооружений с литерами, из которых половина - подземные резервуары. Одного адреса на всех должно быть достаточно.

Sergey Astakhov, сооружения вообще не проверяются.

А делать необязательными литерные дома ради хорошей статистики - это имхо неправильно :slight_smile:

В смысле?
“Адрес строения г.Санкт-Петербург, улица Орджоникидзе, дом 46, литера ВБ” - это подземный резервуар. В списке присутствует.

Она не плохая или хорошая. Она сейчас - неадекватная, считает не то что нужно.

Написано же: “дом”. У сооружений вместо этого пишут “сооружение”

Я понимаю что написано. Но реально там никаким домом не пахнет.
Есть ещё круче примеры, когда таким адресами (без слова “сооружение”) обозначены ж/д насыпи, фонтаны, пирсы и т.п. Что с ними делать будем? Чистить реестр или составлять справочник таких несуразностей?

Значит, так. Вот то, что вытаскивается с ргиса: http://gis-lab.info/data/mp/rgis.7z
Делайте с ним что хотите: выкидывайте, добавляйте, объединяйте, переименовывайте…
Потом пришлите мне результат в виде таблицы “город - субурб - улица - дом” - я добавлю его в альтернативный валидатор. Будет их два :slight_smile:

Убрал такие дубли: когда у нескольких адресов одинаковый id, оставил только те, которые с литерами

Теперь у меня всё хорошо :slight_smile: Думаю что косяков и накладок будет немало, но в проверенных наугад трёх улицах результат меня полностью удовлетворил :slight_smile: Осталось ввести какой-то график обновлений, т.к. похоже не только я захотел исправить некоторые очевидные оплошности :slight_smile:

Есть ещё такая проблема. К примеру, дом имеет номер 22, а в ргис - 22 литера Б (22 литера А вообще не существует). В итоге, хотя это один и тот же дом, валидатор считает их разными. Как убрать ошибку? Прописывать addr:letter = “Б” ?
И ещё. Что более приоритетно: информация из ргис, адрес в паспорте жильцов или табличка на доме?

Отвечу так. addr:letter=Б я для таких домов теперь проставляю. И ошибка должна уйти из валидатора. addr:housenumber остаётся без изменения.

Информация из РГИС вроде как весьма точна, но косяки и там есть. Табличка на доме часто противоречит РГИС, особенно если этот дом угловой. Я использую РГИС так как вроде он более точно соответсвует правоустанавливающим документам. А прописка … бывает ли что номер дома изменился а человек не поменял штампик? Например, был дом 2 а стал 2/27? Лично я доверяю РГИС кроме тех случаев когда он противоречит здравому смыслу (тогда скорее всего в нём ошибка).

По поводу валидатора … Я считаю что 85-90% зелёного это правильное совпадение. 100% совпадения у меня не получается, разница в каких-то киосках, шахтах, бомбоубежищах и т.п. что с моей точки зрения нормальным людям фиолетово. Лучше я силы потрачу на реальные дома а не на странные склады, гаражи, мастерские прописанные в РГИС.

Дело в том, что это всё немного разные адреса, и поэтому они могут отличаться.

Есть “адрес строения” - по которому оно зарегистрировано, это с литерой. Я считаю, что в addr:hn надо писать именно его.
Есть “уличный адрес” - порядковый номер дома (или участка) по улице. Он обычно отображён на табличке, и их может быть несколько (у угловых домов, например). Они в ргис тоже имеются, но ссылаются на основной адрес.
И есть “почтовый адрес”, который например в паспорте. Он на самом деле относится не к самому строению, а к чему-то внутри, поэтому может быть один общий у нескольких строений, или наоборот, несколько для разных концов строения - как почте удобнее.

Коллеги привет!
Коли уж зашла тема с валидаторами, помогите разрулить с Выборгом.
Имеем в валидаторе http://yav.gis-lab.info/boundaries/r312144-o41615101 Выборгское городское поселение
Валидатор ругается на Таммисуо, поселок имени Кирова и Кировские дачи - они обозначены как деревни, но по факту это часть города, такой-то район, сверяюсь по карте с портала Выборга http://map.vbgcity.ru/
Т.е. эти самые деревеньки никакие не деревеньки с административной точки зрения, а…ммм… как бы сказать-то правильно, некое географическое/историческое место с названием, вроде бы так получается.
Как правильно эту ситуацию разрулить?

Собственно, валидатор и говорит, что таких н.п внутри ГП Выборга не должно быть.
Надо поменять на place=suburb или locality

Откуда и как берутся литеры:

Наверняка есть ещё какие-либо местные инструкции, но принцип, я думаю, остался без изменения.

Да, программа зачитывающая автоматически данные получила бы очень странное представление о городе :slight_smile: Наткнулся на landuse=reservoir внутри которой - многоэтажные дома :slight_smile:

Думаю что автор просто опечатался, я мимо этих зданий проезжаю каждый месяц и это не дома “в фонтане” …

улыбнуло

Это наверное такой юмор у чиновников - все что с “Г”, то служебные строения. :slight_smile:

Вот статистика по литерам в ргис: http://gis-lab.info/data/mp/letters.csv
Могу отфильтровывать ненужные, если расскажете, какие именно

Ну как минимум можно, ИМХО, спокойно повыкидывать все неоднобуквенные и цифровые/римскоцифровые.
Латинские буквы, похожие на русские - можно попробовать приравнять к русским.

А не посмотрят ли опытные гуру, почему в валидаторе Стрельна не опознается? http://yav.gis-lab.info/boundaries/r367376-o40396000

Наверное из-за type=boundary. Валидатор хочет multipolygon