Списки населенных мест с валидацией границ и адресов

Вот по КЛАДР коду 64000001000152600 только esosedi пнули в приблизительно верное место
http://postindex.esosedi.ru/64-saratovskaya/000/001-saratov/st-966889-yantarnaya/index.html

Осталось только на кадастре ее нащупать, вот участки по этой улице
64:48:010118:101
64:48:010118:107
64:48:010118:118

А Яндеск и 2ГИС списывают друг у друга, отправляя в Новогусельский, а все остальные списывают у них :smiley:

Технологическое демо, тренировка матчинга домиков по ФИАС
http://wowik.000space.com/places/ru-yev
http://wowik.000space.com/places/ru-kos
http://wowik.000space.com/places/ru-ros
http://wowik.000space.com/places/ru-yar
http://wowik.000space.com/places/ru-tve

Вывод ужасен.
OSM-домики, найденные в ФИАС, подсвечены болдом и италиком.
Домики без OSM-ссылки и JOSM-картинки это, стало быть, ФИАС-домики ненайденные в OSM

А без болда - это значит нет в фиас? Ну и всё таки я за то, чтобы разделить чётную и не четную сторону.

На моей улице все по одной стороне.
:wink: Да и с дробями не всегда ясно на чьей они стороне

Ну хорошо, я решу за тебя, они на чётной стороне.

Абсолютно солидарен с freeExec. Конечно не претендую на истину, но по моим оценкам 3/4 если не больше адресации по стране имеет четно - нечетную структуру с расположением четных и нечетных по разные стороны основной оси улицы (проспекта, переулка и тд.). Таким образом, разделив их, просто удобнее проводить анализ ситуации.

Вот, получите новенького с чет/нечет
http://wowik.000space.com/places/ru-uly
ну и все предыдущие

Вот другое дело, сразу видно, что не замаплен конец улицы, когда чётная заканчивается на 40, а нечётная на 90. Ну и за УЛУ отдельно спасибо.

Не хочешь ли поддержать схему для дробных домов вида 20 == 20/29
addr:housenumber=20
addr:housenumber2=20/29

А ещё не понятно “8 кА <?> 8а” один ли это дом или фиас всё через корпус обозначает.

Тупо сгенерить еще один “домик”?
Или это такой “alt_name”?

Есть еще похожая задача - адреса из POI.

Очень сильно зависит от оператора, заполнявшего поля в ФИАС.
Кто-то различал, кому-то пофигу.
В каких-то регионах это действительно реально существующие разные домики

Уже по зоопарку выплывает много такого бреда

Не, считать что этот дом сматчился по этой улице. Возможно в скобках писать как он обозначен в фиас.
Вот я смотрю конкретный пример, так этот дом по другой улице вообще не значится, поэтому мне кажется размножать дома не стоит.

ПС. Да это аналог alt_name, т.е. у дома по этой лице два номера.

Вещь очень нужная, спасибо!

Ещё хотелось бы всякого-разного:

  1. фрагменты улицы отделить от списка домов (путаются…)
  2. пояснения по шрифтам и цветам для народа
  3. проценты замапленных домов по НП
  4. ссылки для загрузки в JOSM всех фрагментов улицы / всех домов типа /load_object?objects=w84,w100,w958493

Мне кажется надо ограничиться адресами только на building=*

Это может быть вполне штатная ситуация - ну нету домов по одной из сторон. Много раз такое встречал.

Так же неплохо подымит процент соответствия это выкидывания пробелов и минусов.

Минусы это ошибки. Не должно быть минусов, насколько я понимаю, если это не интервал, конечно
http://wiki.openstreetmap.org/wiki/RU:Key:addr

Я это говорил про фиас, там и вместе пишут и через пробел, и через минус. Причём не только для буквы, но и для корпусов/строений. Поэтому чтобы не городить кучу условий, проще отовсюду выкинуть пробелы с минусами и попробовать сравнить.

Да, ФИАС надо немного нормализировать. Там и простых ошибок операторов полно и системных, типа областных диалектов. ставить букву в поле корпуса, а клеить к номеру.
Например явная опечатка: “8стр1” в поле для номера, хотя есть отдельное поле для строения.

От какой номерочек встретился про минусы. 42Н-П
Вообще, широкое использование П - это какой-то диалект в http://wowik.000space.com/places/ru-yev , наверно “пристройка”

addr2:* я как понял не обрабатывается?

С этим можно поступить просто - честно второй домик.
“addr2:suburb”, “addr2:city” бывают или законно их брать с addr:* ?

Да, а где тренироваться?