Валидатор московских адресов

Можно использовать то, что по городу расставлены
addr:city = Зеленоград

P.S. Ну и в идеале сортировку бы номеров как номеров, а не строк. А то получаем вперемешку:
1,10,11,12,13,14,15,16,17,18,19,2,20,21,…

Поделитесь скриптом, у меня база локальная, я могу и бота на его основе соорудить…

Сделал списочек Зеленоградских улиц
http://wowik.000space.com/zelenograd.htm

Добавил обработку домов, заданных релейшенами

Сейчас пытаюсь сделать обработку одноимённых улиц, типа Берёзовой аллеи. Но у нас пока нет правил обозначения таких улиц. Так что пока предполагаю, что зеленоградская должна обозначаться:
addr:street=Берёзовая аллея
addr:suburb=Зеленоград

А можно еще в качестве альтернативы проверить уже расставленный
addr:city=Зеленоград ?

Кстати, и в Зеленограде есть двойные улицы.
Одни в Малино, другие в Крюково - тут и addr:suburb может сгодится.
Я тут вижу, по крайней мере, две “Заводская улица”, две “Школьная улица”, две “Лесная улица”

Из addr:city брать нельзя, это гарантированно приведёт к глюкам.
Чтобы нормально сделать Зеленоград, надо окончательно разобраться с сущностями адресации в Москве: чем являются Зеленоград, Внуково, Малино и иже с ними. Пока в этом вопросе до ясности далеко :slight_smile:
С точки зрения ОМКУМ-а и адресного реестра, это не самостоятельные объекты, а просто приписка к названию улицы. Так что пока (временно) валидатор считает так же, и проверяет эту приписку по addr:suburb

Процесс обработки дампа уже устаканился, так что ставлю на ежедневную автоматическую загрузку, примерно в полдень.

Имеется в виду когда сам дом является отношением (например мультиполигон) и теги прописаны на отношении?

Да

А чтобы не было глюков, можно было бы написать проверку на слово Зеленоград.

Дык в том-то и дело, что меньше всего хочется делать проверки по отдельным словам

Зеленоград общим аршином всё-равно не измерить :wink:

А надо :slight_smile:
Но этот вопрос надо бы всё-таки обсуждать отдельно.

Сделал более точный расчёт процента заполнения.
В главную таблицу добавил для каждой улицы количество “неканонически” записанных номеров домов и названий улиц

спасибо! может все таки раскрасить большим количеством цветов?
например, логичным мне кажется следующий набор
зеленый - правильный
серый - не найден в осм
розовый - не найден в реестре
желтый - неправильный формат адреса
оранжевый - неправильное название улицы
и куда нибудь легенду ткнуть…

Я бы рекомендовал пользоваться подходом ОКУМ-а, во всяком случае он разумен и непротиворечив. Улицы с двойными названиями есть во всех крупных городах и так их различают. А для удобства пользователей можно вводить сколько угодно понятных всем территорий типа Замоскворечье, Китай-город или Южное Бутово.

Поставил так.
Но как я уже говорил, за нормальный дизайн был бы очень благодарен :slight_smile:

Круть!

Только вот тут глюк - считает название улицы неправильным, хотя оно правильное
http://gis-lab.info/data/mp/msk/?code=00970

А не, вру. Там в названии (в осм) два пробела. Вроде все кривые addr:street по Москве исправил.

Что будем делать с “проезд N XXX” и “проектируемый проезд N XXX”?
Не писать же их в самом деле с большой буквы?