Из addr:city брать нельзя, это гарантированно приведёт к глюкам.
Чтобы нормально сделать Зеленоград, надо окончательно разобраться с сущностями адресации в Москве: чем являются Зеленоград, Внуково, Малино и иже с ними. Пока в этом вопросе до ясности далеко
С точки зрения ОМКУМ-а и адресного реестра, это не самостоятельные объекты, а просто приписка к названию улицы. Так что пока (временно) валидатор считает так же, и проверяет эту приписку по addr:suburb
Процесс обработки дампа уже устаканился, так что ставлю на ежедневную автоматическую загрузку, примерно в полдень.
Сделал более точный расчёт процента заполнения.
В главную таблицу добавил для каждой улицы количество “неканонически” записанных номеров домов и названий улиц
спасибо! может все таки раскрасить большим количеством цветов?
например, логичным мне кажется следующий набор
зеленый - правильный
серый - не найден в осм
розовый - не найден в реестре
желтый - неправильный формат адреса
оранжевый - неправильное название улицы
и куда нибудь легенду ткнуть…
Я бы рекомендовал пользоваться подходом ОКУМ-а, во всяком случае он разумен и непротиворечив. Улицы с двойными названиями есть во всех крупных городах и так их различают. А для удобства пользователей можно вводить сколько угодно понятных всем территорий типа Замоскворечье, Китай-город или Южное Бутово.
Так все таки что же делать? Эти домики, например, по http://www.ggk.mos.ru/data/guest/show_map_frame имеют совершенно другие адреса и по другой улице. В ОСМ они по ул. Академика Скрябина - в ОМКУМ таких адресов вообще нет, в ggk.mos.ru они по Ферганской ул.
А нельзя ли прикрутить статистику, когда и сколько процентов было сделано? Чтобы видеть “прогресс”?
И еще мне интересно, что все-таки помешало когда-то взять адресацию с http://www.atlasmoscow.ru ?
А можно не форсить адреса с пробелами? Кроме того, что никто так и не сказал зачем они нужны (учитывая что буквы, включенные в номер и с/к от строения/корпус мы различаем по регистру), один еще и сумятицу вносят - я видел где-то адрес вида 1 к2/2. Посмотрите как написаны адреса в том же atlasmoscow - по-моему, больше ничего не надо.
Лучше отмечать жёлтым всякие “корп.” и “стр.”. И, кстати, как писать владение и домовладение?
PS. Валидатор приравнивает латинские k и с к соответствующим кириллическим, но не aAbBdDeE. Поэтому я вчера сконвертил все addr:housenumber в Москве в кириллицу где можно было - с B и D получается неоднозначно, им добавил fixme.