Приведение названий улиц в соответствие соглашению и правка адресов

вот и говорит человек что юр. адрес это улица Северная, а не Северная улица

Тогда вопросов нет, просто я так понял что речь о том что Северная и Морская это одно и тоже, только офф. и местное название

Я про вариант улица Северная и Северная улица. Раньше вообще было ул. Северная и никого из приезжих не сбивало

приезжий случайно произнесёт «северная улица» и ему так ннна по почкам, не выпендривайся тут
так что пишите на карте местные названия, берегите туристов

смотря какой приезжий.
ему может другой вопрос зададут. какая северная? мы хрен его знаем где у нас север. а, север там. ну там улица х , улица у, те какую, соколик?
вот в моём городе есть две ценральных улицы- улица морская и проспект строителей. а вот кладр говорит, что есть еще некая улица центральная. хз где она.

Ничо, я недавно узнал, что у нас в Краснодаре есть Площадь Победы. И судя по разведданным, находится она на территории Детской краевой клинической больницы…

сам то я знаю где она, а вот куча волгодонцев - нет. она ж была в красноярской до присоединения

Краснодар залит. Буду продолжать по области.

Сочи давай добьем, Большой Сочи - от Магри до Кр. поляны.

http://amdmi3.ru/files/sochi.txt.html

Из этого поста:

я сделал вывод, что: существует улица Северная по кладр, а местное название Морская, вот я и написал:

P.S. Перестаю флудить, непонимание вышло вследствие невнимательного прочтения поста.

В том посте был стёб, поэтому тему лучше не развивать.

Всё гуд http://dl.dropbox.com/u/4094156/sochi.txt

Саратовская область поселок Татищево, Названия улиц ставил по памяти и спрашивая у знакомых. Приведите пожалуйста названий улиц в соответствие соглашению.

Да - только что привёл, спасибо.

AMDmi3, можешь запустить шайтан-машину Валидатора для пересканирования? Много сделал по Брянску, уже путаюсь, что сделано, что не сделано.

П.С. Есть, кстати, претензия по работе скрипта: ошибочными помечаются адреса в населённых пунктах, не содержащих улиц.

Она каждый день сама запускается. Чаще получится - дамп всё равно будет старый.

Это давно известно, и мне, честно говоря, пока лень этим заниматься. Но скоро я доконверчу Россию и займусь.

Раз уж подняли тему, хочу привести предварительные итоги проекта после 2 с лишним месяцев ковыряния.

На данный момент соглашению соответствует почти 94% всех названий (name= на улицах и addr:street), все или почти все административные центры и крупные города сконверчены, а сейчас то, что можно исправить автоматически, я конверчу целыми областями. С улицами без статусных частей сложнее - их надо по-населённо-пунктно брать из КЛАДР’а, и чтобы причесать все деревни из десятка улиц понадобится куча времени - по видимому для этого придётся написать очередного КЛАДРобота. Пока такие баги показываются в валидаторе addresses.amdmi3.ru прежде всех остальных, так что просьба исправлять их по возможности.

В общем, главный результат, ради чего, собственно, всё и затевалось: количество ненайденных по addr:street улиц сократилось с ~116000 до ~31000. Не факт что дальше оно сильно снизится - остаются дома с отсутствующими улицами (в Белгороде, кажется, их много) и адресация по районам/кварталам/населённым пунктам, которую планируется решить поиском по всему подряд, включая landuse и place. Также было исправлено большое количество опечаток и расставлено много статусных частей.

Нормализатор оброс словарями и костылями и всё ещё часто ошибается (и будет ошибаться), так что есть следующая идея - составить на основе сконвертированного списка улица и КЛАДР общероссийский реестр топонимов, с которым хитрым образом сравнивать все названия. Это поможет контролировать и порядок слов, и опечатки и, возможно, разночтения названий (улица Толстого vs. улица Льва Толстого vs. улица Л.Н.Толстого), в том числе сопоставляя OSM с другими базами типа КЛАДР.

Недовольных оказался только один человек из Энема (Карелия) - он за формат “Ленина ул.” поскольку так удобнее работает автодополнение в josm. Nuff said. Также нашлось несколько человек, которые заполняют addr:street и addr:housenumber заглушками типа 1 или *, якобы им так удобнее потом заполнять адреса. Не понял тут вообще ничего, пришлось выкинуть их из статистики (а этих звёздочек около 6 тысяч). Приличный же список тех, кто был за конвертацию у меня пока ещё не дошли руки перенести из лички в wiki. Итого, по моему мнению, по данному вопросу сообщество всё-таки пришло к единому решению и одим поводом для споров и войн стало меньше.

Для тех, кому нужен любой другой формат написания названий, напомню, есть perl модуль: https://github.com/AMDmi3/Geo-Names-Russian-Mangle, который позволяет поставить статусную часть с любой стороны и по желанию сократить её. В планах добавить туда также поддержку номерной части и поясняющего слова, а также освоить CPAN и залить его туда. При условии соответсвия названия улицы соглашению логика работы достаточно тривиальна и легко может быть реализована на любом другом языке.

Интересные ссылки:
График по багам: http://amdmi3.ru/files/addresses.svg
График по нормализатору: http://amdmi3.ru/files/street-names.svg (считаются только названия улиц)
Статистика нормализатора по областям: http://amdmi3.ru/files/names-stat1.txt , http://amdmi3.ru/files/names-stat2.txt (считаются и названия улица и addr:street, сортировка по количеству названий для которых нормализатор предложил/не предложил замену соответственно; первое, обычно, сокращения и неправильный порядок слов, второе - отсутствие статусной части).
Страница в wiki с прогрессом: http://wiki.openstreetmap.org/wiki/User:AMDmi3/Конвертация_названий_улиц

Что сказать, очень здорово.

Весьма правильная идея, давно пора.

Там осваивать-то особо нечего :slight_smile: Заливайте!

Инструкция нагугливается достаточно легко (с ходу ссылку не дам, ибо не помню). Единственное уточнение: когда будете писать запрос на выдачу вам аккаунта в PAUSE, напишите подробно, что делает ваш модуль, а не «I have some cool perl stuff».