В Калининграде и области много где “улица” опущена.
Реквестирую Кемеровскую область.
(Чего-то я там руками менял, но еще много чего осталось)
Воронеж правлю +1
Всё верно, большое спасибо AMD3mi3
Воронеж залит.
Реквестирую Краснодар.
Орск и Новотроицк можно обработать?
В тегах адреса домов тоже сменятся?
http://amdmi3.ru/files/novotroick.txt.html
http://amdmi3.ru/files/orsk.txt.html
Новотроицк, правда, я уже залил, хотя меня смущает что там (и в Орске) много улиц, которые могут быть и “Димитрова улица” и “улица Димитрова”.
По Сочи решающий голос должен быть у agsochi.
Это явно в честь болгарина Димитрова, так что улица Димитрова
Там их много, правда для всех что я смотрел есть фамилии, но мало ли.
кстати, в Петербурге много исключений: Репищева улица, Бармалеева улица и т.п. В реестре есть полный список.
Репищева ни разу не фамилия, так что это не исключение.
Не считается - пример в мужском роде
Репищева в названии улицы — краткое прилагательное.
вопрос в том, как это понять исходя только из данных осм: улица Репищева или Репищева улица? Встречается фамилия Репищев, поэтому оба варианта могут существовать.
вопрос в том, как это понять исходя только из данных осм: улица Репищева или Репищева улица? Встречается фамилия Репищев, поэтому оба варианта могут существовать.
Из данных ОСМ не понять многого. Так же как и улица Ленина.
Помогут образованность, помощь специалистов, справочников, словарей и другой специализированной литературы.
Дык идея прежде всего в том, чтобы за конечное время разгрести ту помойку, что есть сейчас, исправить 100500 адресных ошибок и привести все к одному виду. Потом можно будет исправлять странные названия улиц, разводить локальные правила и прочая - нормализатор в чистом виде будет бесполезен, потому что будет репортить исключительно собственные ошибки и исключения. С консистентностью справится адресный валидатор к которому можно будет дополнительно прикрутить детектор сокращений и отсутствия адресных частей, а через нормализатор, может быть, пропускать новые улицы.