Эта таже проблема что и в Питере. На домах “8-я линия” а на улицах “8-9-я линии”. Поскольку валидатор сравнивает названия улиц на домах и на веях улиц, то в рамках существующего алгоритма это проблема неразрешима - строки очевидно отличаются.
Можно вынести подобные случаи в отдельный тип ошибки, если кто-то предложит регулярное выражения для парсинга таких случаев.
В Вологодской области валидатор отображает ошибки из соседних областей на некотором расстоянии от границы. Можно ли как-нибудь подправить область проверки? Будут ли эти ошибки отображаться в результатах проверки области, в которой они на самом деле находятся?
В настоящий момент, если в регионе есть 6629 адреса, из которых часть относится к адресам по территории, и при этом 1001 адрес по территории уже внесён в OSM, карта для такого региона никогда не будет собрана (1001/6629=15,1%). Иными словами, если в регионе есть достаточно много адресов по территориям и при этом значительная их часть уже внесена в базу, карта теряет шанс быть собранной, т. к. процент ошибок адресации всегда будет превышать 15%.
Предложение: помимо подсчёта суммарного процента всех ошибок (число ошибок всех типов поделить на число адресов в базе) вести подсчёт процента ошибок без учёта ошибок вида “нумерация по территории” (число ошибок всех типов, за исключением типа “нумерация по территории”, поделить на число адресов в базе) и считать карту находящейся в удовлетворительном состоянии, если второй процент меньше 15 (или, положим, 10 - цифру можно уменьшить), и нет критических проблем с дорожным графом.
Пояснение: сейчас не существует полностью приемлемой схемы, позволяющей СитиГИДу поддерживать адресацию по территориям, взятую из базы OSM. Следовательно, ошибка “нумерация по территории” на данный момент считается неисправимой. Если учитывать этот тип ошибки наравне со всеми другими типами, будет получаться, что регионы, в которых распространена адресация по территориям, могут остаться без карт, т. к. процент ошибок в адресах будет больше 15%. Поэтому я считаю, что нужно ввести для регионов, где число адресов по территориям в базе велико настолько, что не позволяет карте получить критерии B или B-, число ошибок других типов не велико и дорожный граф находится в приемлемом состоянии, дополнительный тип, например, B*.
То есть после нужно добавить:
<ClassB2>
<Description>
Класс B - карты, которые можно выпускать в свет. Целый адресный реестр и дорожный граф.
</Description>
<MaxSealineBreaks>0</MaxSealineBreaks>
<MaxIsolatedSubgraphs>50</MaxIsolatedSubgraphs>
<MaxIsolatedSubgraphsTertiary>5</MaxIsolatedSubgraphsTertiary>
<MaxDeadEnds>10</MaxDeadEnds>
<MaxRoutiningEdges>300000</MaxRoutiningEdges>
<MaxUnmatchedAddrHousesWithoutAddrPlaces>0.15</MaxUnmatchedAddrHousesWithoutAddrPlaces>
<MaxUnmatchedAddrStreets>0.15</MaxUnmatchedAddrStreets>
</ClassB>
UnmatchedAddrHousesWithoutAddrPlaces = (число ошибок типа I + число ошибок типа II + число ошибок типа III + число ошибок типа IV + число ошибок типа VI ) / число адресов. В данном случае величина 0.15, вероятно, может быть уменьшена.
Самые свежие данные от 2012-12-20 - валидация приостановлена?
И ещё, а можно к себе закачать программу, которой идёт валидация? Я готов в день (рабочий) по 3-5 регионов запускать и выкладывать. Так сказать, что бы частично разгрузить основной сервер.
К сожалению (в силу несовершенства кода программы) я не получаю уведомления, если валидация “зависает”. Поэтому если валидатор завис, пишите сюда, не бойтесь.
По идее, от перехода на java версию, он и так должен сильно разгрузиться
P.S.
Я помню обо всех просьбах, но выполнить их смогу только на каникулах
Какой-то косяк с сегодняшней валидацией
Архангельская обл. 32 разрыва береговой линии, 561 изолят
Красноярский край, юг 21 адрес всего 100% битых
Свердловская обл. 3 адреса всего 100% битых
Ростовская обл. 353 изолята
Еще вчера все было нормально. На картах вроде все тип-топ.