Универсальный валидатор (рутинг, адресация) на базе конвертации в СГ

Эта таже проблема что и в Питере. На домах “8-я линия” а на улицах “8-9-я линии”. Поскольку валидатор сравнивает названия улиц на домах и на веях улиц, то в рамках существующего алгоритма это проблема неразрешима - строки очевидно отличаются.

Можно вынести подобные случаи в отдельный тип ошибки, если кто-то предложит регулярное выражения для парсинга таких случаев. :wink:

Подобные случаи нужно выносить в ворнинги, а не в ошибки.
Потому что адресация по чему-то, что не является “улицей” - достаточно частое явление.

С линиями понятно. Но там в списке не только линии.
В Питере валидатор на линии не ругается. Почему? Сужу по В.О.

Не ругается, значит где-то есть отдельно веи с 8-й линией и с 9-й линией. Большего я вам сказать не могу :sunglasses:

В Вологодской области валидатор отображает ошибки из соседних областей на некотором расстоянии от границы. Можно ли как-нибудь подправить область проверки? Будут ли эти ошибки отображаться в результатах проверки области, в которой они на самом деле находятся?

dmitri-s93, необходимо скорректировать poly-файл Вологодской губернии. Где его взять и как это делается смотри на предыдущих страницах этой темы.

Zkir, 1) можно ли узнать, в каких случаях картам присваивается рейтинг “B-”? 2) можно ли добавить соответствующее описание на сайт?

http://peirce.gis-lab.ru/QualityCriteria.xml

Ух-ты, всю поднаготную расковыряли.

С “B-” основная идея такая - поиск до улиц, потому что адресов домов настолько мало, что нет особого смысла проверять их валидность.

В настоящий момент, если в регионе есть 6629 адреса, из которых часть относится к адресам по территории, и при этом 1001 адрес по территории уже внесён в OSM, карта для такого региона никогда не будет собрана (1001/6629=15,1%). Иными словами, если в регионе есть достаточно много адресов по территориям и при этом значительная их часть уже внесена в базу, карта теряет шанс быть собранной, т. к. процент ошибок адресации всегда будет превышать 15%.

Предложение: помимо подсчёта суммарного процента всех ошибок (число ошибок всех типов поделить на число адресов в базе) вести подсчёт процента ошибок без учёта ошибок вида “нумерация по территории” (число ошибок всех типов, за исключением типа “нумерация по территории”, поделить на число адресов в базе) и считать карту находящейся в удовлетворительном состоянии, если второй процент меньше 15 (или, положим, 10 - цифру можно уменьшить), и нет критических проблем с дорожным графом.

Пояснение: сейчас не существует полностью приемлемой схемы, позволяющей СитиГИДу поддерживать адресацию по территориям, взятую из базы OSM. Следовательно, ошибка “нумерация по территории” на данный момент считается неисправимой. Если учитывать этот тип ошибки наравне со всеми другими типами, будет получаться, что регионы, в которых распространена адресация по территориям, могут остаться без карт, т. к. процент ошибок в адресах будет больше 15%. Поэтому я считаю, что нужно ввести для регионов, где число адресов по территориям в базе велико настолько, что не позволяет карте получить критерии B или B-, число ошибок других типов не велико и дорожный граф находится в приемлемом состоянии, дополнительный тип, например, B*.

То есть после нужно добавить:

<ClassB2>
<Description>
Класс B - карты, которые можно выпускать в свет. Целый адресный реестр и дорожный граф.
</Description>
<MaxSealineBreaks>0</MaxSealineBreaks>
<MaxIsolatedSubgraphs>50</MaxIsolatedSubgraphs>
<MaxIsolatedSubgraphsTertiary>5</MaxIsolatedSubgraphsTertiary>
<MaxDeadEnds>10</MaxDeadEnds>
<MaxRoutiningEdges>300000</MaxRoutiningEdges>
<MaxUnmatchedAddrHousesWithoutAddrPlaces>0.15</MaxUnmatchedAddrHousesWithoutAddrPlaces>
<MaxUnmatchedAddrStreets>0.15</MaxUnmatchedAddrStreets>
</ClassB>

UnmatchedAddrHousesWithoutAddrPlaces = (число ошибок типа I + число ошибок типа II + число ошибок типа III + число ошибок типа IV + число ошибок типа VI ) / число адресов. В данном случае величина 0.15, вероятно, может быть уменьшена.


up


up:


up:


Канонерский остров, 30

Определяется ошибка типа “Улица не найдена” (RU-SPO), а должна определяться “Дом нумеруется по территории” (т. к. стоит addr:place).


КП “На Заречной”, 10/1:

Определяется ошибка типа “Улица не найдена” (RU-SPO), а должна определяться “Дом нумеруется по территории” (т. к. стоит addr:place).


258-й кв-л, 1:

Определяется ошибка типа “Улица не является рутинговой” (RU-IRK), а должна определяться как “Дом нумеруется по территории” (т. к. стоит addr:place).

Самые свежие данные от 2012-12-20 - валидация приостановлена?
И ещё, а можно к себе закачать программу, которой идёт валидация? Я готов в день (рабочий) по 3-5 регионов запускать и выкладывать. Так сказать, что бы частично разгрузить основной сервер.

К сожалению (в силу несовершенства кода программы) я не получаю уведомления, если валидация “зависает”. Поэтому если валидатор завис, пишите сюда, не бойтесь.

По идее, от перехода на java версию, он и так должен сильно разгрузиться :slight_smile:

P.S.
Я помню обо всех просьбах, но выполнить их смогу только на каникулах :slight_smile:

Какой-то косяк с сегодняшней валидацией
Архангельская обл. 32 разрыва береговой линии, 561 изолят
Красноярский край, юг 21 адрес всего 100% битых
Свердловская обл. 3 адреса всего 100% битых
Ростовская обл. 353 изолята
Еще вчера все было нормально. На картах вроде все тип-топ.

Кирилл, прокати Каталонию пожалуйста.

Это минутные дифы побились. Должно скоро пересобраться.

Прокатил. Проверь пожалуйста, похоже на правду?

Zkir, обнови Кипр, пожалуйста. Последний проход был 24.11

А а а Кирилл, Венгрию Австрию Берлин и Сербию.
Ну или подскажи, конфиг для osm2mp для генерации мпшки чтоб его потом конвертору в сг скормить

и UA-xx запустите, пожалуйста

Пожалуйста RU-SA, запустите.

RU-CHE тоже не обновлялся с 20.12.12. И время прохода странное 0:0:17, обычно около 10 минут проверяет