Вот это новость!
Данные, конечно, содержат массу ошибок. Так именно их и нужно выявлять, а не сначала отсекать ошибки конвертером, а только потом валидировать, что останется.
Это очень серьезный недостаточк данного валидатора.
И рано или поздно, от него нужнор будет избавиться.
Это - еще один недостаток используемого подхода.
Это так.
Но, увы, значительная часть ошибок отсекается конвертером и потому не диагностируются валидатором. А другая часть - наведенные ошибки, котороых нет в OSM, но которые появляются либо за счет нарезки данных на мелкие кусочки, а часть - за счет потери информации при конвертации.
Чтобы валидировать адресный реестр и дорожный граф, которые валидирует данный валидатор, их нужно сперва построить, потому что сырые осм-данные в их в однозначном виде не содержат. Я думал это уже не секрет.
Отсекается все, что конвертер не сумел распознать как валидные данные. В том числе те данные, которые содержатся в OSM, но не требуются для целевой программы т.е. Ситигида.
Строго говоря, валидация после отсечения невалидных данных - это немного странно.
PS. Заодно попытайся объяснить, почему с точки зрения проверки адресации есть разница между пешеходной улицей и проезжей?
Странный наезд, такое ощущение что ты думаешь, что тебя обманули. А ведь в топике написано валидация на базе конвертации в СГ, а не валидация данных ОСМ.
Глупости, ничего тут странного.
Ошибки бывают разного уровня (например, лексические-синтаксические-семантические в языках), и проверяются они на соответствующих уровнях.
Как ни страно везде было население правда написано через одно место 10 540 с пробелом.Оптимально перегонять из формата тексового в формат цифири.
А в остальном ошибки которые надо править и это правильно.
http://peirce.gis-lab.info/qa/UA-E/addr/4
Шо не так с улицами Донецкой и Кирова в Харькове?
Валидатору не нравится привязка улиц к addr:suburb? Но в городе есть и другие улицы с привязкой к suburb, например, Бакулина. На них валидатор не ругается. Привязка улиц к suburb сделана чтобы “развести” одноимённые улицы.
Может, точки с place=suburb слишком далеко от веев улиц?
У Донецкой неправильный name в отношении: http://www.openstreetmap.org/browse/relation/2391454/history
У домов по Кирова наверное нужно удалить addr:suburb с домов оставив его только на отношении, при этом на линиях улиц оставив addr:suburb:)
Ну, ИМХО, для начала можно сделать мини-валидатор, ругающийся на перекрещивание (без узла) веев, имеющих тег highway (оба вея должны иметь тег highway) и не имеющих тег layer (хотя бы один вей должен иметь тег layer).
Кроме того, валидатор должен ругаться на узлы, находящиеся на конце или начале вея с тегом highway (пожалуй, кроме service, footway, path) и не привязанные к другому вею с тегом highway и не имеющие тега noexit=yes.
Не согласен. Вроде мешать не должно. Там addr:suburb прописан и в тегах релейшена, и в тегах веев, и в тегах домиков.
При конвертации в польский формат теги addr:suburb либо затрутся тем же тегом из релейшена, либо останутся на месте.
Мне кажется что так уверенно утверждать нельзя, osm2mp очевиден и понятен только его автору.
Тогда поставьте домам и addr:street если жалко удалять addr:suburb. Должно быть либо и то и то, либо ничего.
Пожалуй, вы правы. Вообще-то, я прописал домикам addr:suburb только потому, что сомневался, что лёшин конвертер будет переносить addr:suburb из тегов релейшена в тег домика. Но Лёша писал, что вроде бы уже наладил перенос всех адресных тегов, а не только названия улицы. Так что, скорее всего, addr:suburb с домиков и веев можно убирать, а оставить только в релейшене.