Щогодинна валідація

Так як зараз?

Фраза
MULTIPOLYGONS - 70 error(s) found at 07.08.2013 13:20:15.98
не означає, що перевірка не відбувалась після вказаного часу.
Перевірка відбувалась, але жодних змін не помічено: ні виправлень, ні нових помилок.

ALMOST.JUNCTIONS - 0 error(s) found

та й все

PS. Подивився XML - час дата є %), а от ні в Feedly, ні в інших RSS-агрегаторах часу не бачу

Додано Валідатор street/associatedStreet-зв’язків, що перевіряє чи співпадають name:-теги зв’язку і name:-теги ліній з роллю street, а також чи співпадають name зв’язку і addr:street(якщо задано) точок/ліній/звязків з роллю address або house.

А можна десь сорці глянути, що генерують geojson-и з помилками? Як взагалі побудована щогодинна валідація?

чудово, вже виправив у себе кілька помилок :slight_smile:

З часом опублікую.
Ось для прикладу запит, що шукає помилки street-звязків:


http://dl.dropboxusercontent.com/u/14107903/test/sql/osm.street.relations.sql
"c:\Program Files\PostgreSQL\9.2\bin\psql.exe" -A -t -U postgres -w -d osm -p 5432 -f osm.street.relations.sql -o street.relations.geojson

Наступний код завантажує pbf України годинної давності, він завантажується в базу даних PostgreSQL, потім запитами створюються geojson-файли, файли копіюються в мій DropBox, саме вони й відображаються на простій html-сторінці з Leaflet-картою.


if not exist UA.osm.pbf (wget.exe http://data.gis-lab.info/osm_dump/dump/latest/UA.osm.pbf)
rename ua.osm.pbf ua.0.pbf
osmupdate.exe UA.0.pbf ua.osm.pbf --hour -v -B=ua.poly --keep-tempfiles
if exist UA.osm.pbf del ua.0.pbf
if exist ua.0.pbf rename ua.0.pbf ua.osm.pbf

Попередньо потрібно скачати UA.poly і osmupdate

Код валідатора викладено на GitHub.
Результати валідації щогодини комітяться туди ж.
Всі веб-сторінки теж там.
На dropbox’і все існуватиме як і раніше, але з часом я це відключу.

Додано дуже простеньку “основну” сторінку:
http://pavlo-dudka.github.io/osm-pg-tests

Посилання на окремі сторінки валідатора також оновлено в першому повідомленні цієї теми.

Користуючись нагодою дякую andygol і ~Jhellico, які утримують кількість знайдених помилок близькою до нуля :slight_smile:

Не працює в Opera 12((

Дещо поправив. Схоже, що тепер працює.

Вчора додав можливість перегляду деяких помилок знайдених валідатором Zkir’a в рамках мого валідатора: http://pavlo-dudka.github.io/osm-pg-tests .
Робилося це тому, що на http://peirce.zkir.ru/qa дані по Україні розбиті на 5 частин, а тут все буде разом.

Дякую, у мене також все працює.

додано валідатор street/associatedStreet-зв’язків, що шукає навколишні об’єкти з ідентичним name/addr:street, що не включені в зв’язок

dudka, дякую. Було б добре, якби валідатор також повідомляв про ті вулиці, де зв’язок відсутній взагалі, але поруч є будинки з addr:street.

Зможу зробити і таку перевірку. Але давайте спочатку подивимося чи знайдуться бажаючі доповнити існуючі зв’язки іншими об’єктами. Хоча б у своїх містах.

dudka що значить інформація на сторінці street.relations.o?

http://pavlo-dudka.github.io/osm-pg-tests/test.html?street.relations.o
Це звязки, які принаймні двома точками належать вказаному в деталях місту, але при цьому хоча б двома точками знаходяться поза його межами.

Є кілька досить критичних помилок, наприклад http://www.openstreetmap.org/relation/2085011
Переважна більшість - лінія вулиці виходить на кілька сотень метрів за межі міста.

Не афішував, оскільки, можливо, серед знайдених звязків є й такі, що цілком коректні.

Чи правильно те, що проспект імені Газети Правда виходить у Ювілейне? чи існують у Ювілейному будинку, що адресуються по проспекту? якщо так - то мабуть варто розділити звязок на два. якщо ні - то може проспект закінчується раніше(в межах Дніпропетровська)?

Трохи підправив http://www.openstreetmap.org/changeset/20546610, так щоб проспект закінчувався в місті.

dudka велике спасибі вам за ваші валідатори! Вам не спадала на думку ідея валідатора дубльованих POI? Була б гарна штука. Чи таке вже є?

Є ось таке на keepright
Чи ви про щось інше? Які POI вважаєте дублікатами?

Якщо я не помиляюсь, то воно знаходить лише точки, що лежать внутрі полігонів з такими самими тегами. А я маю на увазі точки, що знаходяться близько одна до одної і мають при цьому однакові теги (amenity або shop наприклад)

Чи якийсь валідатор, із комусь відомих, перевіряє наявність некирилічних літер серед більшості кирилічних в значеннях тих тегів, що мають містити кирилічні літери, і навпаки?
Наприклад, наявність латинських літер “c, e, y, a, p, o, i, x, H” серед російсько-українських назв та наявність кирилиці мішаної із латиницею у значеннях тегів, ключі яких чекають тільки латиницю повністю вимикає пошук та призводить до неможливості візуально знайти помилку…