З часом опублікую.
Ось для прикладу запит, що шукає помилки street-звязків:
http://dl.dropboxusercontent.com/u/14107903/test/sql/osm.street.relations.sql
"c:\Program Files\PostgreSQL\9.2\bin\psql.exe" -A -t -U postgres -w -d osm -p 5432 -f osm.street.relations.sql -o street.relations.geojson
Наступний код завантажує pbf України годинної давності, він завантажується в базу даних PostgreSQL, потім запитами створюються geojson-файли, файли копіюються в мій DropBox, саме вони й відображаються на простій html-сторінці з Leaflet-картою.
if not exist UA.osm.pbf (wget.exe http://data.gis-lab.info/osm_dump/dump/latest/UA.osm.pbf)
rename ua.osm.pbf ua.0.pbf
osmupdate.exe UA.0.pbf ua.osm.pbf --hour -v -B=ua.poly --keep-tempfiles
if exist UA.osm.pbf del ua.0.pbf
if exist ua.0.pbf rename ua.0.pbf ua.osm.pbf
Код валідатора викладено на GitHub.
Результати валідації щогодини комітяться туди ж.
Всі веб-сторінки теж там.
На dropbox’і все існуватиме як і раніше, але з часом я це відключу.
Зможу зробити і таку перевірку. Але давайте спочатку подивимося чи знайдуться бажаючі доповнити існуючі зв’язки іншими об’єктами. Хоча б у своїх містах.
Не афішував, оскільки, можливо, серед знайдених звязків є й такі, що цілком коректні.
Чи правильно те, що проспект імені Газети Правда виходить у Ювілейне? чи існують у Ювілейному будинку, що адресуються по проспекту? якщо так - то мабуть варто розділити звязок на два. якщо ні - то може проспект закінчується раніше(в межах Дніпропетровська)?
Якщо я не помиляюсь, то воно знаходить лише точки, що лежать внутрі полігонів з такими самими тегами. А я маю на увазі точки, що знаходяться близько одна до одної і мають при цьому однакові теги (amenity або shop наприклад)
Чи якийсь валідатор, із комусь відомих, перевіряє наявність некирилічних літер серед більшості кирилічних в значеннях тих тегів, що мають містити кирилічні літери, і навпаки?
Наприклад, наявність латинських літер “c, e, y, a, p, o, i, x, H” серед російсько-українських назв та наявність кирилиці мішаної із латиницею у значеннях тегів, ключі яких чекають тільки латиницю повністю вимикає пошук та призводить до неможливості візуально знайти помилку…