"Огни Москвы": собираем ОТК. Импорт по уличным столбам из data.mos.ru

Добрый день, коллеги!
При подготовке и сборе данных для обсуждающегося сейчас импорта https://wiki.openstreetmap.org/wiki/RU:Москва/Импорт_уличных_часов_Моссвет выяснилось, что в открытом доступе и с совместимой лицензией (на основании специального разрешения) существует набор данных по уличным столбам https://data.mos.ru/opendata/61762. Хотелось бы оценить его качество и пригодность для импорта.

Для оценки пригодности возможного импорта по указанной ссылке в статье об импорте часов дана схема сбора данных в PostGIS, куда выводятся также столбы OSM и столбы из открытых данных, см. в конце https://wiki.openstreetmap.org/wiki/RU:Москва/Импорт_уличных_часов_Моссвет#.D0.92.D1.8B.D1.87.D0.B8.D1.81.D0.BB.D0.B5.D0.BD.D0.B8.D0.B5_.D1.8D.D0.BA.D1.81.D0.BF.D0.BE.D1.80.D1.82.D0.B0. Выявлены некоторые погрешности с большим разбросом от 9 до 0,1 метров для тех мест, где есть OSM столбы.

Учтывая количество столбов ок. 520 тысяч объявляю сбор команды ОТК чтобы понять, может ли указанный набор данных принести пользу OSM. В этой теме предлагаю вести обмен мнениями о качестве данных и обсуждение скриптов обработки в PostGIS.

Столбы имели бы хоть какой-то смысл если бы их без проблем было видно на подложках. Поэтому пока у нас нет аэрофотоснимков это будет лежать в базе грузом (по большей части мешающим), ибо уточнить данные проблематично. В итоге как внесли их так они и останутся, даже большее скажу, часть наверняка удалят. И проще это держать нуждающимся отдельным датасетом у себя.

Столбы рисуются вместе с подземными кабелями на одной из основных подложек https://www.openstreetmap.org/#map=19/55.61056/37.68353&layers=H

Обычная точность GPS.

Если между точками из разных источников менее 10 метров, то это, вероятно, одна и та же точка.

Отфильтровать вероятные дубли можно так:
Взять точки столбов из ОСМ.

Построить вокруг них полигоны в виде круга радиусом 15 м. Удалить из импортируемого файла все точки внутри этих полигонов (типовые операции в любой серьёзной ГИС).

Примеч.: число 15 можно немного поменять опытным путём на иное.

Нужны ли столбы в ОСМ? Сами по себе вряд ли, а вот как вспомогательные данные для мапинга иных объектов могут быть полезны, так как задают обычно край проезжей части.

Мне не мешают (местами замаплены по снимкам высокого разрешения и GPS).

Спасибо. Не знал. Вместо https://postgis.net/docs/ST_Buffer.html с проверкой пересечения применял грубо

ST_Distance(st_transform(т1,4326)::geography, st_transform(т2,4326)) < 10.0

В Дюссельдорфе с Вами не согласны, ув. fndoder. Чем Москва хуже с точки зрения ГИС?

Что касается края проезжей части, то приглашаю Вас оценить реальные данные если PostGIS под рукой с полугигом дискового пространства. Именно для предметной оцнеки даны ссылки на скрипты с подробной документацией процесса закачки и подготовки данных. Вот только столбы соотносятся долговато, когда в ОСМ ок. 6 тысяч, а в экспорте ок. 520 тысяч. За 4 часа считается. Если у Вас есть предложения как сделать быстрее, то с удовольствием попробую.

Что-то долго 4 часа для 0.5 млн точек.
Пооптимизировать бы в PostGIS операцию.

Кроме того, попробовать проделать её же в QGIS или ArcGIS, возможно они изначально будут быстрее.

Попробовал строить кружочки на 5,8,10,15 и 20 метров. Каждое построение по 30 минут, нормально. Проверка точек на принадлежность кружочу из индексирвоанного поля значительно ускоряется.

Эх, fndoder… Я то думал, что уж Вы можете отличить платформу пространственных вычислений PostGIS https://ru.wikipedia.org/wiki/PostGIS от программных оболочек QGIS и ArcGIS.

QGIS больше нужен для создания и оформления картографических документов, для объединения в них разнородных источников, чем для вычислений пересечения, принадлежности и пр. В отношении крупных массивов данных QGIS как правило опирается на платформы простарнственных вычислений в БД: PostGIS, OracleSpatial, Spatialite и т. д.

ГИС вполне может и без СУБД работать, просто имея локальные файлы с данными. СУБД несёт с собой накладные расходы на многопользовательскую работу (и иные, вытекающие из требований ACID), поэтому ряд операций без СУБД можно сделать существенно быстрее.

Второй важный момент - открытое ПО, такое как PostGIS, конечно, хороший инструмент. Но в проприетарное ПО вложено на порядки больше ресурсов. Поэтому вполне может быть так, что PostGIS решает задачу за 4 часа, кручением ручек можно получить 1 час, а ArcGIS сделает всё за минуту с первого захода без доп. настроек.

я против импорта столбов. Эти данные никто поддерживать не будет. Как уже выше сказано, если вам они нужны, держите их у себя в дополнение к OSM.

В любом случае, нужная точность вряд ли будет обеспечена. Столбы, раскиданные по проезжей части и крышам домов - уж точно мусор.

Да, пробовал так в QGIS. Всё подписали и перевели, но всё равно маловато понятного, когда в ИТ прохожий. В QGIS дальше одноцветных контурных карт не пролез :(.

Да, в особенности вычисления точек на одной проекции могут замедляться. Если PostgreSQL не коллективный и запросы в 1-2 потока, то заметных накладных расходов нет.

Скорее всего именно так. Увы, мой случай плох тем, что нет ни денег на пропитиетарное ПО, ни квалификации чтобы в нём разобраться ни даже толковых консультантов. Поэтому и импорт столбов, и импорт часов оформляю как скрипт SQL PostGIS.

Конкретные образцы? Вычислили Overpass API building + data.mos.ru по ST_Containshttps://postgis.net/docs/ST_Contains.html ? Много такого?
Для выяснения таких вопросов как раз и открывалась тема.

Как минимум, станут возможны полуручные обновления из портала открытых данных по наложенным критерям качества. Жду предложений по их выработке, можно в виде процесса для PostGIS.

По опыту других тегов могу предположить, что постепенно подтянутся местные картографы как только увидят что столбы есть.

+1
Тоже против.

В Москве большой объём дорожного строительства, очень быстро импортированные столбы станут неактуальными (ошибочными то есть).

Если взять небольшой город, с небольшим объёмом дорожных строек, то там ещё можно было бы столбы поддерживать, при наличии нескольких местных интересующихся.

Но в Москве сейчас не вариант такое поддерживать.

Да не стоит льстить, ни в большом, ни тем более в маленьком, не будут поддерживать это. Есть куда более интересные объекты, которые не замаплены. Проблемы до сих пор есть в гигантскими конструкциями ЛЭП, которые 1 штука на десятки квадратных километров в округе, но и их не кто не мапит, нарисовали провода и на этом всё.
Если посмотреть Москву, то уличных столбов с историей изменений больше 5 можно сказать нет, за исключением небольшого парка (и ещё 3 столбов), да и те кто-то заимпортил, и то похоже очень плохо если их пришлось столько раз менять.

Я тоже против импорта столбов. 500+ тысяч объектов разом, которые невозможно провалидировать по спутниковому снимку, только ногами - это наповал.

Инженерная инфраструктура с детализацией такого уровня хорошо заходит в локальных ограниченных объёмах - например, в тех же парках, где один человек отрисовал его в деталях по аэрофото и может поддерживать в актуальном состоянии. В объёмах мегаполиса - без шансов. То же самое относится, например, к импорту в масштабах Москвы всех отдельных деревьев с указанием биологического вида, железнодорожных шпал, канализационных люков и т. д.

Беспредметное обсуждение.
Таки надо взять кусочек и попробовать.
Данные по Зеленограду есть?
1-й, 2-й, 3-й, 4-й микрорайоны к примеру.

Люди не боятся мапят большие города.
Киев, Черкасы, Ровно.

Черкасы

А как здорово фонарные столбы на F4map видны!
https://demo.f4map.com/#lat=50.4416381&lon=30.5113415&zoom=18

А вообще-то и специальный рендер про освещение есть.
http://osmstreetlight.bplaced.net/#15/50.4273/30.5162

я тогда пока навскидку попробую кавычки из названия автодорог снести. Возьму кусочек и попробую. Посмотрим, что выйдет

Согласен. Надо пробовать, нечего киснуть в заскорузлых рамках застаревших фобий.

Такие заявления, чтобы не быть голословными, должны быть основаны на оценке состояния набора данных в областях дорожного сироительства. И оценке обширности областей дорожного строительства по сравнению с другими городами. Именно для этого были опубликованы скрипты PostGIS чтобы каждый желающий мог их воспроизвести и дать свою оценку.

Я тоже, как и многие высказавшиеся, болею за качество данных в OSM, но не хочу, чтобы решение вопроса о лиензионно совместимом источнике данных по своей беспредметности выглядело как трусость. У нас ведь тема называется “Огни Москвы”: собираем ОТК, а не “Огни Москвы”: собираем мнения без оценки качества данных.

Вот это высказывание о результате работы автора http://moscowparks.narod.ru и нескольких моих уточняющих вылазок. Массовые измнения даже не были опознаны как уточняющие систему тегов :/, а не только расположение. Не знаю, право, можно ли считать “кто-то заимпортил” комплементом в случае сбора данных на местности…
А что касается небольшого парка, то общая площадь, где размечались фонари 693,4 га, включая 230 га испорченного псевдо-реконструкцией классического парка. Именно в этой части плотная сеть освещения. При конструктивном подходе ув. freeExec мог бы догадаться, что парк был пробным шаром для сравнения реально снятых данных с импортом data.mos.ru. Кстати, один коллега сейчас именно по этому парку пытается сделать какие-то выводы и я тоже пытаюсь проверить пару гипотез по сходимости данных через PstGIS.

Вот это уже продуктивно. Все бы так реагировали!
Данные есть. Относительно модели данных из https://github.com/mkgrgis/OSM_clock_mos/blob/main/PostGIS%20часы%20Москвы%20Моссвет.sql

select *
   from "Часы Москвы"."1 Столбы data.mos.ru" d
  where d."Округ" = 'Зеленоградский административный округ';

можно и по районам вписать список

select *
   from "Часы Москвы"."1 Столбы data.mos.ru" d
  where d."Район"  in ('', '')

От literan

Так тут, как минимум, описано нарушение проверяемого на местности offical_name. А что на местности с реально присутствующими столбами? Зачем мы тогда в этой теме проводим обсуждение?

действительно, аргументированные голоса “против” это непродуктивно.
а голос “за” без каких либо аргументов - это продуктивно!