Я посмотрел данные, есть пара проблем. Во-первых, смещение примерно на 10 метров в юго-западном направлении, но это не суть важно. Во-вторых, домики в частном секторе нарисованы почти от фонаря. То есть, примерно в том месте на снимках дом виден, но вот нарисованная форма не имеет ничего общего с действительностью. И я бы понял, если бы был просто нарисован прямоугольник, так нет же – старательно вырисованы углы и пристройки, которых не существует.
По итогу – частный сектор в Днепре прорисован сейчас довольно тщательно, поэтому адреску можно перенести на существующие домики. Все крупные здания, включая индустриальные зоны, нанесены хорошо, их можно копировать с геометрией.
Вот черновик конвертации, чтобы оценить. К использованию не готово: неверная кодировка, улицы в адресах не отделены от номеров домов, мусорные теги.
Тип здания - не обязательно, но желательно. А можно ли узнать, какие значения бывают у этого поля? Возможно, их удастся использовать для более точного задания тега building=*.
Количество этажей - не обязательно, но желательно. Указывается в теге building:levels=*
Город - не нужно. Для адресного поиска название города берётся с полигона населённого пункта, в котором расположен домик.
С першого заходу, можу сказати, що ось “так просто взяти і залити все в базу, нажаль, не вийде”.
Як сказав _sev всі будинки зі зміщенням, звісно в різних районах по різному. Ось на знімку можна отримати уявлення про те на скільки дані з шейпу зміщені порівняно з даними в ОСМ (зсув Бінгу з БД зміщень)
потрібно розібратись з кодуванням символів, воно не utf-8
треба брати невиликі ділянки і рухати їх так, щоб вони хоч трохи відповідали ОСМ
Там нічого розбиратися, я писав, що це чорнова конвертація. Я виправлю кодування.
Можливо цього вдасться уникнути. Дивіться нижче.
Ні, то занадто, у мене інший підхід.
Я розробив плагін для JOSM. У ньому відкриваєш дані імпорту у окремому шарі, а на основному задаєш кольорування будинків без номера дому. Далі, мишою клацаєш по таких будинках, і воно дивиться на геометрію з нижнього шару, яка знаходиться за цими ж координатами, і копіює звідти всі теґи.
Таким чином у напівручному режимі можна досить швидко обклацати цілі райони.
Получається, що зсувати райони потрібно або для нового імпорту, або коли будинки вже занадто сильно зсунуто, що вони не перекриваються.
M@ster_dp казав, що у нього є ще шейп з адресними точками. Може простіше перенести адреси з них?
_sev
Якщо точка попадає (знаходиться поруч) в полігон будинка без адреси → переносимо адресу на будівлю
Якщо поруч немає полігона будівлі - імпортуємо цю точку з теґами *building=yes + addr:**. Для Nominantim’а цього буде достатньо, а геометрію потім за допомогою building_tools можна намалювати.
Тим більше, що building_tools автоматично переносить адресу з точки на полігон. А точки можна більш точніше пересунути на потрібне місце. Для того щоб нічого не пропустити скористатись втулком Todo list
Я же выше написал, что порешал вопрос с кодировкой, и выложил исправленный дамп. Адреса бы тоже я разделил, не проблема, но оригинал как источник исправления, несомненно лучше.
Я смогу обработать только на выходных.
Думаю, нет, много работы, да и не нужна она будет в ряде случаев.
Теперь нужно понять, как действовать дальше. Мне видится, что-то типа такого:
Я делаю обработку данных, перевожу в конечный .osm с правильными тегами.
Кто-то в параллели рисует пирог, крупными кусками. Только не квадратами, а по границе дорог.
Я оформляю импорт по правилам, т.е. письмо в imports@, вики-страница, теги на объектах, недельная пауза для комментариев, рассказываю, что импорт в ручном режиме, пишу список участников.
Перекомпилирую плагин для переноса тегов под новый JOSM
Группа желающих, я в том числе, делаем импорт по кускам.
При этом, нам нужно делать примерно следующее:
Выбирается кусок.
Двигается по трекам.
Копируются здания, которых нет в ОСМ, с геометрией и тегами
Если здание в ОСМ есть, теги переносятся на него, при этом используется плагин JOSM
Не уверен, что делать сначала – пункт 3 или пункт 4.
Ещё я могу сделать пост-обработку для переноса всех адресов в отношения, как я это делал для предыдущих импортов. Но в связи с наличием частичной адресации в ОСМ, это можно будет сделать только после импорта, а не на этапе подготовки изначального дампа. Оставлять как есть, смешанно – отношения + теги, мне кажется не совсем правильно.
Глянул поверхностно на новые данные. Floors местами сильно неправильный, заметил, что для многих многоэтажкек прописано Floors=1. Думаю, что имеет смысл не добавлять Floors=1, а только если указано больше единицы.
Также местами названия улиц отличаются порядком, к примеру, “Заводська Набережна вулиця”, тогда как в ОСМ это “Заводська Набережна вулиця”. Английские названия нужно будет перегенерировать: “Malyi side street” для “Малий провулок”.
щодо building:levels=1 - навіть не знаю чи залишати чи відкидати його (в роздумах)
M@ster_dp - те що ви виклали посилання на shp тут на форумі - означає, що дані можуть вільно використовуватись спільнотою OSM? Як ви ставитесь до того, щоб імпортувати їх до http://openaddresses.io ?
M@ster_dp
на http://openaddresses.io/contribute/ є така формочка для завантаження. У мене по ній кілька питань: основне - Ліцензія (все інше не так важливо)? на яких умовах надаються дані? - ODBl/CC0/PD/WTFPL?; Чи потрібно на когось посилатись використовуючи ці дані?