Нормализация данных (пилотный проект — Спб и ЛО)

wowik · March 4, 2011, 10:00am

Где я писал ТОЛЬКО? Может анклав такой. Внутри landuse=residential, к примеру

wowik · March 4, 2011, 10:19am

Кстати о лесничествах.

Тут многие ставят на лесные участки местности landuse=forest , причем полянки и прочие дырки исправно исключают.
Но это же не правда! Полянка или болот в лесу ровно также управляется лесничеством, как и деревья.

Лично я за то, чтобы ~~поотрывать руки~~ вообще не использовать landuse=forest, по крайней мере так бездумно, просто для обрисовки леса.
Ведь надо правильно очертить административные границы landuse, а потом внутри них очертить лес, полянки, болото, воду.

Мапник конечно нарисует ужасно, но это дело поправимо.

dkiselev · March 4, 2011, 10:20am

Вот я в существовании таких анклавов очень сильно сомневаюсь, и проверил бы: анклав ли это или человек ошибся.

Придумывать формально корректные, но весьма странные примеры я тоже большой мастак.

glebius · March 4, 2011, 11:16am

Сейчас в 99% случае landuse=forest используется там, где человек рисует лес, а не землепользование.

Убивать полянки внутри landuse=forest сейчас ни в коем случае нельзя. Только если сначала конвертнуть все текущие landuse=forest в natural=wood. Потом донести до всех без исключения пользователей, что landuse - это землепользование, и только после этого использовать по полной программе правильную семантику этого тэга.

Сейчас нельзя, т.к. фактически синоним wood.

Oksion · March 4, 2011, 12:56pm

ИМХО, рисуют landuse=fores бездумно обводя именно лес, исключительно по причине кривого рендеринга таких территорий мапником. По идее-бы рендер landuse=forest и natural=wood поменять местами, или даже землепользование сделать ещё более тусклым, как всё остальное землепользование. Сейчас-же landuse=forest отрисовывается пышным зелёным лесом с ёлочками иль сосенками.

metadenisik · March 4, 2011, 1:12pm

А по-моему, корень путаницы состоит в том, что в джосм лэндюз=форест переведён на русский язык как лесопосадки.

Sergey_Astakhov · March 4, 2011, 1:21pm

Раньше там вообще было landuse=forest - “Лес”, natural=wood - “Лесистая местность”. Потом я предложил поменять на текущий вариант. Если у вас есть лучшие предложения - welcome в тему о русификации JOSM.

andriano · March 4, 2011, 5:22pm

Надо сказать, это далеко не самый худший вариант.
natural=wood - лес,
landuse=forest - искусственные лесопосадки.
Что здесь нелогичного?
И какая предлагается альтернатива?

andriano · March 4, 2011, 6:44pm

Обнаружил в Питере у многих building=yes наличие addr:street без addr:housenumber. Думаю, такую комбинацию тоже следует считать ошибкой.

liosha · March 4, 2011, 6:49pm

andriano, такое реально бывает: дом приписан улице, но без номера (б/н)

Sergey_Astakhov · March 4, 2011, 6:52pm

http://forum.openstreetmap.org/viewtopic.php?pid=146740#p146740

Можно пример?

andriano · March 4, 2011, 7:07pm

Можно пример из КЛАДРа?

liosha · March 4, 2011, 7:17pm

а откуда в кладре номера домов???

dkiselev · March 4, 2011, 8:14pm

Там есть диапазоны номеров, но их актуальность и аккуратность их заполнения – неизвестны.

fserges · March 4, 2011, 8:22pm

По Питеру есть уже адресный валидатор от liosh-а http://gis-lab.info/data/mp/addr/?base=rgis
Так что это проблема под контролем

Zverik · March 4, 2011, 8:24pm

я ставлю addr:street без housenumber, когда знаю, что дом прописан по улице, но в номере не уверен. Это не ошибка. Так же, как building:levels без building=* — не ошибка.

andriano · March 4, 2011, 8:46pm

С шестого уровня:

Пятый уровень классификации включает улицы городов, поселков городского типа и сельских населенных пунктов.
Шестой уровень классификации включает:

дома, расположенные в городах и поселках городского типа, являющихся объектами третьего уровня (т.е. регионального или районного подчинения), в т.ч. дома, непосредственно привязанные к городам и поселкам городского типа (в случаях, когда в адресе отсутствует наименование улицы).
Седьмой уровень классификации включает квартиры (офисы) домов.

liosha · March 5, 2011, 4:42am

andriano, ты сам кладр посмотри, а не его описание

fserges · March 8, 2011, 11:43am

Первые две итерации завершены. По нескольким регионам (Ленинградская, Московская, Новосибирская, Владимирская области, Краснодарский край) был составлен словарь тегов. 236 ключей и 927 значений довольно неплохо описывают реальность. Непонятными оказываются порядка 0.5% данных что для начала неплохо.

Хотел проверить - а как мой словарь работает на “буржуйских” данных. Но оказалось что их файлы .osm гораздо больше наших (даже файл Финляндии в 2 раза больше Москвы и Московской области) и вычислительные ресурсы оказались узким горлышком. Поэтому пришлось полностью переделать базу данных с точки зрения оптимизации. База данных из красивой и понятной превратилась в оптимизированную, в которой не особо то и разберёшься. Но в результате она стала меньше где-то на 30% да и скорость обработки выросла пропорционально. Для обработки стран средней величины уже должно хватить. Впрочем, для обработки крупных стран придётся делать ещё одну оптимизацию. Но там уже будет статистическая оптимизация, с преобразованием данных (идеология в духе алгоритма Хаффмана) и это уже будет перед промэксплуатацией, т.к. база будет что чёрт ногу сломит.

А сейчас работаю над сочетанием тегов. Задача полностью не разрешима в рамках идеологии OSM, но до некоторого практического уровня валидатор довести можно. Например, регулярно в данных находятся сочетания типа highway=* и building=yes и т.п.

Faier · March 8, 2011, 11:56am

Я в таких случаях ставлю “addr:housenumber=00” , очень удобно.
а) теги собраны правильно
б) наглядно на карте сразу видно что номер дома неизвестен (неточен) и проезжая мимо можно глянуть
в) опять же на карте видно, что это именно дом, а не скажем служебное здание или еще что-либо