Мэппинг OSM для московской городской навигации

Понимание возможно, если разговор начать…
Вы все такие замечательные вот вам мешок мышек … и т.д.
А Literanu два мешка) после его проходов по кварталам все от POI цветным становится. :smiley:

Вы уж не очень уважаемые (не касается вас лично) московские чинуши, берите как есть. Иначе очень удобно придти на готовое, потыкать пальцем тут трава не того цвета, и потом везде в очередной раз пропеть оду… А ваши схемы в нынешнем виде, так себе, большие блеклые и с радиусом в сто метров, толку от них…

В любых схемах, есть место где все значки подробно описываются, исходя из этого Пушкин А.С. всеми точно будет опознан как памятник, а не музей.

mosstreet будьте уважительны, не нужно завуалированных оскорблений. Ставлю вас на учёт.

freeexec,
топик стартеру нужны фиксированные названия. “вот такие, и не иначе”.
в общем случае они не выводятся из “наших” (текущих). потому что, у нас хаос и не повалидированных полно. и скрипт/робот надорвётся правильно транслировать.

sergey astakhov,
в общем случае это не short/normalized names. это отдельные сущности. даже не вписывайся за mcm, твоя послабка, это “первый шаг к алкоголизму”)))

тс,
пилите свою локальную базу! это просто.
я более того скажу, никто не защитит ваши данные от вандализма. и у вас в продакшен запросто выедет прикольная надпись, реклама, или мат)) вы не сможете спарсить перед выводом на свои табло все надписи на валидность/допустимость. понимаете?

вы собираетесь хранить свои лозунги/данцзыбао у бомжей на мусорке, а в день демон-страции схватить их, и идти с умным видом в костюмах и галстуках, неся разрисованные из баллончиков лица кандидатов с рожками и усами. с матом поверх умных слов.

крч. место хранения данных должно быть одно, и подконтрольное))

ps. никто не против, дело-дельное, стартапьтесь, осваиваете)) но, что сюда написали, это правильно сделали.

Не надо так мрачно.
Некоторые компании напрямую конвертируют в свои продукты названия объектов с OSM и от мата сильно не страдают.
Просто это требует постоянного контроля.
В госструктурах всё веселее. Выделены деньги, сделан и запущен проект, всё работает.
Проект закончен, денег больше не дают. Ведь проект выполнен.
А он начинает тухнуть - плитка расшатывается, асфальт крошится, названия на карте потихоньку вандалятся.

Есть ещё вариант защиты от вандалов - простенький скрипт на питоне, реализующий через osm api функционал аля список наблюдения на вики: берётся заранее заданный список id объектов (как вариант - все объекты из всех чейнжсетов заданного юзера), для каждого из них запрашивается история и проверяется, сделан ли последний коммит этим юзером. Если нет - значит, объект меняли после, и надо на него посмотреть глазами. Список таких объектов (а лучше http-ссылок на них) складывается в файл.

Подобный инструмент, по логике, должен быть полезен всем: и неравнодушным редакторам (чтобы вандализм в своих правках не только по воле случая обнаруживать), и тем, кто использует данные OSM в своих проектах и не хочет сюрпризов. А то как-то противоречиво: с одной стороны декларируется, что у нас свободные данные, пригодные даже для коммерческого использования, any tags you like и всё такое, а с другой - как только кто-то приходит со вполне конкретной задачей, которую надо решить, то ему наперебой советуют с общей базой OSM не связываться и всё держать в своей личной базе :frowning: Вроде данные открытые есть, а никакую реальную задачу с их помощью не решить.

Мониторить данные какая-то странная затея, особенно с учётом того, что данные синхронизируются допустим раз в году. И именно в этот момент интересны изменения. И получение diff двух данных - одна команда.
Что же по поводу any tags you like, то это вовсе не значит, что можно в разные теги пихать разный мусор. Концепция подразумевает, что если какое-то свойство ещё ни как не обозначено, то всегда можно придумать не него новый. Но свойство это должно быть верифицируемо и понятно. Хочется указывать количество штакетника в заборе - да ради бога, размер ячейки в сетке рабицы - легко, марку асфальта - без проблем; всё это можно придти и проверить. Но не надо тащить сюда какие-то внутренние данные, что эту задвижку монтировал Вася проверить ни как нельзя и кроме данной конторы эти знания никому не нужны.

На самом деле наоборот: чтобы решать проблемы с помощью открытых данных именно их и надо использовать, а не заменять своими.

То есть задача сверки стандартных name/ref с требуемыми и даст нужное решение, а вот прямое использование своих тегов вместо стандартных ведёт именно к игнорированию открытых данных и хранению устаревших данных в ОСМ.

AnakinNN, вахтеры были, но они бессмыслены, не важно кто редактировал, важно чтобы данные оставались качественные, так что эффективнее писать валидаторы.

у того же CupIvan был парсер кучи различных сайтов от почты россии до торговых сетей, по этому валидатору было очень удобно вносить распарсенные данные сайтов в осм.

Я уху уедаю, дорогая редакция.

В мире до чертиков разных баз разной степени точности (не важно, картографические это базы или еще какие-то), чтобы в очередной раз “добыть список чего-то” надо парсить десяток-другой сайтов и баз, разбираться с проприетарными форматами и их особенностями, как-то это полуавтоматически мержить, писать адовые костыли с эвристиками и тому подобное. Порой посмотришь на все это и хочется уже отдать денежку за какой-то пусть коммерческий, пусть урезанный, но съедобный продукт из авторитетного источника, да такого даже за деньги зачастую не дают. А тут авторитетный источник сам приперся (впрочем, москвичам виднее, насколько он авторитетный), даже денег не просит, даже вроде бы на что-то там согласен - нет, мы его ссаной метелкой выметем, тут у нас своя песочница, а он если захочет - пусть свою песочницу делает, а совочки наши пусть не трогает. Ну уйдет человек. Потом бегать будете, чтобы нормальную базу получить, а поезд уйдет.

Матюки на карте, вандализм, реклама, несуществующие магазины и гигантские половые члены - а что в этом плохого настолько, что делать премодерацию? Чем быстрее это попадет на разные публичные сервисы, тем быстрее будет создано ишью и тем быстрее это будет пофикшено. Надо готовиться к окружающему миру, а не прятаться от него, а то бетонный пол в очередной раз сильно по голове ударить может. Вахтеров не напасетесь. От вахтеров наоборот, данные скорее страдают, что оперативно не обновляются или удаляются “недостойные” с точки зрения этих самых вахтеров (хороший пример - русская википедия, где нормальных статей нет, так как они или удалены, или отредактированы до 3х строк, зато без мата).

И в данном случае, это не редактирование под очередной рендер Васи Пупкина, вместо рендера тут скорее согласовывание/адаптирование под авторитетный источник. Есть конечно риск, что этот самый авторитетный источник забьет болт на свои обязанности, как написано выше, но от мертвых тканей любой организм сам избавляться умеет. В худшем случае, сообщество получит немного мертвых данных в базе (которую, между прочим, не хостит). Создавать же говермент-релейтед теги в других странах не считается чем-то плохим, кому надо - используют, кому не надо - не используют. Попарсите файлик планетки и узнаете много интересного (я тут в одной из тем пытался найти статистику по тегам, там много интересного нашел). Тег можно низложить до “аппрувнутый вариант” или даже “контрольная сумма”. Еще лучше - написать документ страниц на 50 о том, что слово “памятник” у памятников быть должно/не должно и сделать унификацию, чтобы потом в каждом втором рендерере не надо было проверять тип объекта, сравнивать его с десятком похожих тегов и искать кириллическое “памятник”, “постамент” и “скульптура” в разных кодировках. А чтобы в “конкретном рендерере” смотрелось хорошо, можно приделать шаблоны, которые эти самые “памятники” будут добавлять в рантайме, причем сделать эти шаблоны открытыми, чтобы все рендереры могли ими пользоваться. И обоим сторонам уяснить, что в не зависимости от того, что есть надпись “памятник” или нет, лучше хоть какой-то объект, чем вообще никакого.

Не, лично мне все равно, я далеко от мск обитаю, но прочитанное тут напоминает отрезание собственных яиц. И парсить кучу ресурсов мне тоже надоело.

А кто то от чего то отказывался?
ТС сама высказалась

Сообщество начало обсуждение. ТС пропала. Или думали, что с ходу все согласятся, что маловероятно т.к. ТС подразумевал обсуждение или не очень то и надо оказалось и ТС прекратила общение.
То что там, где то кто то заливает и на это смотрят сквозь пальцы это их проблема и их “зона ответственности”. У нас тут своя и мы стараемся придерживаться договорных правил мапинга.

И тут тоже https://www.openstreetmap.org/user/lena_emaya/history
Наверное случились более важные дела

Они не пропали, а перешли от слов к делу: http://overpass-turbo.eu/s/rZy

Ну и нафига там полные дубли name и транскрипция на английский. По-моему кто-то не осилил постобработку и стал мапить под рендер.

http://www.openstreetmap.org/changeset/52386222 вот ещё интересная правка. номера веток внесли на станциях в ref. видимо и отношения не осилили

Привет!

Друзья, спасибо большое за ваши комментарии и мнения :slight_smile:
За множество идей и предложений.

Хотелось бы вернуться к изначальному вопросу — по поводу внесения тегов alt_name:mcm и alt_name:mcm_en. Мы намереваемся в ближайшее время их задокументировать и продолжать использовать.

Полное дублирование информации в теге alt_name:mcm. Улицы у нас обозначаются абсолютно также как и у вас(либо я не заметил отличия). Транслитерацию, вместо тега alt_name:mcm_en, можно добавлять при помощи скриптовой программы (поговорите с вашими программистами) в момент экспорта данных.

Вам уже написали, про памятники и школы. Берется номер школы из ref (необходимо внести, где нету) и при экспорте также формировать строку вида "Школа № " + ref Памятники точно также "Памятник " + name

Чуть больше кода при экспорте - чище и меньше база ОСМ.

  1. Да, alt_name:* на то и alt, чтобы отличаться от name. Зачем вам точные дубли информации?
  2. alt_name:* вообще-то задумано для языковых вариантов (alt_name:ru, alt_name:be), а mcm ни разу не язык, лучше придумать другое имя для тега.

Анна, вносимая Вашей командой информация зачастую является дубликатами и не имеет какого-то смысла в отрыве от разработки Ваших карт. Почему Вы не хотите, как предлагалось с указанием инструментария, держать ее на Вашей стороне?

2dbf_
Потому что удобнее использовать общий ресурс, но под их рендер. ИМХО.

Возвращаемся к изначальному вопросу: намереваюсь в ближайшее время снести все ваши alt_name:mcm и alt_name:mcm_en в один клик :slight_smile:

Не угроза, просто хочу сказать, что это может сделать любой из участников в любой момент (в том числе перед вашей выгрузкой) и врядли он получит осуждение от сообщества. Номера веток на станциях метро(!) от вашего редактора уже снесли. Надо таки сначала придумать как делать правильно, прежде чем делать :slight_smile: