mosstreet будьте уважительны, не нужно завуалированных оскорблений. Ставлю вас на учёт.
freeexec,
топик стартеру нужны фиксированные названия. “вот такие, и не иначе”.
в общем случае они не выводятся из “наших” (текущих). потому что, у нас хаос и не повалидированных полно. и скрипт/робот надорвётся правильно транслировать.
sergey astakhov,
в общем случае это не short/normalized names. это отдельные сущности. даже не вписывайся за mcm, твоя послабка, это “первый шаг к алкоголизму”)))
тс,
пилите свою локальную базу! это просто.
я более того скажу, никто не защитит ваши данные от вандализма. и у вас в продакшен запросто выедет прикольная надпись, реклама, или мат)) вы не сможете спарсить перед выводом на свои табло все надписи на валидность/допустимость. понимаете?
вы собираетесь хранить свои лозунги/данцзыбао у бомжей на мусорке, а в день демон-страции схватить их, и идти с умным видом в костюмах и галстуках, неся разрисованные из баллончиков лица кандидатов с рожками и усами. с матом поверх умных слов.
крч. место хранения данных должно быть одно, и подконтрольное))
ps. никто не против, дело-дельное, стартапьтесь, осваиваете)) но, что сюда написали, это правильно сделали.
Не надо так мрачно.
Некоторые компании напрямую конвертируют в свои продукты названия объектов с OSM и от мата сильно не страдают.
Просто это требует постоянного контроля.
В госструктурах всё веселее. Выделены деньги, сделан и запущен проект, всё работает.
Проект закончен, денег больше не дают. Ведь проект выполнен.
А он начинает тухнуть - плитка расшатывается, асфальт крошится, названия на карте потихоньку вандалятся.
Есть ещё вариант защиты от вандалов - простенький скрипт на питоне, реализующий через osm api функционал аля список наблюдения на вики: берётся заранее заданный список id объектов (как вариант - все объекты из всех чейнжсетов заданного юзера), для каждого из них запрашивается история и проверяется, сделан ли последний коммит этим юзером. Если нет - значит, объект меняли после, и надо на него посмотреть глазами. Список таких объектов (а лучше http-ссылок на них) складывается в файл.
Подобный инструмент, по логике, должен быть полезен всем: и неравнодушным редакторам (чтобы вандализм в своих правках не только по воле случая обнаруживать), и тем, кто использует данные OSM в своих проектах и не хочет сюрпризов. А то как-то противоречиво: с одной стороны декларируется, что у нас свободные данные, пригодные даже для коммерческого использования, any tags you like и всё такое, а с другой - как только кто-то приходит со вполне конкретной задачей, которую надо решить, то ему наперебой советуют с общей базой OSM не связываться и всё держать в своей личной базе Вроде данные открытые есть, а никакую реальную задачу с их помощью не решить.
Мониторить данные какая-то странная затея, особенно с учётом того, что данные синхронизируются допустим раз в году. И именно в этот момент интересны изменения. И получение diff двух данных - одна команда.
Что же по поводу any tags you like, то это вовсе не значит, что можно в разные теги пихать разный мусор. Концепция подразумевает, что если какое-то свойство ещё ни как не обозначено, то всегда можно придумать не него новый. Но свойство это должно быть верифицируемо и понятно. Хочется указывать количество штакетника в заборе - да ради бога, размер ячейки в сетке рабицы - легко, марку асфальта - без проблем; всё это можно придти и проверить. Но не надо тащить сюда какие-то внутренние данные, что эту задвижку монтировал Вася проверить ни как нельзя и кроме данной конторы эти знания никому не нужны.
На самом деле наоборот: чтобы решать проблемы с помощью открытых данных именно их и надо использовать, а не заменять своими.
То есть задача сверки стандартных name/ref с требуемыми и даст нужное решение, а вот прямое использование своих тегов вместо стандартных ведёт именно к игнорированию открытых данных и хранению устаревших данных в ОСМ.
AnakinNN, вахтеры были, но они бессмыслены, не важно кто редактировал, важно чтобы данные оставались качественные, так что эффективнее писать валидаторы.
у того же CupIvan был парсер кучи различных сайтов от почты россии до торговых сетей, по этому валидатору было очень удобно вносить распарсенные данные сайтов в осм.
Я уху уедаю, дорогая редакция.
В мире до чертиков разных баз разной степени точности (не важно, картографические это базы или еще какие-то), чтобы в очередной раз “добыть список чего-то” надо парсить десяток-другой сайтов и баз, разбираться с проприетарными форматами и их особенностями, как-то это полуавтоматически мержить, писать адовые костыли с эвристиками и тому подобное. Порой посмотришь на все это и хочется уже отдать денежку за какой-то пусть коммерческий, пусть урезанный, но съедобный продукт из авторитетного источника, да такого даже за деньги зачастую не дают. А тут авторитетный источник сам приперся (впрочем, москвичам виднее, насколько он авторитетный), даже денег не просит, даже вроде бы на что-то там согласен - нет, мы его ссаной метелкой выметем, тут у нас своя песочница, а он если захочет - пусть свою песочницу делает, а совочки наши пусть не трогает. Ну уйдет человек. Потом бегать будете, чтобы нормальную базу получить, а поезд уйдет.
Матюки на карте, вандализм, реклама, несуществующие магазины и гигантские половые члены - а что в этом плохого настолько, что делать премодерацию? Чем быстрее это попадет на разные публичные сервисы, тем быстрее будет создано ишью и тем быстрее это будет пофикшено. Надо готовиться к окружающему миру, а не прятаться от него, а то бетонный пол в очередной раз сильно по голове ударить может. Вахтеров не напасетесь. От вахтеров наоборот, данные скорее страдают, что оперативно не обновляются или удаляются “недостойные” с точки зрения этих самых вахтеров (хороший пример - русская википедия, где нормальных статей нет, так как они или удалены, или отредактированы до 3х строк, зато без мата).
И в данном случае, это не редактирование под очередной рендер Васи Пупкина, вместо рендера тут скорее согласовывание/адаптирование под авторитетный источник. Есть конечно риск, что этот самый авторитетный источник забьет болт на свои обязанности, как написано выше, но от мертвых тканей любой организм сам избавляться умеет. В худшем случае, сообщество получит немного мертвых данных в базе (которую, между прочим, не хостит). Создавать же говермент-релейтед теги в других странах не считается чем-то плохим, кому надо - используют, кому не надо - не используют. Попарсите файлик планетки и узнаете много интересного (я тут в одной из тем пытался найти статистику по тегам, там много интересного нашел). Тег можно низложить до “аппрувнутый вариант” или даже “контрольная сумма”. Еще лучше - написать документ страниц на 50 о том, что слово “памятник” у памятников быть должно/не должно и сделать унификацию, чтобы потом в каждом втором рендерере не надо было проверять тип объекта, сравнивать его с десятком похожих тегов и искать кириллическое “памятник”, “постамент” и “скульптура” в разных кодировках. А чтобы в “конкретном рендерере” смотрелось хорошо, можно приделать шаблоны, которые эти самые “памятники” будут добавлять в рантайме, причем сделать эти шаблоны открытыми, чтобы все рендереры могли ими пользоваться. И обоим сторонам уяснить, что в не зависимости от того, что есть надпись “памятник” или нет, лучше хоть какой-то объект, чем вообще никакого.
Не, лично мне все равно, я далеко от мск обитаю, но прочитанное тут напоминает отрезание собственных яиц. И парсить кучу ресурсов мне тоже надоело.
А кто то от чего то отказывался?
ТС сама высказалась
Сообщество начало обсуждение. ТС пропала. Или думали, что с ходу все согласятся, что маловероятно т.к. ТС подразумевал обсуждение или не очень то и надо оказалось и ТС прекратила общение.
То что там, где то кто то заливает и на это смотрят сквозь пальцы это их проблема и их “зона ответственности”. У нас тут своя и мы стараемся придерживаться договорных правил мапинга.
И тут тоже https://www.openstreetmap.org/user/lena_emaya/history
Наверное случились более важные дела
Ну и нафига там полные дубли name и транскрипция на английский. По-моему кто-то не осилил постобработку и стал мапить под рендер.
http://www.openstreetmap.org/changeset/52386222 вот ещё интересная правка. номера веток внесли на станциях в ref. видимо и отношения не осилили
Привет!
Друзья, спасибо большое за ваши комментарии и мнения
За множество идей и предложений.
Хотелось бы вернуться к изначальному вопросу — по поводу внесения тегов alt_name:mcm и alt_name:mcm_en. Мы намереваемся в ближайшее время их задокументировать и продолжать использовать.
Полное дублирование информации в теге alt_name:mcm. Улицы у нас обозначаются абсолютно также как и у вас(либо я не заметил отличия). Транслитерацию, вместо тега alt_name:mcm_en, можно добавлять при помощи скриптовой программы (поговорите с вашими программистами) в момент экспорта данных.
Вам уже написали, про памятники и школы. Берется номер школы из ref (необходимо внести, где нету) и при экспорте также формировать строку вида "Школа № " + ref Памятники точно также "Памятник " + name
Чуть больше кода при экспорте - чище и меньше база ОСМ.
- Да, alt_name:* на то и alt, чтобы отличаться от name. Зачем вам точные дубли информации?
- alt_name:* вообще-то задумано для языковых вариантов (alt_name:ru, alt_name:be), а mcm ни разу не язык, лучше придумать другое имя для тега.
Анна, вносимая Вашей командой информация зачастую является дубликатами и не имеет какого-то смысла в отрыве от разработки Ваших карт. Почему Вы не хотите, как предлагалось с указанием инструментария, держать ее на Вашей стороне?
2dbf_
Потому что удобнее использовать общий ресурс, но под их рендер. ИМХО.
Возвращаемся к изначальному вопросу: намереваюсь в ближайшее время снести все ваши alt_name:mcm и alt_name:mcm_en в один клик
Не угроза, просто хочу сказать, что это может сделать любой из участников в любой момент (в том числе перед вашей выгрузкой) и врядли он получит осуждение от сообщества. Номера веток на станциях метро(!) от вашего редактора уже снесли. Надо таки сначала придумать как делать правильно, прежде чем делать
Как вам уже сказали, это плохой вариант, т.к. противоречит базовым принципам OSM.
Поэтому или вы прислушиваетесь к советам, или начнётся война правок, которая может закончится блокировкой.