Я уху уедаю, дорогая редакция.
В мире до чертиков разных баз разной степени точности (не важно, картографические это базы или еще какие-то), чтобы в очередной раз “добыть список чего-то” надо парсить десяток-другой сайтов и баз, разбираться с проприетарными форматами и их особенностями, как-то это полуавтоматически мержить, писать адовые костыли с эвристиками и тому подобное. Порой посмотришь на все это и хочется уже отдать денежку за какой-то пусть коммерческий, пусть урезанный, но съедобный продукт из авторитетного источника, да такого даже за деньги зачастую не дают. А тут авторитетный источник сам приперся (впрочем, москвичам виднее, насколько он авторитетный), даже денег не просит, даже вроде бы на что-то там согласен - нет, мы его ссаной метелкой выметем, тут у нас своя песочница, а он если захочет - пусть свою песочницу делает, а совочки наши пусть не трогает. Ну уйдет человек. Потом бегать будете, чтобы нормальную базу получить, а поезд уйдет.
Матюки на карте, вандализм, реклама, несуществующие магазины и гигантские половые члены - а что в этом плохого настолько, что делать премодерацию? Чем быстрее это попадет на разные публичные сервисы, тем быстрее будет создано ишью и тем быстрее это будет пофикшено. Надо готовиться к окружающему миру, а не прятаться от него, а то бетонный пол в очередной раз сильно по голове ударить может. Вахтеров не напасетесь. От вахтеров наоборот, данные скорее страдают, что оперативно не обновляются или удаляются “недостойные” с точки зрения этих самых вахтеров (хороший пример - русская википедия, где нормальных статей нет, так как они или удалены, или отредактированы до 3х строк, зато без мата).
И в данном случае, это не редактирование под очередной рендер Васи Пупкина, вместо рендера тут скорее согласовывание/адаптирование под авторитетный источник. Есть конечно риск, что этот самый авторитетный источник забьет болт на свои обязанности, как написано выше, но от мертвых тканей любой организм сам избавляться умеет. В худшем случае, сообщество получит немного мертвых данных в базе (которую, между прочим, не хостит). Создавать же говермент-релейтед теги в других странах не считается чем-то плохим, кому надо - используют, кому не надо - не используют. Попарсите файлик планетки и узнаете много интересного (я тут в одной из тем пытался найти статистику по тегам, там много интересного нашел). Тег можно низложить до “аппрувнутый вариант” или даже “контрольная сумма”. Еще лучше - написать документ страниц на 50 о том, что слово “памятник” у памятников быть должно/не должно и сделать унификацию, чтобы потом в каждом втором рендерере не надо было проверять тип объекта, сравнивать его с десятком похожих тегов и искать кириллическое “памятник”, “постамент” и “скульптура” в разных кодировках. А чтобы в “конкретном рендерере” смотрелось хорошо, можно приделать шаблоны, которые эти самые “памятники” будут добавлять в рантайме, причем сделать эти шаблоны открытыми, чтобы все рендереры могли ими пользоваться. И обоим сторонам уяснить, что в не зависимости от того, что есть надпись “памятник” или нет, лучше хоть какой-то объект, чем вообще никакого.
Не, лично мне все равно, я далеко от мск обитаю, но прочитанное тут напоминает отрезание собственных яиц. И парсить кучу ресурсов мне тоже надоело.