Их 20 тысяч только потому, что «вовик» ботом по своему валидатору разом по стране проставляет этот этот тег, попутно удаляя теги place и дублируя статусные части в name и т.д. Без этого «исправлятора» никто это не использует. Пока не поздно, это ещё можно исправить.
Что значит «кто установил»? Установил какой нибудь совет народных депутатов 40 лет назад. И что значит переводить в постобработке? Давайте теперь все name:en удалять и переводить по большому русско-английскому словарю дословно в постобработке. Статусная часть есть у любого объекта и она всегда только официальная и она может иметь перевод на другие языки или транскрипции и не всегда обязана совпадать по словарю.
Формат такой придумал не wowik, и почти все эти теги были там и до создания его валидатора. В конце концов все претензии сводятся к некрасивому или нелогичному названию тега, против самого принципа вынесения типа населенного пункта в отдельный тег возражений нет. Так это не первый и не последний тег со странным именем.
А почти все name:en действительно неплохо бы удалить, потому как они в большинстве своем получены тупой транслитерацией, даже не транскрипцией. Но это уже другой вопрос, который обсуждался в другом месте.
Вопрос не в вынесении статусной части в отдельный тег, а в придумывании не человеко-читаемого значения для тегов типа тег=«ru:город;ru:городской округ;ru:муниципальное образование;en:city;ja:都市»
Пускай оно будет хоть oficial_status=, oficial_status:ru=, но только в значениях должно быть именно то, что является официальным статусом, если это «деревня», то должно быть именно «тег[:locale]=деревня», если несколько статусных частей, то перечислением, так, как это сейчас общепринято в ОСМ, т.е. сами значения через «;»: «тег[:locale]=город; городской округ»
Если все-таки прочитать описание, то видно, что никаких “;” там не предполагается, а запись «official_status=ru:город» - это фактически соединение 2 сущностей, а не locale, т.е. в каком-то смысле:
dair, у одной границы могут быть несколько статусных частей, как минимум могут (хотя не всегда и не обязаны) совпадать границы объектов «городской округ» и «МО город».
official_status:authority — это вообще не понятно зачем, давайте тогда name:authority= вводить
А мне не нравится помимо всего прочего и широта понятия.
Историческое поселение вполне себе официальный статус и он присваиватся госорганами РФ, т.е. official_status=ru:историческое_поселение вполне себе вкладывается в предложенную схему … и ещё более запутывает. А вот official_prefix=историческое_поселение ну никак не напишешь.
А вот такого я бы не делал. Гораздо лучше сделать 2 объекта, каждый со своим набором тегов, но одинаковой геометрией (хоть отношениями, хоть дублированием полигона). Еще можно смириться, когда линейный контур забора объединяют с площадным объектом внутри, но соединять 2 совершенно разных площадных объекта как-то некультурно…
Ну это не реальный тег, а мое толкование сущностей. Зачем оно вообще, да, не очень понятно, тем более, что кто именно это ru, до конца неясно, а статусы в отличие от названий меняются местными законами, а не одним большим ru.
Ещё одна не документированная сущность, а вполне конкретно отвергнутая. Такое впечатление что вовик задался целью мигрировать осм на недописанные драфты и отвергнутые пропозалы.
Я тоже не сторонник перечислений, и даже не поддерживаю их принципиально ни в конверторе ни в базе ни в рендере, но уж если на то пошло, то, перечисления — это достаточно распространнённая практика в ОСМ и парсить (или вообще не парсить, а считать отдельной сущьностью) перечисления всё таки логичнее чем парсить машинно-ориентированные значения тегов типа «какой_то_код:значение». А использование «тег:ru» и вообще «тег[:интерпритация]» на примере name + name:ru + name:en + name:что-то-ещё — уже основополагающая практика в ОСМ и она уже благополучно работает. Нет никаких оснований добавлять ещё логику постобработки тегов. Что бы получить отображаемое название объекта «деревня Кукуево» логично брать информацию для русского языка из «status:ru» + «name:ru», а не искать вначале тег с именем и постфиксом в названии тега «:ru», а потом рыться в значении одного тега ища там среди массы прочих вариантов одну возможную подстроку с префиксом «ru:» Это не только не логично, но и ещё больше запутает всех
Если почитать эту тему на несколько страниц раньше, то станет ясно, что про язык тут речи не идет вообще. Просто так уж нам не повезло (или повезло), что, в отличие, например от Украины, у нас страна и язык имеют одинаково выглядящий код ru.
Но неатомарность и неоднородность значения тега удручает, тут сложно не согласиться.
Поляки используют name:prefix для разграничения какая граница описывает город, а какая городской повет и т.п.
Очень схожее использование.
Для чего нужен official_status (или как хотите этот префикс назовите):
Иметь возможность получить полное имя там, где его сократили, выкинув слова “город”, “деревня”, …
Например напечатать на конверте: г. Киров
Иметь возможность разрешать неоднозначности, д. Лунёво и п. Лунёво разные вещи. Это и для построения адреса важно и для сопоставления с классификаторами.
Иметь возможность учитывать особенности обработки разных похожих объектов. К примеру муниципальные районы и городские округа внутри устроены поразному.