вроде уж как пришли к консенсусу, что для таких целей и для тех, кому это реально нужно, должна быть транслитерация из name средствами приложения/рендера/etc., тк name:en - это для устоявшихся случаев вроде Moscow, Kremlin, а не для Zadrischchensk и Skver Vozrozhdeniya Dukhovnosti (слава небесам, меня freeExec вовремя остановил :D)
Ну так не я их пложу массово, а maxmeles. Я просто характеризую нынешнее состояние — name:en понатыкано по стране дофига, но пользоваться ими все равно нельзя. А снести — вроде как за вандализм сочтут. С тем, что их в большинстве своем создавать не нужно — полностью согласен.
Если человек ответит, что его сподвигло на массовое name:en — уже хорошо.
С name:ru вопрос особый. Тут проблема в том, что, пользуясь только данными базы OSM, невозможно определить, на каком именно языке внесен name. Нет ни тега языка на территории, ни еще чего-то подобного.
Ну как бэ границы всякие есть…
А потом, если язык name не известен, как же тогда его правильно траслитерировать автоматом на английский, как тут предлагается?
Про то и речь, что это требует использования внешней (по отношению к базе OSM) информации — типа того, что все name на территории РФ считаем написанными на русском языке и применяем соответствующие правила транскрибирования.
Транслитерация нужна, вот только не в name:en. С одной стороны, это нужно делать вручную, чтобы получить вменяемые названия, с другой стороны есть невменяемые юзеры )))
Вы уверены? Именно транслитерация? С транскрипцией (которая фонетическая, а не побуквенная, как транслитерация) не путаете (судя по “нужно делать вручную” - путаете)?
И если нет, то вот как раз транслитерацию, по причине ее однозначности, всегда можно сделать на этапе обработки данных.
А еще, для одних только англоязычных, как целевой аудитории, существует пачка правил respelling-а (это что-то среднее между транслитерацией и транскрипцией) https://en.wikipedia.org/wiki/Pronunciation_respelling_for_English
Так что это все весьма сомнительные прожекты с непонятными целями.
Глядя на английскую вики, у них приведено только бытовое значение.
Я по работе сталкивался с технической стороной, которая подтверждается словарем яндекс, например
место (строительства)
место (где расположена буровая платформа со всей инфраструктурой)
место (раскопок)
место (прииск)
т.е. это некоторая ограниченная площадь/местность (полигон по-нашему), включающая в себя разные объекты и состоящая из них. В отличие от термина location, который подразумевает какое-то конкретное место (неважно полигон или точка) в смысле координат.
Но вот честно мне непонятно зачем они site превращают в collection. По идее рисуется ограничивающий полигон, так же как полигон place. ИМО логичнее было бы даже запулить place=site (ничем не хуже чем place=locality).
Транскрипция как раз нужна в национальных тегах.
При автоматической транслитерации первая же проблема всплывет в названиях, образованных от имен: Александровск - Aleksandrovsk или Alexandrovsk?
А как быть с названиями НП в Туве, на СевКаве и пр?
j-wills, пока вы не определитесь и не перестанете путаться в терминах, с вами что-то обсуждать бессмысленно: транслитерация всегда однозначна, потому что это кодирование символов одного алфавита символами другого по фиксированному правилу (одному из выбранных стандартных для соответствующего языка), потому для транслитерации нет никакой “проблемы с названием Александровск”. Транслитерация всегда осуществляется простой заменой.
А транскрипция, действительно, куда сложнее, потому что она передает не написание, а звучание слова, то есть учитывает фонетику.
Спрашиваю еще раз: что из этих двух вещей вы хотели бы хранить в базе?
Да, и именно об этом я говорил выше, приводя ссылки на описание разных схем в Википедии, а вот из сообщения j-wills совершенно не ясно, о чём он. Вот я и пытаюсь выяснить, чтобы спорить, по крайней мере, с понятным утверждением а не с винегретом из терминов.