Добро пожаловать на форум OSM Russia! (оффтоп здесь)

лыко да мочало, начинай сначала

вроде уж как пришли к консенсусу, что для таких целей и для тех, кому это реально нужно, должна быть транслитерация из name средствами приложения/рендера/etc., тк name:en - это для устоявшихся случаев вроде Moscow, Kremlin, а не для Zadrischchensk и Skver Vozrozhdeniya Dukhovnosti (слава небесам, меня freeExec вовремя остановил :D)

Ну так не я их пложу массово, а maxmeles. Я просто характеризую нынешнее состояние — name:en понатыкано по стране дофига, но пользоваться ими все равно нельзя. А снести — вроде как за вандализм сочтут. С тем, что их в большинстве своем создавать не нужно — полностью согласен.

Если человек ответит, что его сподвигло на массовое name:en — уже хорошо.

А у нас еще и name:ru по стране… :wink:

С name:ru вопрос особый. Тут проблема в том, что, пользуясь только данными базы OSM, невозможно определить, на каком именно языке внесен name. Нет ни тега языка на территории, ни еще чего-то подобного.

Ну как бэ границы всякие есть…
А потом, если язык name не известен, как же тогда его правильно траслитерировать автоматом на английский, как тут предлагается? :wink:

Полагаю, посимвольно :slight_smile:
ш->sh, ß → ss и т.д. вне зависимости от всего остального.

Ну и бред.
Е с русского E или YE, с украинского только E , ну и т.д…

channel - с английскгого чaнел, c франузского шанель, с немецкого ханель

Про то и речь, что это требует использования внешней (по отношению к базе OSM) информации — типа того, что все name на территории РФ считаем написанными на русском языке и применяем соответствующие правила транскрибирования.

С какого это, позвольте узнать, хрена - на английский-то?

Вообще, для каждого языка правила транслитерации свои. Знаете, как “товарищ” на слух пишут, например, норвежцы? “Tovaritj”.

Сколько раз уже говорили - к черту эту транслитерацию в базе.

Как перевести отношение type=site? Мне только приходит “группа” или “группа объектов” в голову.

Переводы английского понятия бесполезные на русском https://slovari.yandex.ru/site/%D0%BF%D0%B5%D1%80%D0%B5%D0%B2%D0%BE%D0%B4

https://www.transifex.com/ideditor/id-editor/translate/#ru/presets/73881147

Транслитерация нужна, вот только не в name:en. С одной стороны, это нужно делать вручную, чтобы получить вменяемые названия, с другой стороны есть невменяемые юзеры )))

Вы уверены? Именно транслитерация? С транскрипцией (которая фонетическая, а не побуквенная, как транслитерация) не путаете (судя по “нужно делать вручную” - путаете)?
И если нет, то вот как раз транслитерацию, по причине ее однозначности, всегда можно сделать на этапе обработки данных.

А еще, для одних только англоязычных, как целевой аудитории, существует пачка правил respelling-а (это что-то среднее между транслитерацией и транскрипцией) https://en.wikipedia.org/wiki/Pronunciation_respelling_for_English
Так что это все весьма сомнительные прожекты с непонятными целями.

Глядя на английскую вики, у них приведено только бытовое значение.
Я по работе сталкивался с технической стороной, которая подтверждается словарем яндекс, например

  • место (строительства)
  • место (где расположена буровая платформа со всей инфраструктурой)
  • место (раскопок)
  • место (прииск)

т.е. это некоторая ограниченная площадь/местность (полигон по-нашему), включающая в себя разные объекты и состоящая из них. В отличие от термина location, который подразумевает какое-то конкретное место (неважно полигон или точка) в смысле координат.

Но вот честно мне непонятно зачем они site превращают в collection. По идее рисуется ограничивающий полигон, так же как полигон place. ИМО логичнее было бы даже запулить place=site (ничем не хуже чем place=locality).

Транскрипция как раз нужна в национальных тегах.
При автоматической транслитерации первая же проблема всплывет в названиях, образованных от имен: Александровск - Aleksandrovsk или Alexandrovsk?
А как быть с названиями НП в Туве, на СевКаве и пр?

Без знания языка даже Гомель не транслитерируешь.

Поэтому если работать с name надо по-любому знать дефолтный язык местности, как минимум. Тогда и отпадает дурость с дубляжом в name:ru.

А с Гомелем же даже знания дефолтного языка оказывается может не хватить.

http://www.openstreetmap.org/way/235710976

j-wills, пока вы не определитесь и не перестанете путаться в терминах, с вами что-то обсуждать бессмысленно: транслитерация всегда однозначна, потому что это кодирование символов одного алфавита символами другого по фиксированному правилу (одному из выбранных стандартных для соответствующего языка), потому для транслитерации нет никакой “проблемы с названием Александровск”. Транслитерация всегда осуществляется простой заменой.
А транскрипция, действительно, куда сложнее, потому что она передает не написание, а звучание слова, то есть учитывает фонетику.

Спрашиваю еще раз: что из этих двух вещей вы хотели бы хранить в базе?

Есть проблема с выбором системы транслитерации (одной из стандартных для соответствующего языка).

Да, и именно об этом я говорил выше, приводя ссылки на описание разных схем в Википедии, а вот из сообщения j-wills совершенно не ясно, о чём он. Вот я и пытаюсь выяснить, чтобы спорить, по крайней мере, с понятным утверждением а не с винегретом из терминов.