А японский не пробовали в 1251 запихать? cp1251 не расчитана на польский язык. Что ж вы пытаетесь польские тексты в ней писать? Не получится.
Ну можно транскрипцию на белорусский манер. Будет хохма.
Ещё вариант - l’, аналогично итальянцы и испанцы пишут, когда нет своей раскладки. Но все варианты буквы z вы там точно не напишете, как вы отличите в z’ звуки Ж от З от ЗЬ?
Немного меняю своё предложение: тег name не содержит информации, на каком языке написан. Поэтому непонятно, по каким правилам его трактовать, то есть ударения в каноническом написании оставлять или нет. Потому что недостаточно смотреть, что это кирилица: может оказаться, в бурятском, монгольском или другом языке ударения используются и очень хитро, поэтому все их удалять нельзя.
Поэтому вариант такой: в name писать название в каноническом варианте, то есть в русском языке - без ударения, а в name:ru - с ним. При импорте должно быть правило, что из :ru надо ударение для канонического представления и индексации удалить. А name:yakut или тому подобные будут иметь своё правило.
siberiano, ни одного реального варианта ты не предложил.
Целевая система задана извне, и на неё влиять нельзя.
Транскрипция неуниверсальная, поэтому не годится.
l’ тоже не подходит, потому что получается разделительный символ в середине слова, где его быть не должно.
Что за манера - устанавливать НОВЫЕ правила для СТАРЫХ тегов.
Наверное, надо решить раз и навсегда - все новшества исключительно в новых тагах: хочешь транскрипцию - придумай для нее новый тег и продвигай его, а не вноси искажения в уже существующий.
Совершенно верно. База данных ОСМ - первична, и ее растаскивают себе разные конвертеры для собственных нужд. Если целевая система имеет ограничения - пусть она подгоняет данные под себя. Ни в коем случае не надо ограничивать ОСМ.
Для cp-1251 предложено абсолютное верное решение - транскрипция.
Добавлю про ударения, чтобы два раза не вставать. Речь не идет о том, чтобы везде ставить ударения. В подавляющем большинстве случаев это не нужно, но есть и исключения.