Причём тут троллинг? Просто доведение вашей логики до логичного результата. Если не нравится результат - значит с исходными посылками наверное что-то не в порядке?
Собсно почти все были согласны, что ударениям в name не место. Кроме вас и wildMan.
Ударения в названиях ставить не надо, кроме случаев, когда ударение есть на местности (таких случаев пока не обнаружено, но могут появиться);
Существуют символы юникода, которые не помещаются в однобайтовые кодировки, их все равно надо использовать, если они есть на местности;
Надо уметь различать символы, даже если они стилизованы сердечками/человечиками. И писать в теги эти символы, невзирая на то, что юникод позволяет писать сердечками и человечиками, а также смайликами.
P.S. А ударения на указателях были бы весьма кстати там, где возможна неоднозначность, я согласен с В. Т. Чумаковым, и надеюсь увидеть их в будущем. Букву Ё же вернули!
Так вот, ударение - значок, не входящий в набор символов.
Нужно вспомнить, ради чего вводился юникод - для того, чтобы в рамках единой кодовой страницы обеспечить потребности РАЗНЫХ языков. А отнюдь не для того, чтобы вводить набор экзотических символов.
Отсюда вывод: там, где речь идет о русскоязычных названиях, т.е. тегах name на территории РФ и тегах name:ru, вполне естественно ограничить ТОЛЬКО символами, входящими в cp1251. (ну, разумеется, остается открытым вопрос о названиях в этнических автономиях)
Применять же в названиях “левые” символы, не входящие в cp1251 только потому, что формально они содержатся в юникоде, IMHO абсурд.
Так мы дойдем до использования в тегах исполняемого кода.
“Карта все таки не учебник языка”, - поэтому ударениям на карте не место.
Если же у кого-то есть какие-то уникальные запросы к OSM (а идея OSM этому совершенно не противоречит), то это как раз повод ввести новые уникальные теги. Например, содержащие ударение.
Сердечко тоже входит в юникод: символ номер 2665.
Так чем он хуже значка ударения?
Это следствие.
А, собственно, почему?
Она содержит все символы, используемые в русской типографике для обычного текста.
Кстати, нельзя ли поподробнее развернуть тезис об “устаревании”: что же так радикально изменилось в русском языке за два десятка лет, что cp1251 успела устареть?
А чем она лучше KOI8-R? Или CP866? Я против любых кодировок. Просто перечислите все допустимые знаки. Или давайте оставим все как есть. Уповая на общую разумность, добрую волю и способность договариваться по конкретным проблемам.
Контроль входных данных в любом случае остается на авторах разных программ, и от этого никуда не деться.
Таки да. cp1251 реально устарела. Присутствующие на рынке ОС используют как основную юникодовскую кодировку. А cp1251 используется только для совместимости со старыми прогами.
Конечно находятся ещё пользователи которые использует cp1251 как основную. Но мне кажется они не вкурсе о других
Давайте не будем уводить разговор в сторону.
Речь не об использовании кодировки 1251 в тех или иных программных продуктах, а о том, является ли используемый в ней набор символов устаревшим.
Речь ведь ни о том, какую следует использовать кодировку в том или ином случае, а о том, какой набор символов допустим в русскоязычных названиях.
Если кто-то придерживается мнения об устаревании набора символов, представленного в 1251, пусть приведет ссылки на реформы русского языка, которые сделали этот набор устаревшим.
Переход от 1251 к юникоду это не замена старого набора новым. Это существенное расширение возможностей старого набора. Причём всё железо его уже поддерживает. Остались только старенькие программы которые в момент создания ничего про юникод не знали.
Не вижу надобности в ограничении доступного пространства символов какими то рамками.
Жалкий лепет по поводу, невозможности найти чего либо, каким то конкретным поисковиком, в корне не верно. Так как это беда ентого поисковика. А подстраиваться под какой то обобщённый поисковик не хочется. Нарушается принцип “не пишем под рендер”.
И какое это имеет отношение к обсуждению набора символов допустимых в именах?
Если кто-то чего-то не видит, это совершенно не значит что его нет.
Проблема не в одном (или нескольких) несовершенных поисковиках.
Проблема в том, что такой “совершенный” поисковик в настоящее время сделать принципиально невозможно. Именно потому, что отсутствует стандарт, по которому можно было бы отличать символы, которые следует пропускать при формировании поискового запроса от символов, которые следует оставлять.
Именно поэтому невозможно приведение названия, состоящего из произвольных символов, к виду пригодному для поиска/сортировки. А стало быть, такое ограничение должно быть сделано на более раннем этапе - на этапе подготовки данных. В данном случае это ограничение и приводит к необходимости ограничить набор символов допустимых в именах. Это не чья-то прихоть, это объективная необходимость связанная с состоянием сегодняшних стандартов.
И, кстати, по факту этого ограничения ВЕЗДЕ придерживаются, не смотря на то, какая используется кодировка. Просто потому, что иначе ничего хорошего получиться не может в принципе. Даже если кто-то задумает проект без каких-либо ограничений, все равно в процессе его реализации он неизбежно столкнется с проблемами и будет вынужден ввести эти ограничения.
Если кто то не может сделать то не надо из этого делать вывод о принципиальности.
Это именно ваша прихоть а не чья то.
Я вижу вы не знаете причину применяемых в поисковиках ограничениях на наборы символов. Да в поисковиках ограничения применяются, но совсем для других целей.
Возвращаемся к обсуждаемой тут теме.
В названиях могут быть знаки пунктуаци.
В названиях могут быть цифры.
В названиях могут быть буквы.
Могут ли быть в названиях орфографические знаки?
Я считаю, да могут.