Ударения в названиях

Ну зачем троллить-то? А потом люди удивляются откуда 6 страниц обсуждения.

Причём тут троллинг? Просто доведение вашей логики до логичного результата. Если не нравится результат - значит с исходными посылками наверное что-то не в порядке?

Собсно почти все были согласны, что ударениям в name не место. Кроме вас и wildMan. :slight_smile:

Ну может быть правда непонятно…

Мое мнение таково:

  1. Ударения в названиях ставить не надо, кроме случаев, когда ударение есть на местности (таких случаев пока не обнаружено, но могут появиться);
  2. Существуют символы юникода, которые не помещаются в однобайтовые кодировки, их все равно надо использовать, если они есть на местности;
  3. Надо уметь различать символы, даже если они стилизованы сердечками/человечиками. И писать в теги эти символы, невзирая на то, что юникод позволяет писать сердечками и человечиками, а также смайликами.

P.S. А ударения на указателях были бы весьма кстати там, где возможна неоднозначность, я согласен с В. Т. Чумаковым, и надеюсь увидеть их в будущем. Букву Ё же вернули!

Так вот, ударение - значок, не входящий в набор символов.

Нужно вспомнить, ради чего вводился юникод - для того, чтобы в рамках единой кодовой страницы обеспечить потребности РАЗНЫХ языков. А отнюдь не для того, чтобы вводить набор экзотических символов.
Отсюда вывод: там, где речь идет о русскоязычных названиях, т.е. тегах name на территории РФ и тегах name:ru, вполне естественно ограничить ТОЛЬКО символами, входящими в cp1251. (ну, разумеется, остается открытым вопрос о названиях в этнических автономиях)
Применять же в названиях “левые” символы, не входящие в cp1251 только потому, что формально они содержатся в юникоде, IMHO абсурд.
Так мы дойдем до использования в тегах исполняемого кода.

“Карта все таки не учебник языка”, - поэтому ударениям на карте не место.
Если же у кого-то есть какие-то уникальные запросы к OSM (а идея OSM этому совершенно не противоречит), то это как раз повод ввести новые уникальные теги. Например, содержащие ударение.

Уже не раз сталкиваюсь с любопытной особенностью данного форума: объявлять оппонентов троллями.

6 страниц обсуждать несуществующую проблему - это сильно.

Хотел уже промолчать, на вы высказали несколько очень неверных утверждений.

Неправда, входит в юникод.

Правда только частично. Юникод дает больше возможности в рамках одного языка.

Неправильный вывод из неправильного посыла. Виндовс-кодировку 1251 ни в коем случае нельзя брать как образец. Она ограничена и устарела.

P.S. Не принимайте лично, ни в коем случае не хочу никого обидеть.

Ап темы. Что делать с такими названиями?

Имхо, разделить по гос. границе.
А ту часть, которая совпадает с границей, видимо придётся такой и оставить.

В навигаторе смотрится не айс :frowning:

В навигаторе можно брать название из name:ru

Сердечко тоже входит в юникод: символ номер 2665.
Так чем он хуже значка ударения?

Это следствие.

А, собственно, почему?
Она содержит все символы, используемые в русской типографике для обычного текста.
Кстати, нельзя ли поподробнее развернуть тезис об “устаревании”: что же так радикально изменилось в русском языке за два десятка лет, что cp1251 успела устареть?

А чем она лучше KOI8-R? Или CP866? Я против любых кодировок. Просто перечислите все допустимые знаки. Или давайте оставим все как есть. Уповая на общую разумность, добрую волю и способность договариваться по конкретным проблемам.

Контроль входных данных в любом случае остается на авторах разных программ, и от этого никуда не деться.

Таки да. cp1251 реально устарела. Присутствующие на рынке ОС используют как основную юникодовскую кодировку. А cp1251 используется только для совместимости со старыми прогами.

Конечно находятся ещё пользователи которые использует cp1251 как основную. Но мне кажется они не вкурсе о других :slight_smile:

Давайте не будем уводить разговор в сторону.
Речь не об использовании кодировки 1251 в тех или иных программных продуктах, а о том, является ли используемый в ней набор символов устаревшим.
Речь ведь ни о том, какую следует использовать кодировку в том или ином случае, а о том, какой набор символов допустим в русскоязычных названиях.
Если кто-то придерживается мнения об устаревании набора символов, представленного в 1251, пусть приведет ссылки на реформы русского языка, которые сделали этот набор устаревшим.

Переход от 1251 к юникоду это не замена старого набора новым. Это существенное расширение возможностей старого набора. Причём всё железо его уже поддерживает. Остались только старенькие программы которые в момент создания ничего про юникод не знали.
Не вижу надобности в ограничении доступного пространства символов какими то рамками.
Жалкий лепет по поводу, невозможности найти чего либо, каким то конкретным поисковиком, в корне не верно. Так как это беда ентого поисковика. А подстраиваться под какой то обобщённый поисковик не хочется. Нарушается принцип “не пишем под рендер”.

И какое это имеет отношение к обсуждению набора символов допустимых в именах?

Если кто-то чего-то не видит, это совершенно не значит что его нет.

Проблема не в одном (или нескольких) несовершенных поисковиках.
Проблема в том, что такой “совершенный” поисковик в настоящее время сделать принципиально невозможно. Именно потому, что отсутствует стандарт, по которому можно было бы отличать символы, которые следует пропускать при формировании поискового запроса от символов, которые следует оставлять.
Именно поэтому невозможно приведение названия, состоящего из произвольных символов, к виду пригодному для поиска/сортировки. А стало быть, такое ограничение должно быть сделано на более раннем этапе - на этапе подготовки данных. В данном случае это ограничение и приводит к необходимости ограничить набор символов допустимых в именах. Это не чья-то прихоть, это объективная необходимость связанная с состоянием сегодняшних стандартов.
И, кстати, по факту этого ограничения ВЕЗДЕ придерживаются, не смотря на то, какая используется кодировка. Просто потому, что иначе ничего хорошего получиться не может в принципе. Даже если кто-то задумает проект без каких-либо ограничений, все равно в процессе его реализации он неизбежно столкнется с проблемами и будет вынужден ввести эти ограничения.

Если кто то не может сделать то не надо из этого делать вывод о принципиальности.

Это именно ваша прихоть а не чья то.

Я вижу вы не знаете причину применяемых в поисковиках ограничениях на наборы символов. Да в поисковиках ограничения применяются, но совсем для других целей.

Возвращаемся к обсуждаемой тут теме.

  • В названиях могут быть знаки пунктуаци.

  • В названиях могут быть цифры.

  • В названиях могут быть буквы.

Продолжим:

  • могут ли в названиях быть символы чужих языков?
  • могут ли в названиях быть знаки псевдографики?
  • могут ли в названиях быть смайлики?

Кстати да. Я за присутствие всех этих символов в названиях.

Нафига, вам понадобились знаки ударения в названиях на карте. (То что в принципе юникод поддерживается - можно в китае посмотреть).

Только не надо про деревни в тьмутаракании что дескать без ударения их название никто не произнесет, их и с ударением то мало кто осилит.

Или действуем по принципу “Почему кот лижет яйца? - Потому что может!” ?