(европейские не в счёт - там это именно символы алфавита и никаких ударений)
Magomogo, если очень хочется, введите себе тег - имя с ударением,и вставляйте туда сколько влезет…
Первое, что пришло в голову, какое-нибудь кафе E=mc²
Это ведь не ударение и не украшалка.
Но ведь от этого символа конвертер упадет? Значит кто-то из вас придет, и такой name исправит, вместо того, чтобы чинить конвертер.
Просьба модераторов выделить тред про ударения в отдельную тему.
Речь вообще не про ударения. Речь про юникод-символы.
Еще раз. Юникод-символы из некоторых европейских алфавитов при конвертации заменяются на ближайший эквивалент ASCII. Уже давно заменяются. Однако это не значит, что в name нужно пихать всё подряд. Вот о чём речь, собственно.
Кстати, вот в Википедии любят ударения, и всегда проставляют их при случае. Однако их ставят не в названии статьи, а в её тексте.
Юникод гораздо богаче старых кодировок, и это будут использовать все чаще. Не всем символам можно найти эквивалент в windows кодировке. Но это не значит, что в базе OSM русскоязычной части мира этим символам не место. Даже в name эти символы изредка будут нужны.
Ну я понимаю, есть технические трудности при переводе в однобайтовую кодировку, но зачем же ограничивать из-за этого OSM? Это искусственные ограничения, все-таки конвертер вторичен, база данных-то важнее, правда?
Дело не в “богатстве” юникода, дело в неуместности.
Да дались вам эти ударения! Я же привел пример юникод-символа, уместного на карте! А знаки градуса, валют… да чего там только нет, и все эти символы будут все чаще встречаться на вывесках, потому что люди будут использовать юникод все чаще. Вывески печатают на компьютерах. До людей скоро дойдет, что все эти символы доступны для использования и давно поддерживаются всеми программами/принтерами/почтовыми клиентами/итд.
Magomogo, я совершенно не понял, с чего ты взял, что конвертер ругается на юникод.
Или тем более падает от него.
Он сообщает об ОШИБКЕ в базе, которую надо исправить, и продолжает работать.
На правильно используемый юникод он не ругается
Я так понял из обсуждения. Я хочу быть уверенным, что уместно использованный юникод, которому не найдется аналога в cp1251 не будет удален только из-за того, что конвертер ругается.
Magomogo, если очень хочется, введите себе тег - имя с ударением,и вставляйте туда сколько влезет…
Characters
You can use any Unicode characters (utf-8) as you like. In practice, most keys (such as highway) and classification values (such as trunk_link) uses lower case chars, underscores and colons. It’s a good idea to avoid characters that will cause trouble in various software for these strings:
- Whitespace You should use underscores ‘_’ instead of whitespace, avoid whitespace at the beginning and end of keys
- <>&/+?#%'"\ Special characters in XML, HTML and/or URLs or used for quoting should be avoided
- = Because its used in many places as the separation character between tag key and tag value avoid the equal sign.
- ; The usage of semicolons is under discussion
© http://wiki.openstreetmap.org/wiki/Any_tags_you_like
нет никаких причин ограничивать name каким либо подмножеством. если ударения или субскрипты как в примере «E=mc²» есть в названии - не вносить их в name в угоду конвертеру глупо
а удалять корректные символы - вандализм
если ударения или субскрипты как в примере «E=mc²» есть в названии - не вносить их в name в угоду конвертеру глупо
а) Где это ударения в названии используются?
б) не в “угоду конвертеру” а по здравому смыслу.
Подытожим:
- Юникод не мешает конвертеру и может свободно использоваться.
- В поле name записывается только реальное название объекта без лишних символов.
Я так понял из обсуждения. Я хочу быть уверенным, что уместно использованный юникод, которому не найдется аналога в cp1251 не будет удален только из-за того, что конвертер ругается.
Magomogo, ты неправильно понял вопрос.
Речь шла именно о неуместных ударениях и маркерах направления
если ударения или субскрипты как в примере «E=mc²» есть в названии
Ударения - не часть названия. Название - это то, что пишется на карте и вывесках, без лишней шелухи.
Ну, рад, что оказался неправ. Думал, что война идет с юникодом, а оказалось - с ударениями. Всем спасибо за пояснения
Да не, юникод - штука хорошая, и пример про Emc правильный