You are not logged in.
- Topics: Active | Unanswered
#1 2011-01-14 13:06:53
- Magomogo
- Member
- From: Novosibirsk
- Registered: 2010-11-20
- Posts: 220
- Website
Ударения в названиях
Данные в базе OSM хранятся в кодировке UTF-8 и я категорически против, чтобы под конвертер эти данные портить!
P.S. В нашем глобальном мире кодировка win-1251 постепенно должна уйти, из интернетов и компьютеров - точно. Годится только для локальных применений при ограниченных ресурсах.
Offline
#2 2011-01-14 13:35:16
- liosha
- Member
- From: Moscow
- Registered: 2008-03-04
- Posts: 8,447
- Website
Re: Ударения в названиях
Magomogo, ты неправильно понял вопрос.
Offline
#3 2011-01-14 15:53:23
- Magomogo
- Member
- From: Novosibirsk
- Registered: 2010-11-20
- Posts: 220
- Website
Re: Ударения в названиях
Magomogo, ты неправильно понял вопрос.
Я просто заметил, что в результате одной правки из базы OSM был удален юникод-символ. Прочитав это обсуждение понял, что это было сделано ради конвертации. Что я понял не так? Если надо конвертировать в win кодировку - используйте iconv //TRANSLIT или //IGNORE
Last edited by Magomogo (2011-01-14 15:55:40)
Offline
#4 2011-01-14 15:57:27
- liosha
- Member
- From: Moscow
- Registered: 2008-03-04
- Posts: 8,447
- Website
Re: Ударения в названиях
Magomogo, символ был удалён, потому что такого символа не должно быть в названии.
Конвертация просто помогла выявить этот символ.
Offline
#5 2011-01-14 16:01:15
- Magomogo
- Member
- From: Novosibirsk
- Registered: 2010-11-20
- Posts: 220
- Website
Re: Ударения в названиях
По-моему очень удобно иметь символ ударения в ситуации, когда непонятно как его ставить.
А что по поводу других символов юникода, например типографики? Неразрывные пробелы, дефис и пр. Юникод - это преимущество. Зачем загонять себя в рамки старой кодировки?
Offline
#6 2011-01-14 16:05:21
- liosha
- Member
- From: Moscow
- Registered: 2008-03-04
- Posts: 8,447
- Website
Re: Ударения в названиях
Magomogo, для ударений можно придумать отдельный тег, если хочется. Можно хоть в IPA названия писать. Но в обычном name этого делать не надо.
Юникод - это преимущество. Зачем загонять себя в рамки старой кодировки?
А это к чему? С этим никто никогда не спорил.
Только типографика к названиям никакого отношения не имеет.
Offline
#7 2011-01-14 16:07:49
- Magomogo
- Member
- From: Novosibirsk
- Registered: 2010-11-20
- Posts: 220
- Website
Re: Ударения в названиях
Просто хочу понять - вы предлагаете не использовать юникод в значениях тега name?
Offline
#8 2011-01-14 16:13:28
- liosha
- Member
- From: Moscow
- Registered: 2008-03-04
- Posts: 8,447
- Website
Re: Ударения в названиях
Просто хочу понять - вы предлагаете не использовать юникод в значениях тега name?
Ну и где я так предложил?
Я предлагаю всего лишь использовать теги по назначению. В частности ударение к названию никакого отношения не имеет, поэтому его в теге name быть не должно. А если хочется указать произношение, использовать для него другие теги.
Offline
#9 2011-01-14 16:16:32
- Magomogo
- Member
- From: Novosibirsk
- Registered: 2010-11-20
- Posts: 220
- Website
Re: Ударения в названиях
но ведь конвертер падает, если встречает юникод в тегах, правильно? И ваше решение - удалить юникод из базы, правильно понимаю?
Offline
#10 2011-01-14 16:19:12
- Ezhick
- Member
- From: Moscow
- Registered: 2008-10-08
- Posts: 2,508
- Website
Re: Ударения в названиях
но ведь конвертер падает, если встречает юникод в тегах, правильно? И ваше решение - удалить юникод из базы, правильно понимаю?
Удалить неподходящий юникодный символ из одного тэга!!!
Offline
#11 2011-01-14 16:21:27
- gps-Max
- Member
- Registered: 2010-01-12
- Posts: 736
Re: Ударения в названиях
На юникодные символы в общем случае никто не покушается. А вот для частных случаев, типа ударений, типографских украшалок и прочего, место не в этом теге.
Offline
#12 2011-01-14 16:29:17
- Magomogo
- Member
- From: Novosibirsk
- Registered: 2010-11-20
- Posts: 220
- Website
Re: Ударения в названиях
То есть речь идет обо всех тегах name?
Вся инфраструктура OSM отлично работает с юникодом, не могу понять зачем вводить ограничения? На счет ударения - это обычный символ, с точки зрения кодировки.
Offline
#13 2011-01-14 16:30:59
- Ezhick
- Member
- From: Moscow
- Registered: 2008-10-08
- Posts: 2,508
- Website
Re: Ударения в названиях
То есть речь идет обо всех тегах name?
Вся инфраструктура OSM отлично работает с юникодом, не могу понять зачем вводить ограничения? На счет ударения - это обычный символ, с точки зрения кодировки.
Вы видели хоть в одной карте названия с ударениями? Или, может, указатели с ударениями?
Offline
#14 2011-01-14 16:33:01
- gps-Max
- Member
- Registered: 2010-01-12
- Posts: 736
Re: Ударения в названиях
(европейские не в счёт - там это именно символы алфавита и никаких ударений)
Offline
#15 2011-01-14 16:34:21
- borism346
- Member
- From: Minsk
- Registered: 2008-11-12
- Posts: 910
Re: Ударения в названиях
Magomogo, если очень хочется, введите себе тег - имя с ударением,и вставляйте туда сколько влезет...
Offline
#16 2011-01-14 16:42:38
- Magomogo
- Member
- From: Novosibirsk
- Registered: 2010-11-20
- Posts: 220
- Website
Re: Ударения в названиях
Первое, что пришло в голову, какое-нибудь кафе E=mc²
Offline
#17 2011-01-14 16:45:33
- gps-Max
- Member
- Registered: 2010-01-12
- Posts: 736
Re: Ударения в названиях
Это ведь не ударение и не украшалка.
Offline
#18 2011-01-14 16:48:24
- Magomogo
- Member
- From: Novosibirsk
- Registered: 2010-11-20
- Posts: 220
- Website
Re: Ударения в названиях
Но ведь от этого символа конвертер упадет? Значит кто-то из вас придет, и такой name исправит, вместо того, чтобы чинить конвертер.
Offline
#19 2011-01-14 16:49:28
- Fortress
- Member
- From: Russia, Saint-Petersburg
- Registered: 2009-07-09
- Posts: 1,109
Re: Ударения в названиях
Просьба модераторов выделить тред про ударения в отдельную тему.
Offline
#20 2011-01-14 16:56:52
- Magomogo
- Member
- From: Novosibirsk
- Registered: 2010-11-20
- Posts: 220
- Website
Re: Ударения в названиях
Просьба модераторов выделить тред про ударения в отдельную тему.
Речь вообще не про ударения. Речь про юникод-символы.
Offline
#21 2011-01-14 17:01:19
- gps-Max
- Member
- Registered: 2010-01-12
- Posts: 736
Re: Ударения в названиях
Еще раз. Юникод-символы из некоторых европейских алфавитов при конвертации заменяются на ближайший эквивалент ASCII. Уже давно заменяются. Однако это не значит, что в name нужно пихать всё подряд. Вот о чём речь, собственно.
Offline
#22 2011-01-14 17:04:23
- gps-Max
- Member
- Registered: 2010-01-12
- Posts: 736
Re: Ударения в названиях
Кстати, вот в Википедии любят ударения, и всегда проставляют их при случае. Однако их ставят не в _названии_ статьи, а в её тексте.
Offline
#23 2011-01-14 17:10:18
- Magomogo
- Member
- From: Novosibirsk
- Registered: 2010-11-20
- Posts: 220
- Website
Re: Ударения в названиях
Юникод гораздо богаче старых кодировок, и это будут использовать все чаще. Не всем символам можно найти эквивалент в windows кодировке. Но это не значит, что в базе OSM русскоязычной части мира этим символам не место. Даже в name эти символы изредка будут нужны.
Ну я понимаю, есть технические трудности при переводе в однобайтовую кодировку, но зачем же ограничивать из-за этого OSM? Это искусственные ограничения, все-таки конвертер вторичен, база данных-то важнее, правда?
Last edited by Magomogo (2011-01-14 17:14:59)
Offline
#24 2011-01-14 17:15:41
- gps-Max
- Member
- Registered: 2010-01-12
- Posts: 736
Re: Ударения в названиях
Дело не в "богатстве" юникода, дело в неуместности.
Вы видели хоть в одной карте названия с ударениями? Или, может, указатели с ударениями?
Offline
#25 2011-01-14 17:20:19
- Magomogo
- Member
- From: Novosibirsk
- Registered: 2010-11-20
- Posts: 220
- Website
Re: Ударения в названиях
Дело не в "богатстве" юникода, дело в неуместности.
Ezhick wrote:Вы видели хоть в одной карте названия с ударениями? Или, может, указатели с ударениями?
Да дались вам эти ударения! Я же привел пример юникод-символа, уместного на карте! А знаки градуса, валют... да чего там только нет, и все эти символы будут все чаще встречаться на вывесках, потому что люди будут использовать юникод все чаще. Вывески печатают на компьютерах. До людей скоро дойдет, что все эти символы доступны для использования и давно поддерживаются всеми программами/принтерами/почтовыми клиентами/итд.
Last edited by Magomogo (2011-01-14 17:22:55)
Offline