You are not logged in.
- Topics: Active | Unanswered
Announcement
Please create new topics on the new site at community.openstreetmap.org. We expect the migration of data will take a few weeks, you can follow its progress here.***
#101 2013-01-25 07:58:04
- Zkir
- Member
- From: Хрустальная Москва
- Registered: 2009-02-21
- Posts: 6,110
Re: Перевод названий всех городов
И чья в том вина, что арбатская пья-я-янь
пьет водку из чашек династии Táng!
Смотрим, наслаждаемся: http://www.youtube.com/watch?v=rTZteTqicLM
Истинные слова не не приятны, приятные слова не истинны.
True words are unpleasant; pleasant words are untrue.
Offline
#102 2013-02-15 02:35:41
- skymeteo
- Member
- Registered: 2013-01-21
- Posts: 35
Re: Перевод названий всех городов
Так или иначе, дело движется:
У меня вопрос.
В поле name полно названий, дублированных латиницей:
直方市 (Nogata)
سنار Sennar
...
Я так понимаю, это и есть легендарное «рисование под рендер». Name:en или name_int нигде не отображается, а одни иероглифы на карте видеть — не круто.
В таких случаях латиница из этого поля должна переехать в name_int, так?
Offline
#103 2013-02-15 09:18:28
#104 2013-02-15 12:20:48
- skymeteo
- Member
- Registered: 2013-01-21
- Posts: 35
Re: Перевод названий всех городов
Э-э-э. Как вас ещё не забанили с таким пониманием региональных стандартов?
А что не так?
Offline
#105 2013-02-15 14:04:43
- GaM
- Member
- From: Planet.osm
- Registered: 2011-01-10
- Posts: 3,210
Re: Перевод названий всех городов
Есть устоявшиеся соглашения для регионов-стран, и не принято из вне в них влезать без явной на то просьбы. Вполне логично как-бы.
Вообще я глубоко не понимаю зачем это всё вносить в осм, раз десять описали разные люди процесс, на этапе уже после взятия данных из осм можно накатывать хоть 20 алгоритмов транскрипций какие хотите, и всё будет чуки-пуки.
Offline
#106 2013-02-15 18:53:34
- AlexTheTux
- Member
- From: Russia, Saint-Petersburg
- Registered: 2011-07-04
- Posts: 384
Re: Перевод названий всех городов
В таких случаях латиница из этого поля должна переехать в name_int, так?
Не так. От страны зависит.
Мы сейчас не про Россию - так? :-)
Тогда стоит почитать в wiki схему наименования той конкретной страны. Например, если не ошибаюсь - в Японии вынос в name английского названия в скобках после иероглифов - местная норма.
Offline
#107 2013-02-16 02:45:53
- skymeteo
- Member
- Registered: 2013-01-21
- Posts: 35
Re: Перевод названий всех городов
Например, если не ошибаюсь - в Японии вынос в name английского названия в скобках после иероглифов - местная норма.
Мой вопрос скорее в том, почему это делается прямо в базе, а не на этапе отрисовки. Так гибкость теряется. Два языка в одном поле — это бессмыслица.
Offline
#108 2013-02-16 03:21:21
- GaM
- Member
- From: Planet.osm
- Registered: 2011-01-10
- Posts: 3,210
Re: Перевод названий всех городов
Потому что соглашение едино, а рендеров-конвертеров сотни, со всеми не свяжешься и не договоришься. Нативно часто поддерживается всякими программами мапник только и т.п.
Offline
#109 2013-02-16 03:44:10
- skymeteo
- Member
- Registered: 2013-01-21
- Posts: 35
Re: Перевод названий всех городов
Потому что соглашение едино, а рендеров-конвертеров сотни, со всеми не свяжешься и не договоришься. Нативно часто поддерживается всякими программами мапник только и т.п.
В базе я вижу для одной и той же страны названия латиницей в скобках, без скобок, через пробел, без пробела, через слэш, в верхнем регистре и еще несколько вариантов. Соглашение, может, едино, но бардак присутствует. Только в Японии более-менее порядок. Кроме того, «соглашение», которое описано в wiki OSM, подразумевает, что есть поля name:en и name:LN, в которых названия даны по отдельности. В жизни этого нет.
И этот бардак не разберут никакие алгоритмы транскрипции или что там еще... Для одной страны — да, можно придумать. Для всего мира — не реально.
Я постепенно убеждаюсь, что такая слабо структурированная система слабо подходит для какой-либо машинной обработки. Даже из Википедии оказалось проще распарсить данные. Там есть шаблон для описания населенных пунктов. Он описан, понятен и соблюдается достаточно строго. Ошибки и неопределенности есть менее чем в 1% случаев на 161 000 точек.
Offline
#110 2013-02-16 07:29:07
- fserges
- Member
- From: St.Petersburg/Russia
- Registered: 2010-11-08
- Posts: 4,030
Re: Перевод названий всех городов
Транслитерация вещь сильно в себе. Она должна быть уникальной для каждого языка. Тут даже просто привести примеры. Вот как пишутся названия некоторых населённых пунктов на территории России и попытки их "интернализировать".
Вщиж - Vshchizh
Тлюстенхабль (адыг. Лъэустэнхьабл) - Tlyustenkhabl
Выдропужск - Vydropuzhsk.
Ыллымах - Yllymakh
Когда в языке-источнике используются совсем другие звуке чем в языке отображения то получаются очень странная смесь букв. И то что поймёт англичанин с трудом прочитает француз. Ведь не смотря на то что и тот и другой использует алфавит построенный на латинице все эти страшные нагромождения букв звучат по-разному. Ведь тот же Челябинск по-французски передаётся как Tcheliabinsk.
Тот же самый Вщиж в итальянской википедии называется Vščiž. А Тлюстенхабль на испанском (согласно википедии) - Tliustenjabl
Аналогично и с азиатскими языками. Не надо думать что транслитерация у англичан и русских будет одинаковой ...
Поэтому ффтопку двойные "названия".
Last edited by fserges (2013-02-16 07:31:16)
Бывший редактор ОСМ
Offline
#111 2013-02-16 11:10:49
- GaM
- Member
- From: Planet.osm
- Registered: 2011-01-10
- Posts: 3,210
Re: Перевод названий всех городов
skymeteo, никто и не говорил что база идеальна, скорее наоборот, требует дополнительного переваривания для использования в своих целях. И поддерживать такую огромную базу в порядке реально не просто, википедия всё-таки статьи, а у нас куча "типов" и вариантов данных, от люков на дороге до 3Д моделей
И ваша инициатива очень хороша была, до предложения заливать в базу какие-то готовые варианты транскрипций... Эта тема уже мусолилась раз 5 на моей только памяти...
Last edited by GaM (2013-02-16 11:11:53)
Offline
#112 2013-02-16 13:54:43
- skymeteo
- Member
- Registered: 2013-01-21
- Posts: 35
Re: Перевод названий всех городов
И ваша инициатива очень хороша была, до предложения заливать в базу какие-то готовые варианты транскрипций... Эта тема уже мусолилась раз 5 на моей только памяти...
5 раз, боже мой! Соберите аргументы и напишите в wiki — больше не будет этой темы.
Тут пять страниц обсуждения. На каждой странице разные предложения и инициативы. Я тогда вообще ничего про OSM не знал, поэтому идеи менялись вместе с появлением новой информации. Это всё были рабочие идеи для обсуждения, а не готовое ТЗ. Но в каждой инициативе вам (сообществу) что-то да не нравилось. Лицензионная паранойя, импорты не приветствуются, новые теги никому не нужны и почти все уверены, что сейчас всё прекрасно. На каждой странице мне говорили, что идея плохая.
Мне в самом начале написали «это тема для википедии, а не OSM». Но для меня было очевидно, что именно для OSM, т.к. у вас, по идее, должна быть хорошо структурированная база географических данных. Сама возможность выгрузки в json всех городов (по тегу type=city) как бы намекала на это. Но в реальности оказалось, что данных мало, качество хреновое, а в базе — бардак. Набор недокументированных тегов без типизации и без валидации, да еще и рендер, провоцирующий вводить некорректные данные. Плюс сообщество консерваторов, которых трясет от слова «импорт». То есть, нет перспектив, что качество данных принципиально улучшится в ближайшие несколько лет.
А в Википедии нашелся шаблон {{НП}}, по которому можно парсить точки. Шаблон хорошо описан и соблюдается в 98% случаев (сейчас я в этом уверен, т.к. распарсил 161 000 стратей). Да, парсить сложнее. Скрипт получился аж в 250 строк и работает он минут 40.
В итоге у меня сейчас есть готовый «валидатор» населенных пунктов, но я не буду приделывать к нему импорт в OSM, а сделаю из него бота для Википедии, т.к. там сообщество принимает такую схему работы. Есть правила для ботов, они открыты и понятны. Можно их почитать и сделать так, чтобы всех всё устраивало. Есть форум для ботоводов, где отвечают на вопросы. И там понимают, что навести порядок в сотне тысяч записей можно только с использованием автоматизации.
Больше вас беспокоить не буду.
Offline
#113 2013-02-16 17:19:40
- ErshKUS
- Member
- From: Калиниград
- Registered: 2010-12-27
- Posts: 803
Re: Перевод названий всех городов
skymeteo, я вас от части понимаю, но перечитав топик вызвалось впечатление непонимания. Конечно в ОСМ нужно наводить порядок, и даже где то ботами. Но вам указывали упорно не на это, а то что принятые вами алгоритмы неправильные (и только ухудшат бардак), а вы как будто слушаете но не слышите.
Ты никогда не спутаешь пути: ты стоишь...
И, может, так и нужно, но как тогда узнать, что там выше крыш? (Lumen, Лабиринт)
Offline
#114 2013-02-16 18:35:45
- Zverik
- Moderator
- From: Tallinn
- Registered: 2010-10-14
- Posts: 5,695
- Website
Re: Перевод названий всех городов
Я не одобряю оценок участников по вкладу, но skymeteo зарегистрировался меньше месяца назад и успел только изменить одну точку. Гораздо более опытные осмеры впадали в эту программистскую болезнь -- взять и поправить теги на всей планете. Последним оправдания нет, новичкам вроде skymeteo есть шанс объяснить и попросить зайти через полгода, после получения опыта.
Вот только я сомневаюсь, что он воспринимает OSM не только как инструмент для решения своей локальной задачи.
Last edited by Zverik (2013-02-16 18:38:13)
Offline
#115 2013-02-17 14:26:55
- BushmanK
- Member
- Registered: 2011-05-03
- Posts: 5,106
Re: Перевод названий всех городов
К вопросу о том, что "советская картография была чудесной". Один бывший коллега, работающий в Англии, раздобыл с моей помощью "генштабовские" пятикилометровки Великобритании, дабы поприкалываться над тамошними друзьями. Так вот он долго смеялся над тем, что город Cambridge назван там "Кембридж", а вот река Cam (через которую тот самый bridge, давший название городу) подписана как "Кам". А населенный пункт Melbourne, что в Дербишире, на карте значится как "Мелберн". (Почему-то уверен, что аналогичный город в Австралии таки называется "Мельбурн").
Это не к тому, что все названия на этих картах - дерьмо, а к тому, что какое из них - дерьмо, а какое - нет, вопрос открытый.
"Не умею" не значит "невозможно", "не видел" не значит "не бывает". "Нет проблемы", вероятнее всего, значит, что "нет мозгов".
Offline
#116 2013-11-22 03:39:21
- BushmanK
- Member
- Registered: 2011-05-03
- Posts: 5,106
Re: Перевод названий всех городов
Может я чего-то не понимаю, но какое у этой проблемы (слабое знакомство русского человека с иностранными языками) может быть решение? Придумать для всех объектов в мире русские названия?
Вот Яндекс решил именно так.
"Не умею" не значит "невозможно", "не видел" не значит "не бывает". "Нет проблемы", вероятнее всего, значит, что "нет мозгов".
Offline
#117 2014-01-17 21:16:55
- BushmanK
- Member
- Registered: 2011-05-03
- Posts: 5,106
Re: Перевод названий всех городов
http://habrahabr.ru/company/2gis/blog/209408/ - вот и 2ГИС прошлись по граблям...
"Не умею" не значит "невозможно", "не видел" не значит "не бывает". "Нет проблемы", вероятнее всего, значит, что "нет мозгов".
Offline
#118 2017-03-01 18:51:31
- wowik
- Member
- From: Zelenograd
- Registered: 2009-09-29
- Posts: 9,368
Re: Перевод названий всех городов
Ниндерданды уже откатывают мапсьмишников
https://forum.openstreetmap.org/viewtopic.php?id=57524
Я понял слово reverten
Last edited by wowik (2017-03-01 19:14:54)
Offline
#119 2017-03-01 19:05:59
- freeExec
- Moderator
- From: Ульяновск,Модератор всех слоёв
- Registered: 2012-07-31
- Posts: 8,547
Re: Перевод названий всех городов
Так может стоит уже при редактировании названий подсовывать пользователю серую транскрипцию, что бы у него не возникало соблазна переправлять. Как там вообще дела с отображением НП без переводов?
Offline
#120 2017-03-01 20:38:04
- Zverik
- Moderator
- From: Tallinn
- Registered: 2010-10-14
- Posts: 5,695
- Website
Re: Перевод названий всех городов
Пользуйся Google Translate, пожалуйста.
Что там произошло — пользователь Batareikin, осмер с 2009 года, пользуется maps.me для (ручного, очевидно) добавления русских названий нидерландским городам, в тег name:ru. Местные жители смотрят на это подозрительно, потому что, цитирую, для этих городов нет страниц в русской википедии. Есть один радикал, который не замедлил выдать вердикт «всё откатить», но другие к нему относятся адекватно, т.е. игнорируют.
Offline
#121 2017-03-01 22:55:39
- Batareikin
- Member
- Registered: 2009-12-31
- Posts: 57
Re: Перевод названий всех городов
Ну да, человек заметил знакомое слово "ревертер". И вынес свой вердикт - Ниндерданды уже откатывают мапсьмишников.
Да, парочка радикалов там есть. Из того что понял я:
Один из аргументов (довольно часто у европейцев проявляется) - автоматом это все делается (т.е. транлитерируется), нафиг надо. Как им объяснять упертым, разницу между транскрипцией (которая на русский используется) и транслитерацией, и сложности с первой, даже не представляю. Сами даже ссылку приводят где проблема показана и разжевана Talk:Map_internationalization.
Второй немного удивляет. Раз статьи в рувики нет, то и слова такого нет. Ну непонимают некоторые, что русский язык вобще-то был до рувики, и топоним может быть, а статьи при этом нет (местных рек России коих тысячи - лет пять не осилить, какие уж тут голландские деревни). И вообще Википедия это вторичный, а не первичный источник. Но это и не все и с кирилической письменностью понимают.
Третий. Все русские знают латиницу, могут ведь так прочесть. Латиницу то может и знают. Но в лучшем случае прочтут по-английски (по-французски, по-немецки). А голландские дифтонги-то отличаются.
Но есть там и аргументы местных за. Кто понимает что тяжко вот читать к примеру арабскую вязь. Кто - раскладки для поиска голландской может не быть Кто - мол ничего не испорчено, мне не мешает, ну пусть будет. Есть и те кто понимает всю проблему в целом и правильно.
Кто бы на английском там объяснил. Но лучше на голладском.
Offline
#122 2017-03-02 01:05:44
- BushmanK
- Member
- Registered: 2011-05-03
- Posts: 5,106
Re: Перевод названий всех городов
Википедия, в данном случае, не источник, а индикатор того, что названия на русском языке для того, для чего они в данном случае придумываются по ходу дела, не существуют. Так что голландцы понимают всё правильно. Сто раз везде написано (и специально разжёвано для русскоязычных в Wiki), что name:language_code не предназначен для транскрипции, транслитерации и прочей хрени.
"Не умею" не значит "невозможно", "не видел" не значит "не бывает". "Нет проблемы", вероятнее всего, значит, что "нет мозгов".
Offline
#123 2017-03-02 04:29:14
- wowik
- Member
- From: Zelenograd
- Registered: 2009-09-29
- Posts: 9,368
Re: Перевод названий всех городов
в тег name:ru. Местные жители смотрят на это подозрительно,
Да, им повезло, что не понадобилось кому-нибудь ввести через мапьсми бурятские имена, а вот нам нет.
Last edited by wowik (2017-03-02 04:34:36)
Offline
#124 2017-03-02 11:56:58
- ghost_07
- Member
- From: Krasnogorsk
- Registered: 2012-05-16
- Posts: 41
Re: Перевод названий всех городов
Откомментил им в топике и чейнджсете: https://www.openstreetmap.org/changeset … 1&layers=N
К сожалению, в данном конкретном случае имена действительно некорректные.
Offline
#125 2017-03-04 14:56:59
- Sibri
- Member
- Registered: 2014-07-14
- Posts: 100
Re: Перевод названий всех городов
До чего народ непонятливый!
Нет нужного языка, так в дефолтный пишут. Вот бурятский.
Почему нет, есть же name:bua. А русская википедия устарела. Допускаются и трехбуквенные коды, если их нет в двубуквенных.
Причем для бурятского не все буквы у человека в клавиатуре.
Там не все так однозначно. В бурятском есть "парные" буквы: У у и Ү ү а также О о и Ө ө.
В топонимах могут быть как те, так и эти. Вот например русское название Зун-Хурай он переименовал в бурятское Зуун Хуурай.
Для бурятского написания русского Зун есть как минимум три варианта:
1. Зуун - "сто";
2. Зүүн - "восточный", "игла".
3. Зун - "лето"
Для Хурай как минимум один вариант:
1. Xуурай - "сухой", "подпилок, напильник"
Итого получается что на бурятском это могло быть и Зун-Хуурай (сухое лето) и Зүүн-Хурай (сто напильников) и другие варианты на вашу фантазию. В любом случае место таким наименованиям в name:bua. Может потом носители бурятского языка напишут правильно ү там где она нужна.
Offline