You are not logged in.

#26 2011-03-12 13:07:06

andriano
Member
Registered: 2009-06-15
Posts: 1,667

Re: NameRuBot

Fortress wrote:

Хочется карту соседей на русском, так что я пока осторожно курю в сторону: http://ru.wikipedia.org/wiki/Финско-рус … анскрипция

Я бы поостерегся сам придумывать транслитерацию. Практика показывает, что имена собственные не подчиняются общим правилам, а идут, скорее, от исторической традиции. (пример принцессы Дианы и Дайаны Росс я уже приводил)
Поэтому мне кажется следует вносить в базу ТОЛЬКО те имена, которые нашли подтверждение в независимых источниках, но никак не результаты алгоритмического перевода.
Поэтому, кстати, я и рекомендовал помимо прочего проверять и координаты, т.к. одинаковые наименования на языке оригинала могут по-разному писаться по-русски в зависимости от исторических традиций.

Сколько таких городов всего? Запущу завтра, посмотрим. Главное, чтоб на вики-педии не забанили за выкачивание больших объемов...

Я анализировал по декабрьской Planet.osm, тогда их было немного более 300 (более 100 т.ж.), после моей правки должно было остаться уже менее 300. Правда, я еще ставил обязательным условием наличие либо name:en либо int_name.

Offline

#27 2011-04-02 10:20:35

andriano
Member
Registered: 2009-06-15
Posts: 1,667

Re: NameRuBot

Собственно, прошло еще 3 недели.
Интересует, проект еще дышит или уже почил в бозе?

Offline

#28 2011-04-02 20:52:11

Fortress
Member
From: Russia, Saint-Petersburg
Registered: 2009-07-09
Posts: 1,109

Re: NameRuBot

Прошу прощения. Работой завалило. Пока не стал брать планету. Взял сегодняшнюю Европу с геофабрика. Выбирались точки с тегами:
place=city
population=">99999"
Поиск по английской википедии.
Отчет: http://navitel.gis-lab.info/logs/NameRu … -23-30.htm
Результат хороший. Красного, белого и бежевого очень мало smile

Last edited by Fortress (2011-04-02 21:05:25)

Offline

#29 2011-04-04 18:10:38

andriano
Member
Registered: 2009-06-15
Posts: 1,667

Re: NameRuBot

Ну, список от 100К для всей планеты я выкладывал.
Но если вручную проверять по википедии, за вечер получается штук 20. И ОЧЕНЬ муторно. sad

Offline

#30 2011-04-04 18:39:05

Fortress
Member
From: Russia, Saint-Petersburg
Registered: 2009-07-09
Posts: 1,109

Re: NameRuBot

andriano wrote:

Ну, список от 100К для всей планеты я выкладывал.

Прошу прощения, пропустил. Список НП выкладывал? Можешь повторить?

Но если вручную проверять по википедии, за вечер получается штук 20. И ОЧЕНЬ муторно. sad

Зачем вручную, когда компьютер для этого есть? wink Если устроит то, что получилось для Европы, запущу для планеты. Только у меня есть одна трудность: планета в распакованном виде занимает очень много места и на винт не влезает, а в сжатом виде у меня чего-то мозгов не хватает, как осмосис на нее натравить.. (винда)

Last edited by Fortress (2011-04-04 18:40:56)

Offline

#31 2011-04-04 19:06:28

Alexandr Zeinalov
Member
From: New-Peredelkino, Moscow, RU
Registered: 2009-08-26
Posts: 1,698
Website

Re: NameRuBot

Fortress wrote:

планета ... занимает очень много места

http://wiki.openstreetmap.org/wiki/RU:С … в_Рамблере

Offline

#32 2011-04-05 09:57:35

glebius
Member
From: Moscow, RU
Registered: 2009-02-24
Posts: 1,178

Re: NameRuBot

Насколько я понял Fortress нужен сервер под виндой. В принципе это возможно, просто должен найтись кто-то ответственный за него (не я smile ). Провести начальную установку и IPKVM периодически подключать можем, но желательно пореже. smile

Offline

#33 2011-04-05 10:44:57

Fortress
Member
From: Russia, Saint-Petersburg
Registered: 2009-07-09
Posts: 1,109

Re: NameRuBot

Глеб, давай я попробую.

Offline

#34 2011-04-05 11:30:19

glebius
Member
From: Moscow, RU
Registered: 2009-02-24
Posts: 1,178

Re: NameRuBot

Ок. И давай переходить в email.

Offline

#35 2011-04-05 11:58:43

dnikitin
Member
Registered: 2011-03-05
Posts: 86

Re: NameRuBot

Сомнительная значимость — проставлять русские названия иностранным городам. Лучше проставить городам на кириллице альтернативное название на латинице, чтобы иностранцы, хоть как то ориентировались.  Для них наша кириллица как для нас иероглифы или арабская вязь. К слову, в той же Японии под названием города иероглифами в скобках название на латинице — это упрощает жизнь.

Offline

#36 2011-04-05 12:05:01

Fortress
Member
From: Russia, Saint-Petersburg
Registered: 2009-07-09
Posts: 1,109

Re: NameRuBot

dnikitin wrote:

Сомнительная значимость — проставлять русские названия иностранным городам.

Вовсе не сомнительная, плюсы написаны в первом мессадже.

Лучше проставить городам на кириллице альтернативное название на латинице, чтобы иностранцы, хоть как то ориентировались.  Для них наша кириллица как для нас иероглифы или арабская вязь.

Это уже обсуждалось в теме на нескольких страницах. Насколько я помню, ни к какому решению не пришли.

К слову, в той же Японии под названием города иероглифами в скобках название на латинице — это упрощает жизнь.

Но это точно нифига не правильно. Если латиннице и быть, то в отдельном теге. В name ей нечего делать.

Offline

#37 2011-04-05 12:22:25

Ezhick
Member
From: Moscow
Registered: 2008-10-08
Posts: 2,508
Website

Re: NameRuBot

dnikitin wrote:

Сомнительная значимость — проставлять русские названия иностранным городам. Лучше проставить городам на кириллице альтернативное название на латинице, чтобы иностранцы, хоть как то ориентировались.  Для них наша кириллица как для нас иероглифы или арабская вязь. К слову, в той же Японии под названием города иероглифами в скобках название на латинице — это упрощает жизнь.

Гораздо полезнее 100500 постов на форуме. Меня всегда убивало, когда кто-то что-то ДЕЛАЕТ, а ему кто-то другой начинает рассказывать, почему то, что он делает, нафиг никому не нужно... Человек уже ДЕЛАЕТ, значит он считает это НУЖНЫМ. Значит как минимум одному человеку это НУЖНО, значит это уже не бессмысленно. Помогите или отойдите и не трогайте.

Offline

#38 2011-10-06 21:31:57

Fortress
Member
From: Russia, Saint-Petersburg
Registered: 2009-07-09
Posts: 1,109

Re: NameRuBot

Административные единицы без name:ru по всему миру по подготовленному  Котярой осм:
http://www.openstreetmap.org/browse/changeset/9488870

Offline

#39 2011-10-06 22:43:20

Aleksandr Dezhin
Member
From: Msk
Registered: 2008-05-25
Posts: 2,109
Website

Re: NameRuBot

Тут что-то не так с алгоритмом:
http://www.openstreetmap.org/browse/way/74142252
http://www.openstreetmap.org/browse/way/74142260

Вот это http://www.openstreetmap.org/browse/way/75390339 тоже довольно странно, с учетом http://ru.wikipedia.org/wiki/%D0%A0%D1% … 0%B8%D1%8F, а статья из которой подтянулось имя про Испанию.

Необходимость ставить name:ru на полигон НП при наличии его на точке, не очень понятна. Пример: http://www.openstreetmap.org/browse/way/30711482.

И вот это не очень понятно как получилось: http://www.openstreetmap.org/browse/relation/1020716 - википедия говорит что это "Округ Чероки"

Исправления, внесенные в википедию, после автоматической расстановки name:ru каким образом планируете отслеживать?

Ну и если уж заливать такие правки, то мне кажется удобнее было бы делать это по странам, тогда можно более предметно проверять.

Last edited by Aleksandr Dezhin (2011-10-06 23:04:57)


[ Проверка границ и НП | Дампы | Валидатор рек | Кое-что ещё ]
- Нет! Не надо пытаться. Делай. Или не делай. Не надо пытаться. (c) Йода

Offline

#40 2011-10-07 07:12:58

Komяpa
Member
From: Minsk
Registered: 2009-04-14
Posts: 1,323
Website

Re: NameRuBot

Aleksandr Dezhin wrote:

Необходимость ставить name:ru на полигон НП при наличии его на точке, не очень понятна.

Реверс-геокодинг по базе osm2pgsql. Да и рендеринг в общем случае - не всегда name удобно брать из точек, особенно, когда оно есть на полигоне.


world processing is what we do.
[OSMF BY Team] [http://komzpa.net/] [jabber: komzpa@gmail.com] [mobile/SMS: +375257407159]

Offline

#41 2011-10-07 07:40:20

Aleksandr Dezhin
Member
From: Msk
Registered: 2008-05-25
Posts: 2,109
Website

Re: NameRuBot

Komяpa wrote:
Aleksandr Dezhin wrote:

Необходимость ставить name:ru на полигон НП при наличии его на точке, не очень понятна.

Реверс-геокодинг по базе osm2pgsql. Да и рендеринг в общем случае - не всегда name удобно брать из точек, особенно, когда оно есть на полигоне.

Ну если этой дорогой пойти, то недалек тот день, когда на одном НП в РФ его название будут записаны в четырех тегах, по паре name и name:ru на точке и на полигоне. Причем рано или поздно имена будут разные. Решительно не хотеть такого. По сути проблемы, то конечно нужно сопоставлять точки и полигоны НП это довольно просто, по рф+украине в базе osm2pgsql делается минут за 5 на слабой машине, по миру видимо подольше, но результаты довольно просто кэшируются между обновлениями дифами osm2pgsql.


[ Проверка границ и НП | Дампы | Валидатор рек | Кое-что ещё ]
- Нет! Не надо пытаться. Делай. Или не делай. Не надо пытаться. (c) Йода

Offline

#42 2011-10-07 08:06:54

GaM
Member
From: Saint-Petersburg/Russia
Registered: 2011-01-10
Posts: 3,191
Website

Re: NameRuBot

А по финке как дела? Хотелось бы на родном языке эти крякозяблы слить, чтобы понимать как произносить коль чего.


Чем меньше ты флудишь, тем больше нарисуешь!

Offline

#43 2011-10-07 14:46:04

Fortress
Member
From: Russia, Saint-Petersburg
Registered: 2009-07-09
Posts: 1,109

Re: NameRuBot

Aleksandr Dezhin wrote:

Тут что-то не так с алгоритмом:
... статья из которой подтянулось имя про Испанию.

С алгоритмом все нормально, просто нужно работать с каждой страной (и соответствующим разделом педии) отдельно. И, конечно вручную править результаты работы, т.к. очень много неверных сопоставлений. Ну это уже к самой педии вопрос..

И вот это не очень понятно как получилось: http://www.openstreetmap.org/browse/relation/1020716 - википедия говорит что это "Округ Чероки"

Да я специально убрал фразу округ, возможно напрасно.

Исправления, внесенные в википедию, после автоматической расстановки name:ru каким образом планируете отслеживать?

Надеялся оставить юзерам на откуп roll

Ну и если уж заливать такие правки, то мне кажется удобнее было бы делать это по странам, тогда можно более предметно проверять.

Согласен.

GaM wrote:

А по финке как дела? Хотелось бы на родном языке эти крякозяблы слить, чтобы понимать как произносить коль чего.

По финке уже проходился не так давно. Можно попробовать обработать (транслитерировать) все наименования как я уже предлагал, но существуют мнения, что это не есть хорошо. Или по крайней мере перед заливкой такая правка требует тщательной стопроцентной проверки.

Offline

#44 2011-10-07 17:47:01

GaM
Member
From: Saint-Petersburg/Russia
Registered: 2011-01-10
Posts: 3,191
Website

Re: NameRuBot

Можно транслит автоматикой и в скобках название по фински, да это под рендеры получится, зато удобно углядывать и руками править если ошибка. если ошибки нет убирать скобки, кто тут по фински шарит? Я то просто туда намыливаюсь и их "крякозяблое произношение" мне моск ломает.


Чем меньше ты флудишь, тем больше нарисуешь!

Offline

#45 2011-10-07 19:08:39

Sergey Astakhov
Member
From: St.Petersburg, Russia
Registered: 2009-11-13
Posts: 5,779

Re: NameRuBot

GaM wrote:

Можно транслит автоматикой и в скобках название по фински

То, что можно сделать автоматически (транслитерацию, например) вполне может сделать конвертер при конвертации. Пихать в данные это категорически не рекомендуется. Той же транслитерации обычно существует несколько разных вариантов.

Offline

#46 2011-10-07 19:43:35

fserges
Member
From: St.Petersburg/Russia
Registered: 2010-11-08
Posts: 3,998

Re: NameRuBot

Финский это ещё ничего. Вот в Швецию ездил так это привет. До сих пор не понимаю почему "o" иногда произносится как "о" а иногда как "у".

Кстати, идея автоматической транслитерации тоже иногда выдаёт пёрлы. Судя по всему Гугл использует эту технологию. Вот забавный пример: http://maps.google.ru/maps?f=q&source=s … 6&t=m&z=17

По-французски Avenue Victor Hugo, по-русски - Проспект Виктор Юго smile На самом деле в русском это Виктор Гюго wink


Бывший редактор ОСМ

Offline

#47 2011-10-07 20:18:07

luiswoo
Member
Registered: 2010-09-11
Posts: 1,597

Re: NameRuBot

fserges wrote:

...По-французски Avenue Victor Hugo, по-русски - Проспект Виктор Юго smile На самом деле в русском это Виктор Гюго wink

Технически, ближе к истине будет первый вариант, если мне не изменяет память - H вообще не произносится.

Offline

#48 2011-10-07 21:24:05

fserges
Member
From: St.Petersburg/Russia
Registered: 2010-11-08
Posts: 3,998

Re: NameRuBot

Я про то и говорю smile Если переводить используя знание правил французского языка то получим Юго. Кому интересно - гляньте в транскрипцию фамилии в википедии. Но в русском это Гюго.

Другой пример - более правильный - http://maps.google.ru/maps?q=Boulevard+ … F&t=m&z=17

В русской традиции переустроитель Парижа середины 19 в. - барон Осман - http://ru.wikipedia.org/wiki/%D0%9E%D1% … 0%B5%D0%BD

Соответственно улица в честь него должна читаться как бульвар Османа (или Бульвар Осман как в Гугле). В оригинале - Boulevard Haussmann так как его фамилия пишется как Haussmann. То есть всё правильно smile

Отсюда мораль - транслит транслитом а головой думать тоже надо ...

Last edited by fserges (2011-10-07 21:26:13)


Бывший редактор ОСМ

Offline

#49 2011-10-07 22:16:00

Max Vasilev
Member
Registered: 2009-06-16
Posts: 1,026
Website

Re: NameRuBot

Извините, что вмешиваюсь, но в

<meta http-equiv="Content-Type" content="text/html"; charset=utf-8">

кавычка после text/html лишняя, ибо content - это key, а его value это строка "text/html; charset=utf-8" целиком.

Но это для морально устаревших браузеров, типа IE 3.0 или офлайнового просмотра файла с диска. Современные браузеры читают кодировку в ответе сервера и используют именно её, а не то что стоит в "meta".

Для Apache это настраивается в .htaccess директивой

AddDefaultCharset UTF-8

либо в httpd.conf в соответствующем <Directory> </Directory>

Last edited by Max Vasilev (2011-10-07 22:16:41)

Offline

#50 2011-10-08 21:18:07

GaM
Member
From: Saint-Petersburg/Russia
Registered: 2011-01-10
Posts: 3,191
Website

Re: NameRuBot

Апач прошлый век smile

Кстати да, Сергей, наверное лучше при конвертации, вот кто бы такой конвертер сделал? Причем подо все форматы? Мне лично конечно же для гурмэна надо, ну и в OsmAnd бы. ааа... можно кстати не ломать конвертеры а поправить osm файл какой-то утилиткой транслитатором... хм... вот кто бы такую записал, а то я низкоуровневое ни бу-бу, я php smile


Чем меньше ты флудишь, тем больше нарисуешь!

Offline

Board footer

Powered by FluxBB