NameRuBot

Глеб, давай я попробую.

Ок. И давай переходить в email.

Сомнительная значимость — проставлять русские названия иностранным городам. Лучше проставить городам на кириллице альтернативное название на латинице, чтобы иностранцы, хоть как то ориентировались. Для них наша кириллица как для нас иероглифы или арабская вязь. К слову, в той же Японии под названием города иероглифами в скобках название на латинице — это упрощает жизнь.

Вовсе не сомнительная, плюсы написаны в первом мессадже.

Это уже обсуждалось в теме на нескольких страницах. Насколько я помню, ни к какому решению не пришли.

Но это точно нифига не правильно. Если латиннице и быть, то в отдельном теге. В name ей нечего делать.

Гораздо полезнее 100500 постов на форуме. Меня всегда убивало, когда кто-то что-то ДЕЛАЕТ, а ему кто-то другой начинает рассказывать, почему то, что он делает, нафиг никому не нужно… Человек уже ДЕЛАЕТ, значит он считает это НУЖНЫМ. Значит как минимум одному человеку это НУЖНО, значит это уже не бессмысленно. Помогите или отойдите и не трогайте.

Административные единицы без name:ru по всему миру по подготовленному Котярой осм:
http://www.openstreetmap.org/browse/changeset/9488870

Тут что-то не так с алгоритмом:
http://www.openstreetmap.org/browse/way/74142252
http://www.openstreetmap.org/browse/way/74142260

Вот это http://www.openstreetmap.org/browse/way/75390339 тоже довольно странно, с учетом http://ru.wikipedia.org/wiki/%D0%A0%D1%83%D0%BC%D1%8B%D0%BD%D1%81%D0%BA%D0%BE-%D1%80%D1%83%D1%81%D1%81%D0%BA%D0%B0%D1%8F_%D0%BF%D1%80%D0%B0%D0%BA%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D1%82%D1%80%D0%B0%D0%BD%D1%81%D0%BA%D1%80%D0%B8%D0%BF%D1%86%D0%B8%D1%8F, а статья из которой подтянулось имя про Испанию.

Необходимость ставить name:ru на полигон НП при наличии его на точке, не очень понятна. Пример: http://www.openstreetmap.org/browse/way/30711482.

И вот это не очень понятно как получилось: http://www.openstreetmap.org/browse/relation/1020716 - википедия говорит что это “Округ Чероки”

Исправления, внесенные в википедию, после автоматической расстановки name:ru каким образом планируете отслеживать?

Ну и если уж заливать такие правки, то мне кажется удобнее было бы делать это по странам, тогда можно более предметно проверять.

Реверс-геокодинг по базе osm2pgsql. Да и рендеринг в общем случае - не всегда name удобно брать из точек, особенно, когда оно есть на полигоне.

Ну если этой дорогой пойти, то недалек тот день, когда на одном НП в РФ его название будут записаны в четырех тегах, по паре name и name:ru на точке и на полигоне. Причем рано или поздно имена будут разные. Решительно не хотеть такого. По сути проблемы, то конечно нужно сопоставлять точки и полигоны НП это довольно просто, по рф+украине в базе osm2pgsql делается минут за 5 на слабой машине, по миру видимо подольше, но результаты довольно просто кэшируются между обновлениями дифами osm2pgsql.

А по финке как дела? Хотелось бы на родном языке эти крякозяблы слить, чтобы понимать как произносить коль чего.

С алгоритмом все нормально, просто нужно работать с каждой страной (и соответствующим разделом педии) отдельно. И, конечно вручную править результаты работы, т.к. очень много неверных сопоставлений. Ну это уже к самой педии вопрос…

Да я специально убрал фразу округ, возможно напрасно.

Надеялся оставить юзерам на откуп :roll_eyes:

Согласен.

По финке уже проходился не так давно. Можно попробовать обработать (транслитерировать) все наименования как я уже предлагал, но существуют мнения, что это не есть хорошо. Или по крайней мере перед заливкой такая правка требует тщательной стопроцентной проверки.

Можно транслит автоматикой и в скобках название по фински, да это под рендеры получится, зато удобно углядывать и руками править если ошибка. если ошибки нет убирать скобки, кто тут по фински шарит? Я то просто туда намыливаюсь и их “крякозяблое произношение” мне моск ломает.

То, что можно сделать автоматически (транслитерацию, например) вполне может сделать конвертер при конвертации. Пихать в данные это категорически не рекомендуется. Той же транслитерации обычно существует несколько разных вариантов.

Финский это ещё ничего. Вот в Швецию ездил так это привет. До сих пор не понимаю почему “o” иногда произносится как “о” а иногда как “у”.

Кстати, идея автоматической транслитерации тоже иногда выдаёт пёрлы. Судя по всему Гугл использует эту технологию. Вот забавный пример: http://maps.google.ru/maps?f=q&source=s_q&hl=ru&geocode=&q=Victor+Hugo,+Paris,+France&aq=1&sll=48.852969,2.356224&sspn=0.024454,0.087891&vpsrc=6&ie=UTF8&hq=&hnear=Victor+Hugo&ll=48.870897,2.28874&spn=0.003225,0.010986&t=m&z=17

По-французски Avenue Victor Hugo, по-русски - Проспект Виктор Юго :slight_smile: На самом деле в русском это Виктор Гюго :wink:

Технически, ближе к истине будет первый вариант, если мне не изменяет память - H вообще не произносится.

Я про то и говорю :slight_smile: Если переводить используя знание правил французского языка то получим Юго. Кому интересно - гляньте в транскрипцию фамилии в википедии. Но в русском это Гюго.

Другой пример - более правильный - http://maps.google.ru/maps?q=Boulevard+Haussmann,+Paris,+France&hl=ru&ie=UTF8&ll=48.874157,2.32289&spn=0.003225,0.006899&sll=48.874369,2.32275&sspn=0.025799,0.055189&vpsrc=6&hnear=Boulevard+Haussmann,+Paris,+%D0%A4%D1%80%D0%B0%D0%BD%D1%86%D0%B8%D1%8F&t=m&z=17

В русской традиции переустроитель Парижа середины 19 в. - барон Осман - http://ru.wikipedia.org/wiki/%D0%9E%D1%81%D0%BC%D0%B0%D0%BD,%D0%96%D0%BE%D1%80%D0%B6%D0%AD%D0%B6%D0%B5%D0%BD

Соответственно улица в честь него должна читаться как бульвар Османа (или Бульвар Осман как в Гугле). В оригинале - Boulevard Haussmann так как его фамилия пишется как Haussmann. То есть всё правильно :slight_smile:

Отсюда мораль - транслит транслитом а головой думать тоже надо …

Извините, что вмешиваюсь, но в

<meta http-equiv="Content-Type" content="text/html"; charset=utf-8">

кавычка после text/html лишняя, ибо content - это key, а его value это строка “text/html; charset=utf-8” целиком.

Но это для морально устаревших браузеров, типа IE 3.0 или офлайнового просмотра файла с диска. Современные браузеры читают кодировку в ответе сервера и используют именно её, а не то что стоит в “meta”.

Для Apache это настраивается в .htaccess директивой

AddDefaultCharset UTF-8

либо в httpd.conf в соответствующем

Апач прошлый век :slight_smile:

Кстати да, Сергей, наверное лучше при конвертации, вот кто бы такой конвертер сделал? Причем подо все форматы? Мне лично конечно же для гурмэна надо, ну и в OsmAnd бы. ааа… можно кстати не ломать конвертеры а поправить osm файл какой-то утилиткой транслитатором… хм… вот кто бы такую записал, а то я низкоуровневое ни бу-бу, я php :slight_smile:

Товарищи, проставьте плз тэг в Тайланде! Думаю,не я одним благодарным туристом буду! :wink:
У них ппц там с алфавитом…

Ага, а ещё Китай, Корею, Японию, Грецию и прочие страны с иероглифами.