Работа для бота (требуется помощь ботоводов)

Kaylee, не нужно два имени, должно быть правильное имя, т.е. с ё. А вот если поиск без ё не поддерживает, надо его доделывать, но это не повод коверкать названия. И почему веб-сайты надо поддерживать? Один раз поставил и всё. Как будто просто так создан тег website.

Zkir, информационная помойка это скорее сейчас, когда разброд и шатание. Ничего плохого от стандартизации не будет.

dedNikifor, почему стандартизация бессмыслена\бесполезна\вредна? Те же самые теги - это стандартизация. Кроме того, просто позор нагружать человека лишними делами, которые может сделать бот.

TarzanASG
Мы это уже проходили, тема абсолютный повтор этой:
http://forum.openstreetmap.org/viewtopic.php?id=9130

Вот еще:
http://forum.openstreetmap.org/viewtopic.php?id=8645
http://forum.openstreetmap.org/viewtopic.php?id=9464

Чтение хотя бы заголовков тем рулит.

chnav, мда. Какой позор. Находятся ещё внутри страны те, кто “шакалят” у иностранных посольств люди, которые выступают против ё - в Википедии бы быстро на место поставили.

да ничего страшного в таких темах нету
может какая-то свежая мысль проскочит
в любом случае можно дать линки на связанные по смыслу темы
либо даже сделать отдельную ветку с изложением устоявшегося мнения сообщества по теме

А я полагаю, это необходимо для РАЗВИТИЯ проекта - чтобы недостатки существующих рендеров не препятствовали расширять OSM новыми данными.

Нет, рендеры такие, какими их создают их авторы.

Полностью согласен. Поэтому и имени такого быть не должна.
То, что это школа, должно быть видно из основного тега, что средняя - из уточняющего, номер - также из уточняющего, а что именно с углубленным изучением какого-либо предмета - из description. Тегу name для объектов, не имеющих собственного имени, делать нечего.

Ткнет мышкой и получит дополнительную информацию об объекте (т.е. из уточныющих тегов, description, а также о web-сайтах, времени работы и пр.

Изготовление костылей под недостатки и ошибки существующих рендеров сильно мешает как изгтовлению новых более совершенных рендеров, так и совершенствованию существующих, т.к. как только в рендере появляется какая-либо новая технология, она сразу вступает в конфликт с имеющимися костылями.

Слава Б-гу, тут не википедия. Более того, у OSM совсем другой принцип. В отличие от википедии, OSM это один большой сплошной ОРИСС. В OSM мапят то что видят. Править что-то, не имея никакого представления как оно обстоит в действительности ( на местности) - моветон.

Если есть желание ставить кого-то на место, может лучше отправиться обратно, в педивикию википедию?

Идея же о том, что всюду писать с ё грамотно - это болезнь, мания.

Неочевидно.
В КЛАДР, например, принципиально без ё. Как только вводим ё, получаем проблемы с КЛАДРОМ.

Вопрос на засыпку: предлагаемая стандартизация" предполагает исключительно введение новых тегов или хотя бы иногда их замену либо удаление?
Если второе - то будучи проведенной ботом такая “стандартизация” неизбежно приведет к потере или искажению информации.

Есть такой принцип: Внося свою лепту, не выноси чужую. Та стандартизация, которую бот в состоянии произвести, ботами делается (например, проставление новых тегов). А та, которая подразумевает изменение существующих тегов, ботом делаться не должна.

andriano, ну вот, под КЛАДР подстраиваться. Пусть будет какой-нибудь cladr:name и там будет без ё.

Расстановка веб-сайтов, которую я предлагаю - это как раз добавление новых тегов. Относительно школ можно, во-первых, не трогать то, где будут искажения информации, а, во-вторых, можно переместить информацию из текущего тега в какой-нибудь old_tag_name. Разве нельзя так?

Уже.
Но заметь, не ВМЕСТО того, что было в name, а именно новый тег cladr:name.

А какой в этом смысл?
И в какие теги перемещать информацию после второй, третьей, десятой правки? Тут каждые полгода появляется кто-то с идеями глобальной автоматизированной правки.

А смысл тот же - в стандартизации содержимого тега name.

Еще раз по буквам: И М Я С О Б С Т В Е Н Н О Е Н Е Д О П У С К А Е Т С Т А Н Д А Р Т И З А Ц И И.
А если уж очень хочется, то введи какой-нибудь standard_name и на нем упражняйся.

Допускает. Можно разобраться с пробелом между знаком номера и цифрой. Это и есть стандартизация.

считаю что в идеале отображения базы и её внутренний формат должны развиваться параллельно
искать кто важнее - курица или яйцо, по-моему, в данном случае не стоит
появилась какая-то новая возможность в рендерерах - можно скорректировать под неё данные
придумали новую форму хранения в базе - можно улучшить рендер для поддержки
ведь ни база без рендера, ни рендер без базы никому не нужны

мдя. почитал темы по ссылкам
не всё так просто как хотелось бы
но вывод в пределах данной темы, по-моему, очевиден:
нельзя давать боту задания без предварительного обсуждения с сообществом

Разобраться с пробелом, конечно, можно, только причем здесь тег name?
Здесь, правда, снова возникает множество вопросов:

  • а что делать, если перед цифрами нет никакого “номера”? Проставлять?
  • а может, вообще этот номер нужно отовсюду убирать?
  • а как быть с No? Тем более, что №, насколько мне известно, отнюдь не является интернациональным знаком.

Для ботов есть вполне приемлемое поле деятельности: диагностика предполагаемых ошибок с выдачей нужного сообщения (например, построение карты ошибок) но без принятия решения на исправление.

А проблема курицы и яйца решена раз и навсегда: данные - одни, а рендеров столько, сколько угодно. Данные безусловно первичны, а какой рендер популярнее, даже узнать проблематично. Я, например, считаю, что навителовский (т.е. тот, что встроен в программу Навител-навигатор), - можешь опровергнуть?
Причем для подавляющего большинства рендеров нет задачи показать ВСЕ данные, которые присутствуют в OSM. Каждый выбирает из них лишь то, что конкретно ему нужно.
Соответственно, никакого “скорректировать под неё данные”.
База должна развивиаться в своем направлении, не смотря ни на какие рендеры (котоых намного больше, чем ты можешь себе представить), а рендеры - использовать базу на свое усмотрение.

А тезис “база без рендера, ни рендер без базы никому не нужны” явно ошибочен.
Мне, например, нужна ТОЛЬКО база, т.к.:

  • я использую собственный ренедер, соответственно, ни один из “стандартных” мне не нужен.
  • я использую базу просто для поиска - даже без рендера.

так это не проблема - name не интернационален

подкину ещё одну проблемку для размышления (довольно глобальную):
есть город, часть населения которого говорит на одном языке, часть - на другом
соответственно, общеупотребимых вариантов названий тех же улиц два - по одному на каждый язык
возникает вопрос - какую систему нужно создать чтобы каждый житель города мог пользоваться картой с наименованиями на более подходящем ему языке?

да, согласен, очень важная задача
но нет места, куда бы можно было централизованно выгружать результаты
да и вобще, нет какой-то либо хорошо организованной системы по работе с ошибками
(из тех что видел - больше всего нравится OSM Inspector)

в обоих указанных случаях рендерер есть, пусть даже и не стандартный/не популярный

но ведь формат записи данных со временем то меняется, что вполне логично - система развивается
и для такого развития вполне можно использовать знания, полученные от пользователей и разработчиков рендерера

Как раз решение этой проблемы в OSM существует.
И отсюда, кстати, следует, что рендер должен быть настраиваемым под пользователя, а не просто отображающим то, что нарисовал создатель.

У OSM есть масса проблем, причем как общих для всего СПО, так и уникальных.
Но практика показывает, что ни одна из них не решается кавалеристским ударом.

Это как раз не проблема нисколько.

Для хранения различных наименований есть не только тэги «name» (и подобные), но еще и «name:языковой_код». Ничто не мешает завести название на обоих языках (да хоть вообще на всех языках мира плюс на множестве искусственных языков). И делать два варианта карты через различные настройки рендерера — а пользователь пусть качает/смотрит тот вариант, который ему понятнее.

хотелось бы его увидеть
из того что первое приходят в голову - отказ от чистого name тега
(и, возможно, какая-то затычка, позволяющая в переходной период определять локальный язык для визуализации глобальной карты)

какова тогда судьба name тега?

не совсем понял как это относится к работе с ошибками, ну да ладно
с общей мыслью согласен - если бы всё было просто, проблему бы уже давно решили

топик-стартер, по ходу, не читатель. Зато писатель - “тот ещё”. Вон сколько пишет …