Работа для бота (требуется помощь ботоводов)

с ботами надо обращаться очень осторожно
в той же вики то и дело проходят бредовые задания для ботов
тут же тем более комьюнити не уследит

по конкретным предложениям - все плохи
к примеру, сайты - то вобще спам. и как правильно Kaylee заметил - уже изначально неактуальный

так может с этого и стоит начать?
а то ж какой-то ботовод может и пойти реализовывать эти предложения :confused:
разгребать потом ещё…

Название как имя собственное принципиально е поддается стандартизации.
Проблема лишь в том, что нередко в поле name пихают все, что попало. Ну так здесь надо освобождать name от всего лишнего. Но сделать это, увы. можно лишь ручками.

В общем, попытка натравливать бота на тег name - вандализм по определению.

к сожалению, без визуализации от базы толку ноль
поэтому необходимо ориентироваться и на рендереры
если, к примеру, на карте видно что это озеро, то писать слово “озеро” в названии не обязательно
но если же на карте посреди квартала стоит “№5”, то это никуда не годится
хоть там даже и корректный тег amenity стоит

по хорошему, надо было бы и от “улица”, “переулок”, “площадь” поизбавляться
но я так понял, на данном этапе развития, проект к этому не готов
тут бы с многоязычностью разобраться…

Это ошибочное суждение.
Собственно, в OSM принято придерживаться принципа “Не рисуйте под рендер”, и прежде, чем призывать к обратному, следовало бы хотя бы попытаться понять, а откуда такой принцип взялся, и для чего он нужен.

Очень прошу не баловаться с автоматическими правками и не превращать OSM в информационную помойку. Дом нужно прямоуголить не потому что полигон дома в осм непрямоугольный, а потому что вы знаете, что он в самом деле прямоугольный. Непрямоугольные дома тоже бывают.

Собственно, да.
А так называемую “ёфикацию” тут далеко не все поддерживают :slight_smile: Ее много раз обсуждали, и к единому мнению не пришли.

полагаю, основная причина появления такого принципа - перфекционизм
данные должны быть ровные, аккуратные, всё разложено по полочкам
при этом рендерер должен это всё умно анализировать и правильно визуализировать
но рендереры есть такие какие они есть
и детальное рассматривание имени “№5” никакой пользы посетителю ресурса не принесёт
он не догадается - больница это, школа или ещё что-то
просто уйдёт с ресурса и всё
хотя данные будут максимально корректны
в аменити будет записан тип, в имени - всё остальное
(это лишь один пример, может не идеально корректный, уверен можно найти ещё)

отпишусь и я… )

как можно увидеть, за “стандартизацию” ОСМ выступают ОСМеры, пришедшие в проект (по крайней мере на форум) в последние 2-3 месяца
для таких “новичков” это нормальная стадия :slight_smile:
все проходили через желание сделать все “под одну гребенку” и со временем бОльшая часть поняла, что это бессмысленно\бесполезно\вредно

т.е. я советую не спешить с попыткой расставить теги типа website=* или operator=*
ведь могут быть магазины\аптеки имеющие такое же название, как у крупной федеральной сети, но не имеющие к ней никакого отношения

короче, не спешите ломать дрова :wink:

лично мне было достаточно один раз хорошо подумать над актуализацией
это относится и к сайтам и к мусорным корзинам/деревцам/etc
внести то можно, но если никто не будет за этим всем следить, то очень быстро эта информация станет неверна
это улицы с домиками стоят довольно долго
а всякие гаражи/киоски могут пропадать и появляться относительно быстро
// может немного не в тему, просто мысли вслух
// немного обобщу: идеальным данным нужна идеальная поддержка

Но с другой стороны мы имеем полный разброд даже в близко расположенных объектах … хотел привести к единому виду церкви в городе и увидел, что применены все N! вариаций как это можно сделать … Как раз не причёсывая (я за Ёфикацию) данные мы получим помойку так как рендер должен быть шибко умный чтобы распознавать все комбинации атрибутов.

Может быть это должны быть и не боты в духе Википедии, но какие-то автоматизирированые тулы а-ля валидаторы …

P.S. А реально ли принципиально писать СШ №15 или Школа №15? Вряд-ли кто-то будет пользоваться OSM чтобы найти ближайшую школу для 14-летнего своего чада … А официальные названия нужны для документов, там она и именуется как юридическое лицо “Муниципальное общеобразовательное учреждение средняя общеобразовательная школа № 15”.

Как только карты от OSM начнут активно использовать всякие “местечковые” сайты “идеальная” поддержка будет гарантирована. Собственно, уже начинают использовать, ибо карты многих городов вполне полноценны, а движок удобней того растрового убожества, что было популярно десяток лет назад.

Возможно надо начать с “пр-т”, “Ул.”, “пл.” и т.п., да и привести наименования улиц в соответствие с нормами русского языка не мешало бы - работа как раз для бота.

Нет, причина другая.

Ваша ошибка в том, что вы считаете, будто рендерер на главной странице проекта — самый лучший, самый официальный, эталонный.
На самом деле данными OSM пользуются множество самых разнообразных визуализаторов и конвертеров, и все они одинаково важны. Подстраивая данные в угоду рендереру на странице OSM, мы тем самым искажаем данные для других рендереров и ухудшаем пригодность данных в общем случае.
Вот именно отсюда появилось правило “Не рисуйте под рендер”. Данные отдельно, обработка данных отдельно.

Так ведь цель OSM — не набор популярности. А сбор и обработка картографических данных в том виде, в каком они требуются участникам проекта.

почему обязательно “искажаем и ухудшаем”?
ведь анализируя визуализацию вполне можно найти более подходящий способ организации данных

вот именно, делается не база ради базы
конечная цель - предоставление качественного сервиса пользователю
и если для этого прийдётся немного отойти от идеальной модели, то что ж…

даже если я так и считаю, это не важно
главное то, какое количество юзеров им пользуется
у меня нет статистики, но если данные отображаются некорректно у 80% посетителей, то это явный повод что-то менять
вполне возможно, что неправ рендерер, но точно так же возможно что некорректно структурированы данные (что в свою очередь мешает рендереру правильно их отобразить)

Для красивого отображения карты на главной web-странице хорошо бы отойти от идеальной модели.
А для качественной карты в навигаторе Garmin — тоже отойти, но чуть-чуть по-другому.
А для навигаторов Навител — отойти еще по-другому.
Для хитрого стороннего online-сервиса хорошо бы чуть отойти от идеальной модели своим, четвертым способом.

Так каким же из четырех способов мы будем отходить от идеальной модели? Которое из перечисленных назначений OSM объявим более приоритетным?

Вот лично мне от проекта OSM нужна карта для навигатора Garmin, причем в пеше-туристском, а не автомобильном стиле. И больше, собственно, ничего. Я могу начать подгонять данные в базе под отображение в навигаторе. Ну, скажем, какой-то тип магазина, который сейчас не попадает в карту, заменять на shop=convienence, чтоб хоть какая-то иконка магазина была. Но если я так буду делать, меня запинают участники OSM, цели у которых иные. И правильно сделают.

редко одна и та же сущность настолько по-разному отображается, что требуются везде корректировки
конфликт возникает лишь тогда, когда корректное отображение одним рендерером ведёт к некорректному отображению другим
если изменение поможет улучшить вид в одном из рендереров, не повлияв негативно на другие и не нарушив логичность внутренней стуктуры базы, то чем же это плохо?

если всё уж настолько коряво отображается, то велика вероятность что проблема не в рендерере, а в данных
и значит необходимо пересмотреть способ хранения конкретных данных

как общее решение - попытаться найти компромисс между отображением самым популярным рендерером и внутренней логичностью данных в базе
если удалось - замечательно, если нет - значит пока трогать нельзя (нужно ждать корректировки модели и/или отображения)

прокомментировал выше
конфликты бывают не всегда
либо бывают настолько незначительны, что ими можно пренебречь - и поставить приоритетом логичность

Прямоуголить здания ботами нельзя - вы весь центр питера похерите (а он и так еще не нарисован до конца :)).

Пакетные переименования лучше тоже проводить в рамках района, в котором вы уверены (или имеете возможность проверить). А то натравите пятёрочка-бота на весь шар, а потом из какой-нибудь болгарии на вас пойдут наезды, что, мол, у них Пятёрочка через Е пишется, и это не convenience ни какой, а секс-шоп

Kaylee, не нужно два имени, должно быть правильное имя, т.е. с ё. А вот если поиск без ё не поддерживает, надо его доделывать, но это не повод коверкать названия. И почему веб-сайты надо поддерживать? Один раз поставил и всё. Как будто просто так создан тег website.

Zkir, информационная помойка это скорее сейчас, когда разброд и шатание. Ничего плохого от стандартизации не будет.

dedNikifor, почему стандартизация бессмыслена\бесполезна\вредна? Те же самые теги - это стандартизация. Кроме того, просто позор нагружать человека лишними делами, которые может сделать бот.

TarzanASG
Мы это уже проходили, тема абсолютный повтор этой:
http://forum.openstreetmap.org/viewtopic.php?id=9130

Вот еще:
http://forum.openstreetmap.org/viewtopic.php?id=8645
http://forum.openstreetmap.org/viewtopic.php?id=9464

Чтение хотя бы заголовков тем рулит.

chnav, мда. Какой позор. Находятся ещё внутри страны те, кто “шакалят” у иностранных посольств люди, которые выступают против ё - в Википедии бы быстро на место поставили.

да ничего страшного в таких темах нету
может какая-то свежая мысль проскочит
в любом случае можно дать линки на связанные по смыслу темы
либо даже сделать отдельную ветку с изложением устоявшегося мнения сообщества по теме