Работа для бота (требуется помощь ботоводов)

Думаю, неплохо было бы создать тему, аналогичную РДБ в Википедии.

В этой теме должны встречаться люди-ботоводы и люди, которым требуется что-то сделать (ну мало ли, улица сменила название, вот Копейка скоро будет переименована).

Собственно мои предложения (на первый раз):

  1. произвести унификацию названий школ и детских садов (судя по Tag:amenity=school стандартом является “Школа №5”, т.е. с большой буквы и без пробела между знаком номера и цифрой)
  2. ёфицировать “Пятёрочка”, “Перекрёсток”
  3. расставить веб-сайты по магазинам и аптекам
  4. в автоматическом порядке опрямоуголить кривые почти прямоугольные здания, если это, конечно, вообще возможно
  5. если возможно, загрузить в OSM информацию из http://www.gdeetotdom.ru/map/ с сериями домов, годами постройки и количеством этажей

Теперь самое главное. Здесь водятся ботоводы, которые это бы смогли сделать?

Надо сначала руки оторвать тому, кто пробел перед номером удалил! (Я сейчас вернул обратно)

Кроме того, можно встретить “Средняя школа”, “СОШ” и т. п., не сказать чтобы неправильные, названия.

По поводу ё-фикации Пятёрочек согласен, у нас в области раз в месяц ё-фицирую их, до кучи переделывая супермаркеты на конвиньенсы.

Аккуратней нужно с ботами. А уж лепить их для всяких частных задач, которые с лёгкостью решаются вульгарным поиском-заменой в JOSM’е и вовсе излишне.

P.S. Опрямоуголивать здания в автоматическом режиме категорически не нужно. Непрямоугольные здания встречаются достаточно часто. Тот же JOSM прекрасно опрямогуголит всё, что укажете, без всяких ботов.

Kuprienko_Viktor, до JOSM ещё не дошёл. Мне бы Potlatch до конца освоить. :slight_smile:

А это в official_name и тоже стандартизировать.

Ненене, лучше сразу забудьте названия стандартизировать. (ботом, по крайней мере)

Почему? Никаких негативных последствий я не вижу. Бот как раз для этого подошёл бы. Вручную огромные объемы информации не перелопатишь - это слишком жестоко не жалеть людей и не облегчать их труд.

И кстати, почему нужен пробел перед номером школы?

official_name для школ можно достать, но нужно понимать, что оно часто кривое и не подчиняется разумным стандартам. Например:

Государственное образовательное учреждение центр образования N1311 “Тхия” (ГОУ ЦО N1311)
Государственное бюджетное образовательное учреждение средняя общеобразовательная школа N2049 (ГБОУ СОШ N2049)

Я тоже поддержу. Официальные названия часто очень забористые и не подходят для отрисовки на карте. Например, Екатеринбургский музей изобразительных искусств это официально Муниципальное учреждение культуры “Екатеринбургский музей изобразительных искусств” или МУК “Екатеринбургский музей изобразительных искусств”. А вот “Музей изобразительных искусств” на карте Екатеринбурга выглядит вполне подходящим решением.

Бросай лучше этот Potlatch, он до добра не доведет :slight_smile:

В official_name “пойдет Муниципальная средняя общеобразовательная школа №10 с углубленным изучением истории Гражданской войны имени В.И. Чапаева”. А в name — общеупотребительные названия: средняя школа, начальная школа, лицей, гимназия, специальная школа, интернат и т.п.

По поводу остального:

Баба яга против. По-хорошему, нужно держать два имени: простое (без Ё) и точное (с Ё и ударениями). Есть name и name:ru, но это нужно обсуждать.

Расставить можно что угодно, куда угодно. Кто это потом будет поддерживать? До тех пор пока никто не сделает рабочий механизм поддержания актуальности, не важно технический или организационный, не нужно превращать OSM в 2GIS.

Ни в коем случае. Иначе потом будете восстанавливать непрямоугольные здания руками.

Скорее всего лицензия не позволит.

В общем, ботов на всю страну нужно применять очень аккуратно. Гораздо лучше собирать best practices где-нибудь в одном месте. Например, в вики.

с ботами надо обращаться очень осторожно
в той же вики то и дело проходят бредовые задания для ботов
тут же тем более комьюнити не уследит

по конкретным предложениям - все плохи
к примеру, сайты - то вобще спам. и как правильно Kaylee заметил - уже изначально неактуальный

так может с этого и стоит начать?
а то ж какой-то ботовод может и пойти реализовывать эти предложения :confused:
разгребать потом ещё…

Название как имя собственное принципиально е поддается стандартизации.
Проблема лишь в том, что нередко в поле name пихают все, что попало. Ну так здесь надо освобождать name от всего лишнего. Но сделать это, увы. можно лишь ручками.

В общем, попытка натравливать бота на тег name - вандализм по определению.

к сожалению, без визуализации от базы толку ноль
поэтому необходимо ориентироваться и на рендереры
если, к примеру, на карте видно что это озеро, то писать слово “озеро” в названии не обязательно
но если же на карте посреди квартала стоит “№5”, то это никуда не годится
хоть там даже и корректный тег amenity стоит

по хорошему, надо было бы и от “улица”, “переулок”, “площадь” поизбавляться
но я так понял, на данном этапе развития, проект к этому не готов
тут бы с многоязычностью разобраться…

Это ошибочное суждение.
Собственно, в OSM принято придерживаться принципа “Не рисуйте под рендер”, и прежде, чем призывать к обратному, следовало бы хотя бы попытаться понять, а откуда такой принцип взялся, и для чего он нужен.

Очень прошу не баловаться с автоматическими правками и не превращать OSM в информационную помойку. Дом нужно прямоуголить не потому что полигон дома в осм непрямоугольный, а потому что вы знаете, что он в самом деле прямоугольный. Непрямоугольные дома тоже бывают.

Собственно, да.
А так называемую “ёфикацию” тут далеко не все поддерживают :slight_smile: Ее много раз обсуждали, и к единому мнению не пришли.

полагаю, основная причина появления такого принципа - перфекционизм
данные должны быть ровные, аккуратные, всё разложено по полочкам
при этом рендерер должен это всё умно анализировать и правильно визуализировать
но рендереры есть такие какие они есть
и детальное рассматривание имени “№5” никакой пользы посетителю ресурса не принесёт
он не догадается - больница это, школа или ещё что-то
просто уйдёт с ресурса и всё
хотя данные будут максимально корректны
в аменити будет записан тип, в имени - всё остальное
(это лишь один пример, может не идеально корректный, уверен можно найти ещё)

отпишусь и я… )

как можно увидеть, за “стандартизацию” ОСМ выступают ОСМеры, пришедшие в проект (по крайней мере на форум) в последние 2-3 месяца
для таких “новичков” это нормальная стадия :slight_smile:
все проходили через желание сделать все “под одну гребенку” и со временем бОльшая часть поняла, что это бессмысленно\бесполезно\вредно

т.е. я советую не спешить с попыткой расставить теги типа website=* или operator=*
ведь могут быть магазины\аптеки имеющие такое же название, как у крупной федеральной сети, но не имеющие к ней никакого отношения

короче, не спешите ломать дрова :wink:

лично мне было достаточно один раз хорошо подумать над актуализацией
это относится и к сайтам и к мусорным корзинам/деревцам/etc
внести то можно, но если никто не будет за этим всем следить, то очень быстро эта информация станет неверна
это улицы с домиками стоят довольно долго
а всякие гаражи/киоски могут пропадать и появляться относительно быстро
// может немного не в тему, просто мысли вслух
// немного обобщу: идеальным данным нужна идеальная поддержка

Но с другой стороны мы имеем полный разброд даже в близко расположенных объектах … хотел привести к единому виду церкви в городе и увидел, что применены все N! вариаций как это можно сделать … Как раз не причёсывая (я за Ёфикацию) данные мы получим помойку так как рендер должен быть шибко умный чтобы распознавать все комбинации атрибутов.

Может быть это должны быть и не боты в духе Википедии, но какие-то автоматизирированые тулы а-ля валидаторы …

P.S. А реально ли принципиально писать СШ №15 или Школа №15? Вряд-ли кто-то будет пользоваться OSM чтобы найти ближайшую школу для 14-летнего своего чада … А официальные названия нужны для документов, там она и именуется как юридическое лицо “Муниципальное общеобразовательное учреждение средняя общеобразовательная школа № 15”.

Как только карты от OSM начнут активно использовать всякие “местечковые” сайты “идеальная” поддержка будет гарантирована. Собственно, уже начинают использовать, ибо карты многих городов вполне полноценны, а движок удобней того растрового убожества, что было популярно десяток лет назад.

Возможно надо начать с “пр-т”, “Ул.”, “пл.” и т.п., да и привести наименования улиц в соответствие с нормами русского языка не мешало бы - работа как раз для бота.