Работа для бота (требуется помощь ботоводов)

Аккуратней нужно с ботами. А уж лепить их для всяких частных задач, которые с лёгкостью решаются вульгарным поиском-заменой в JOSM’е и вовсе излишне.

P.S. Опрямоуголивать здания в автоматическом режиме категорически не нужно. Непрямоугольные здания встречаются достаточно часто. Тот же JOSM прекрасно опрямогуголит всё, что укажете, без всяких ботов.

Kuprienko_Viktor, до JOSM ещё не дошёл. Мне бы Potlatch до конца освоить. :slight_smile:

А это в official_name и тоже стандартизировать.

Ненене, лучше сразу забудьте названия стандартизировать. (ботом, по крайней мере)

Почему? Никаких негативных последствий я не вижу. Бот как раз для этого подошёл бы. Вручную огромные объемы информации не перелопатишь - это слишком жестоко не жалеть людей и не облегчать их труд.

И кстати, почему нужен пробел перед номером школы?

official_name для школ можно достать, но нужно понимать, что оно часто кривое и не подчиняется разумным стандартам. Например:

Государственное образовательное учреждение центр образования N1311 “Тхия” (ГОУ ЦО N1311)
Государственное бюджетное образовательное учреждение средняя общеобразовательная школа N2049 (ГБОУ СОШ N2049)

Я тоже поддержу. Официальные названия часто очень забористые и не подходят для отрисовки на карте. Например, Екатеринбургский музей изобразительных искусств это официально Муниципальное учреждение культуры “Екатеринбургский музей изобразительных искусств” или МУК “Екатеринбургский музей изобразительных искусств”. А вот “Музей изобразительных искусств” на карте Екатеринбурга выглядит вполне подходящим решением.

Бросай лучше этот Potlatch, он до добра не доведет :slight_smile:

В official_name “пойдет Муниципальная средняя общеобразовательная школа №10 с углубленным изучением истории Гражданской войны имени В.И. Чапаева”. А в name — общеупотребительные названия: средняя школа, начальная школа, лицей, гимназия, специальная школа, интернат и т.п.

По поводу остального:

Баба яга против. По-хорошему, нужно держать два имени: простое (без Ё) и точное (с Ё и ударениями). Есть name и name:ru, но это нужно обсуждать.

Расставить можно что угодно, куда угодно. Кто это потом будет поддерживать? До тех пор пока никто не сделает рабочий механизм поддержания актуальности, не важно технический или организационный, не нужно превращать OSM в 2GIS.

Ни в коем случае. Иначе потом будете восстанавливать непрямоугольные здания руками.

Скорее всего лицензия не позволит.

В общем, ботов на всю страну нужно применять очень аккуратно. Гораздо лучше собирать best practices где-нибудь в одном месте. Например, в вики.

с ботами надо обращаться очень осторожно
в той же вики то и дело проходят бредовые задания для ботов
тут же тем более комьюнити не уследит

по конкретным предложениям - все плохи
к примеру, сайты - то вобще спам. и как правильно Kaylee заметил - уже изначально неактуальный

так может с этого и стоит начать?
а то ж какой-то ботовод может и пойти реализовывать эти предложения :confused:
разгребать потом ещё…

Название как имя собственное принципиально е поддается стандартизации.
Проблема лишь в том, что нередко в поле name пихают все, что попало. Ну так здесь надо освобождать name от всего лишнего. Но сделать это, увы. можно лишь ручками.

В общем, попытка натравливать бота на тег name - вандализм по определению.

к сожалению, без визуализации от базы толку ноль
поэтому необходимо ориентироваться и на рендереры
если, к примеру, на карте видно что это озеро, то писать слово “озеро” в названии не обязательно
но если же на карте посреди квартала стоит “№5”, то это никуда не годится
хоть там даже и корректный тег amenity стоит

по хорошему, надо было бы и от “улица”, “переулок”, “площадь” поизбавляться
но я так понял, на данном этапе развития, проект к этому не готов
тут бы с многоязычностью разобраться…

Это ошибочное суждение.
Собственно, в OSM принято придерживаться принципа “Не рисуйте под рендер”, и прежде, чем призывать к обратному, следовало бы хотя бы попытаться понять, а откуда такой принцип взялся, и для чего он нужен.

Очень прошу не баловаться с автоматическими правками и не превращать OSM в информационную помойку. Дом нужно прямоуголить не потому что полигон дома в осм непрямоугольный, а потому что вы знаете, что он в самом деле прямоугольный. Непрямоугольные дома тоже бывают.

Собственно, да.
А так называемую “ёфикацию” тут далеко не все поддерживают :slight_smile: Ее много раз обсуждали, и к единому мнению не пришли.

полагаю, основная причина появления такого принципа - перфекционизм
данные должны быть ровные, аккуратные, всё разложено по полочкам
при этом рендерер должен это всё умно анализировать и правильно визуализировать
но рендереры есть такие какие они есть
и детальное рассматривание имени “№5” никакой пользы посетителю ресурса не принесёт
он не догадается - больница это, школа или ещё что-то
просто уйдёт с ресурса и всё
хотя данные будут максимально корректны
в аменити будет записан тип, в имени - всё остальное
(это лишь один пример, может не идеально корректный, уверен можно найти ещё)

отпишусь и я… )

как можно увидеть, за “стандартизацию” ОСМ выступают ОСМеры, пришедшие в проект (по крайней мере на форум) в последние 2-3 месяца
для таких “новичков” это нормальная стадия :slight_smile:
все проходили через желание сделать все “под одну гребенку” и со временем бОльшая часть поняла, что это бессмысленно\бесполезно\вредно

т.е. я советую не спешить с попыткой расставить теги типа website=* или operator=*
ведь могут быть магазины\аптеки имеющие такое же название, как у крупной федеральной сети, но не имеющие к ней никакого отношения

короче, не спешите ломать дрова :wink:

лично мне было достаточно один раз хорошо подумать над актуализацией
это относится и к сайтам и к мусорным корзинам/деревцам/etc
внести то можно, но если никто не будет за этим всем следить, то очень быстро эта информация станет неверна
это улицы с домиками стоят довольно долго
а всякие гаражи/киоски могут пропадать и появляться относительно быстро
// может немного не в тему, просто мысли вслух
// немного обобщу: идеальным данным нужна идеальная поддержка

Но с другой стороны мы имеем полный разброд даже в близко расположенных объектах … хотел привести к единому виду церкви в городе и увидел, что применены все N! вариаций как это можно сделать … Как раз не причёсывая (я за Ёфикацию) данные мы получим помойку так как рендер должен быть шибко умный чтобы распознавать все комбинации атрибутов.

Может быть это должны быть и не боты в духе Википедии, но какие-то автоматизирированые тулы а-ля валидаторы …

P.S. А реально ли принципиально писать СШ №15 или Школа №15? Вряд-ли кто-то будет пользоваться OSM чтобы найти ближайшую школу для 14-летнего своего чада … А официальные названия нужны для документов, там она и именуется как юридическое лицо “Муниципальное общеобразовательное учреждение средняя общеобразовательная школа № 15”.

Как только карты от OSM начнут активно использовать всякие “местечковые” сайты “идеальная” поддержка будет гарантирована. Собственно, уже начинают использовать, ибо карты многих городов вполне полноценны, а движок удобней того растрового убожества, что было популярно десяток лет назад.

Возможно надо начать с “пр-т”, “Ул.”, “пл.” и т.п., да и привести наименования улиц в соответствие с нормами русского языка не мешало бы - работа как раз для бота.

Нет, причина другая.

Ваша ошибка в том, что вы считаете, будто рендерер на главной странице проекта — самый лучший, самый официальный, эталонный.
На самом деле данными OSM пользуются множество самых разнообразных визуализаторов и конвертеров, и все они одинаково важны. Подстраивая данные в угоду рендереру на странице OSM, мы тем самым искажаем данные для других рендереров и ухудшаем пригодность данных в общем случае.
Вот именно отсюда появилось правило “Не рисуйте под рендер”. Данные отдельно, обработка данных отдельно.

Так ведь цель OSM — не набор популярности. А сбор и обработка картографических данных в том виде, в каком они требуются участникам проекта.

почему обязательно “искажаем и ухудшаем”?
ведь анализируя визуализацию вполне можно найти более подходящий способ организации данных

вот именно, делается не база ради базы
конечная цель - предоставление качественного сервиса пользователю
и если для этого прийдётся немного отойти от идеальной модели, то что ж…

даже если я так и считаю, это не важно
главное то, какое количество юзеров им пользуется
у меня нет статистики, но если данные отображаются некорректно у 80% посетителей, то это явный повод что-то менять
вполне возможно, что неправ рендерер, но точно так же возможно что некорректно структурированы данные (что в свою очередь мешает рендереру правильно их отобразить)