OpenStreetMap Forum

The Free Wiki World Map

You are not logged in.

Announcement

A fix has been applied to the login system for the forums - if you have trouble logging in please contact support@openstreetmap.org with both your forum username and your OpenStreetMap username so we can make sure your accounts are properly linked.

#1 2010-12-12 08:17:32

TarzanASG
Member
From: Москва
Registered: 2010-09-27
Posts: 492
Website

Работа для бота (требуется помощь ботоводов)

Думаю, неплохо было бы создать тему, аналогичную РДБ в Википедии.

В этой теме должны встречаться люди-ботоводы и люди, которым требуется что-то сделать (ну мало ли, улица сменила название, вот Копейка скоро будет переименована).

Собственно мои предложения (на первый раз):

1) произвести унификацию названий школ и детских садов (судя по Tag:amenity=school стандартом является "Школа №5", т.е. с большой буквы и без пробела между знаком номера и цифрой)
2) ёфицировать "Пятёрочка", "Перекрёсток"
3) расставить веб-сайты по магазинам и аптекам
4) в автоматическом порядке опрямоуголить кривые почти прямоугольные здания, если это, конечно, вообще возможно
5) если возможно, загрузить в OSM информацию из http://www.gdeetotdom.ru/map/ с сериями домов, годами постройки и количеством этажей

Теперь самое главное. Здесь водятся ботоводы, которые это бы смогли сделать?

Last edited by TarzanASG (2010-12-12 09:04:13)


Знаю OSM с 2007, присоединился в 2009. Одним из первых начал популяризировать OSM.
Поддержите Викиданные, Wikivoyage, Creative Commons, Викисклад!

Offline

#2 2010-12-12 08:50:13

Ilis
Member
From: Екатеринбург
Registered: 2009-05-24
Posts: 5,970

Re: Работа для бота (требуется помощь ботоводов)

TarzanASG wrote:

1) произвести унификацию названий школ и детских садов (судя по Tag:amenity=school стандартом является "Школа №5", т.е. с большой буквы и без пробела между знаком номера и цифрой)

Надо сначала руки оторвать тому, кто пробел перед номером удалил! (Я сейчас вернул обратно)

Кроме того, можно встретить "Средняя школа", "СОШ" и т. п., не сказать чтобы неправильные, названия.

По поводу ё-фикации Пятёрочек согласен, у нас в области раз в месяц ё-фицирую их, до кучи переделывая супермаркеты на конвиньенсы.

Offline

#3 2010-12-12 08:52:34

Kuprienko_Viktor
Member
From: Apatity
Registered: 2009-08-31
Posts: 238

Re: Работа для бота (требуется помощь ботоводов)

Аккуратней нужно с ботами. А уж лепить их для всяких частных задач, которые с лёгкостью решаются вульгарным поиском-заменой в JOSM'е и вовсе излишне.

P.S. Опрямоуголивать здания в автоматическом режиме категорически не нужно. Непрямоугольные здания встречаются достаточно часто. Тот же JOSM прекрасно  опрямогуголит всё, что укажете, без всяких ботов.

Offline

#4 2010-12-12 09:03:18

TarzanASG
Member
From: Москва
Registered: 2010-09-27
Posts: 492
Website

Re: Работа для бота (требуется помощь ботоводов)

Kuprienko_Viktor, до JOSM ещё не дошёл. Мне бы Potlatch до конца освоить. smile

Ilis wrote:

Кроме того, можно встретить "Средняя школа", "СОШ" и т. п., не сказать чтобы неправильные, названия.

А это в official_name и тоже стандартизировать.

Last edited by TarzanASG (2010-12-12 09:12:32)


Знаю OSM с 2007, присоединился в 2009. Одним из первых начал популяризировать OSM.
Поддержите Викиданные, Wikivoyage, Creative Commons, Викисклад!

Offline

#5 2010-12-12 09:10:51

Ilis
Member
From: Екатеринбург
Registered: 2009-05-24
Posts: 5,970

Re: Работа для бота (требуется помощь ботоводов)

TarzanASG wrote:
Ilis wrote:

Кроме того, можно встретить "Средняя школа", "СОШ" и т. п., не сказать чтобы неправильные, названия.

А это в official_name и тоже стандартизировать.

Ненене, лучше сразу забудьте названия стандартизировать. (ботом, по крайней мере)

Last edited by Ilis (2010-12-12 09:11:17)

Offline

#6 2010-12-12 09:14:48

TarzanASG
Member
From: Москва
Registered: 2010-09-27
Posts: 492
Website

Re: Работа для бота (требуется помощь ботоводов)

Почему? Никаких негативных последствий я не вижу. Бот как раз для этого подошёл бы. Вручную огромные объемы информации не перелопатишь - это слишком жестоко не жалеть людей и не облегчать их труд.

И кстати, почему нужен пробел перед номером школы?

Last edited by TarzanASG (2010-12-12 09:36:48)


Знаю OSM с 2007, присоединился в 2009. Одним из первых начал популяризировать OSM.
Поддержите Викиданные, Wikivoyage, Creative Commons, Викисклад!

Offline

#7 2010-12-12 09:40:39

Alexandr Zeinalov
Member
From: New-Peredelkino, Moscow, RU
Registered: 2009-08-26
Posts: 1,636
Website

Re: Работа для бота (требуется помощь ботоводов)

official_name для школ можно достать, но нужно понимать, что оно часто кривое и не подчиняется разумным стандартам. Например:

Государственное образовательное учреждение центр образования N1311 "Тхия" (ГОУ ЦО N1311)
Государственное бюджетное образовательное учреждение средняя общеобразовательная школа N2049 (ГБОУ СОШ N2049)

Offline

#8 2010-12-12 09:56:50

fserges
Member
From: St.Petersburg/Russia
Registered: 2010-11-08
Posts: 3,658

Re: Работа для бота (требуется помощь ботоводов)

Я тоже поддержу. Официальные названия часто очень забористые и не подходят для отрисовки на карте. Например, Екатеринбургский музей изобразительных искусств это официально     Муниципальное учреждение культуры "Екатеринбургский музей изобразительных искусств" или МУК "Екатеринбургский музей изобразительных искусств". А вот "Музей изобразительных искусств" на карте Екатеринбурга выглядит вполне подходящим решением.

Offline

#9 2010-12-12 10:26:49

Kaylee
Member
Registered: 2010-02-17
Posts: 66
Website

Re: Работа для бота (требуется помощь ботоводов)

TarzanASG wrote:

Kuprienko_Viktor, до JOSM ещё не дошёл. Мне бы Potlatch до конца освоить. smile

Бросай лучше этот Potlatch, он до добра не доведет smile

TarzanASG wrote:

А это в official_name и тоже стандартизировать.

В official_name "пойдет Муниципальная средняя общеобразовательная школа №10 с углубленным изучением истории Гражданской войны имени В.И. Чапаева". А в name — общеупотребительные названия: средняя школа, начальная школа, лицей, гимназия, специальная школа, интернат и т.п.


По поводу остального:

TarzanASG wrote:

2) ёфицировать "Пятёрочка", "Перекрёсток"

Баба яга против. По-хорошему, нужно держать два имени: простое (без Ё) и точное (с Ё и ударениями). Есть name и name:ru, но это нужно обсуждать.

TarzanASG wrote:

3) расставить веб-сайты по магазинам и аптекам

Расставить можно что угодно, куда угодно. Кто это потом будет поддерживать? До тех пор пока никто не сделает рабочий механизм поддержания актуальности, не важно технический или организационный, не нужно превращать OSM в 2GIS.

TarzanASG wrote:

4) в автоматическом порядке опрямоуголить кривые почти прямоугольные здания, если это, конечно, вообще возможно

Ни в коем случае. Иначе потом будете восстанавливать непрямоугольные здания руками.

TarzanASG wrote:

5) если возможно, загрузить в OSM информацию из http://www.gdeetotdom.ru/map/ с сериями домов, годами постройки и количеством этажей

Скорее всего лицензия не позволит.

В общем, ботов на всю страну нужно применять очень аккуратно. Гораздо лучше собирать best practices где-нибудь в одном месте. Например, в вики.


OSM digest — свежие новости из мира OpenStreetMap.

Offline

#10 2010-12-12 10:42:20

Vort
Member
Registered: 2010-11-29
Posts: 466

Re: Работа для бота (требуется помощь ботоводов)

с ботами надо обращаться очень осторожно
в той же вики то и дело проходят бредовые задания для ботов
тут же тем более комьюнити не уследит

по конкретным предложениям - все плохи
к примеру, сайты - то вобще спам. и как правильно Kaylee заметил - уже изначально неактуальный

TarzanASG wrote:

... до JOSM ещё не дошёл. Мне бы Potlatch до конца освоить. smile...

так может с этого и стоит начать?
а то ж какой-то ботовод может и пойти реализовывать эти предложения hmm
разгребать потом ещё...

Last edited by Vort (2010-12-12 10:44:58)

Offline

#11 2010-12-12 10:51:49

andriano
Member
Registered: 2009-06-15
Posts: 1,667

Re: Работа для бота (требуется помощь ботоводов)

TarzanASG wrote:

Почему? Никаких негативных последствий я не вижу. Бот как раз для этого подошёл бы. Вручную огромные объемы информации не перелопатишь - это слишком жестоко не жалеть людей и не облегчать их труд.

И кстати, почему нужен пробел перед номером школы?

Название как имя собственное принципиально е поддается стандартизации.
Проблема лишь в том, что нередко в поле  name пихают все, что попало. Ну так здесь надо освобождать name от всего лишнего. Но сделать это, увы. можно лишь ручками.

В общем, попытка натравливать бота на тег name - вандализм по определению.

Offline

#12 2010-12-12 10:54:34

Vort
Member
Registered: 2010-11-29
Posts: 466

Re: Работа для бота (требуется помощь ботоводов)

andriano wrote:

здесь надо освобождать name от всего лишнего

к сожалению, без визуализации от базы толку ноль
поэтому необходимо ориентироваться и на рендереры
если, к примеру, на карте видно что это озеро, то писать слово "озеро" в названии не обязательно
но если же на карте посреди квартала стоит "№5", то это никуда не годится
хоть там даже и корректный тег amenity стоит
---
по хорошему, надо было бы и от "улица", "переулок", "площадь" поизбавляться
но я так понял, на данном этапе развития, проект к этому не готов
тут бы с многоязычностью разобраться...

Last edited by Vort (2010-12-12 10:56:29)

Offline

#13 2010-12-12 11:02:22

andriano
Member
Registered: 2009-06-15
Posts: 1,667

Re: Работа для бота (требуется помощь ботоводов)

Vort wrote:

поэтому необходимо ориентироваться и на рендереры

Это ошибочное суждение.
Собственно, в OSM принято придерживаться принципа "Не рисуйте под рендер", и прежде, чем призывать к обратному, следовало бы хотя бы попытаться понять, а откуда такой принцип взялся, и для чего он нужен.

Offline

#14 2010-12-12 11:09:11

Zkir
Member
From: Хрустальная Москва
Registered: 2009-02-21
Posts: 6,071

Re: Работа для бота (требуется помощь ботоводов)

Очень прошу не баловаться с автоматическими правками и не превращать OSM в информационную помойку.  Дом нужно прямоуголить не потому что _полигон дома в осм_ непрямоугольный, а потому что вы _знаете_, что он в самом деле прямоугольный. Непрямоугольные дома тоже бывают.

по конкретным предложениям - все плохи
к примеру, сайты - то вобще спам. и как правильно Kaylee заметил - уже изначально неактуальный

Собственно, да.
А так называемую "ёфикацию" тут  далеко не все поддерживают smile Ее много раз обсуждали, и к единому мнению не пришли.

Last edited by Zkir (2010-12-12 13:27:57)


Обсуждение концепции форума -- De Constantia Sapientis --  De Vita Beata -- Apocolocyntosis divi Claudii *

Offline

#15 2010-12-12 11:21:16

Vort
Member
Registered: 2010-11-29
Posts: 466

Re: Работа для бота (требуется помощь ботоводов)

andriano wrote:

Это ошибочное суждение.
Собственно, в OSM принято придерживаться принципа "Не рисуйте под рендер", и прежде, чем призывать к обратному, следовало бы хотя бы попытаться понять, а откуда такой принцип взялся, и для чего он нужен.

полагаю, основная причина появления такого принципа - перфекционизм
данные должны быть ровные, аккуратные, всё разложено по полочкам
при этом рендерер должен это всё умно анализировать и правильно визуализировать
но рендереры есть такие какие они есть
и детальное рассматривание имени "№5" никакой пользы посетителю ресурса не принесёт
он не догадается - больница это, школа или ещё что-то
просто уйдёт с ресурса и всё
хотя данные будут максимально корректны
в аменити будет записан тип, в имени - всё остальное
(это лишь один пример, может не идеально корректный, уверен можно найти ещё)

Offline

#16 2010-12-12 11:32:10

dedNikifor
Member
From: Свердловская обл.
Registered: 2009-09-11
Posts: 3,414

Re: Работа для бота (требуется помощь ботоводов)

отпишусь и я.. )

как можно увидеть, за "стандартизацию" ОСМ выступают ОСМеры, пришедшие в проект (по крайней мере на форум) в последние 2-3 месяца
для таких "новичков" это нормальная стадия smile
все проходили через желание сделать все "под одну гребенку" и со временем бОльшая часть поняла, что это бессмысленно\бесполезно\вредно

т.е. я советую не спешить с попыткой расставить теги типа website=* или operator=*
ведь могут быть магазины\аптеки имеющие такое же название, как у крупной федеральной сети, но не имеющие к ней никакого отношения


короче, не спешите ломать дрова wink


Графическая (в виде карты с точками опасных объектов) база спидкамов для разных навигационных программ. Подложка OSM присутствует

Offline

#17 2010-12-12 11:36:44

Vort
Member
Registered: 2010-11-29
Posts: 466

Re: Работа для бота (требуется помощь ботоводов)

dedNikifor wrote:

для таких "новичков" это нормальная стадия smile

лично мне было достаточно один раз хорошо подумать над актуализацией
это относится и к сайтам и к мусорным корзинам/деревцам/etc
внести то можно, но если никто не будет за этим всем следить, то очень быстро эта информация станет неверна
это улицы с домиками стоят довольно долго
а всякие гаражи/киоски могут пропадать и появляться относительно быстро
// может немного не в тему, просто мысли вслух
// немного обобщу: идеальным данным нужна идеальная поддержка

Last edited by Vort (2010-12-12 11:38:05)

Offline

#18 2010-12-12 12:04:45

fserges
Member
From: St.Petersburg/Russia
Registered: 2010-11-08
Posts: 3,658

Re: Работа для бота (требуется помощь ботоводов)

Но с другой стороны мы имеем полный разброд даже в близко расположенных объектах ... хотел привести к единому виду церкви в городе и увидел, что применены все N! вариаций как это можно сделать ... Как раз не причёсывая (я за Ёфикацию) данные мы получим помойку так как рендер должен быть шибко умный чтобы распознавать все комбинации атрибутов.

Может быть это должны быть и не боты в духе Википедии, но какие-то автоматизирированые тулы а-ля валидаторы ...

P.S. А реально ли принципиально писать СШ №15 или Школа №15? Вряд-ли кто-то будет пользоваться OSM чтобы найти ближайшую школу для 14-летнего своего чада ... А официальные названия нужны для документов, там она и именуется как юридическое лицо "Муниципальное общеобразовательное учреждение средняя общеобразовательная школа № 15".

Offline

#19 2010-12-12 12:11:10

Kuprienko_Viktor
Member
From: Apatity
Registered: 2009-08-31
Posts: 238

Re: Работа для бота (требуется помощь ботоводов)

Vort wrote:

...
// немного обобщу: идеальным данным нужна идеальная поддержка

Как только карты от OSM начнут активно использовать всякие "местечковые" сайты "идеальная" поддержка будет гарантирована. Собственно, уже начинают использовать, ибо карты многих городов вполне полноценны, а движок удобней того растрового убожества, что было популярно десяток лет назад.

Offline

#20 2010-12-12 12:32:45

luiswoo
Member
From: Ростов-на-Дону
Registered: 2010-09-11
Posts: 1,301

Re: Работа для бота (требуется помощь ботоводов)

TarzanASG wrote:

2) ёфицировать "Пятёрочка", "Перекрёсток"

Возможно надо начать с "пр-т", "Ул.", "пл." и т.п., да и привести наименования улиц в соответствие с нормами русского языка не мешало бы - работа как раз для бота.

Offline

#21 2010-12-12 13:15:10

Surly
Member
From: Екатеринбург
Registered: 2009-09-17
Posts: 806

Re: Работа для бота (требуется помощь ботоводов)

Vort wrote:
andriano wrote:

в OSM принято придерживаться принципа "Не рисуйте под рендер", и следовало бы понять, а откуда такой принцип взялся

полагаю, основная причина появления такого принципа - перфекционизм

Нет, причина другая.

Vort wrote:

при этом рендерер должен это всё умно анализировать и правильно визуализировать
но рендереры есть такие какие они есть

Ваша ошибка в том, что вы считаете, будто рендерер на главной странице проекта — самый лучший, самый официальный, эталонный.
На самом деле данными OSM пользуются множество самых разнообразных визуализаторов и конвертеров, и все они одинаково важны. Подстраивая данные в угоду рендереру на странице OSM, мы тем самым искажаем данные для других рендереров и ухудшаем пригодность данных в общем случае.
Вот именно отсюда появилось правило "Не рисуйте под рендер". Данные отдельно, обработка данных отдельно.

Vort wrote:

он не догадается - больница это, школа или ещё что-то
просто уйдёт с ресурса и всё

Так ведь цель OSM — не набор популярности. А сбор и обработка картографических данных в том виде, в каком они требуются участникам проекта.

Last edited by Surly (2010-12-12 13:17:12)

Offline

#22 2010-12-12 13:19:55

Vort
Member
Registered: 2010-11-29
Posts: 466

Re: Работа для бота (требуется помощь ботоводов)

Surly wrote:

Подстраивая данные в угоду рендереру на странице OSM, мы тем самым искажаем данные для других рендереров и ухудшаем пригодность данных в общем случае.

почему обязательно "искажаем и ухудшаем"?
ведь анализируя визуализацию вполне можно найти более подходящий способ организации данных

Surly wrote:

Так ведь цель OSM — не набор популярности. А сбор и обработка картографических данных в том виде, в каком они требуются участникам проекта.

вот именно, делается не база ради базы
конечная цель - предоставление качественного сервиса пользователю
и если для этого прийдётся немного отойти от идеальной модели, то что ж...

Surly wrote:

Ваша ошибка в том, что вы считаете, будто рендерер на главной странице проекта — самый лучший, самый официальный, эталонный.

даже если я так и считаю, это не важно
главное то, какое количество юзеров им пользуется
у меня нет статистики, но если данные отображаются некорректно у 80% посетителей, то это явный повод что-то менять
вполне возможно, что неправ рендерер, но точно так же возможно что некорректно структурированы данные (что в свою очередь мешает рендереру правильно их отобразить)

Last edited by Vort (2010-12-12 13:30:21)

Offline

#23 2010-12-12 13:54:19

Surly
Member
From: Екатеринбург
Registered: 2009-09-17
Posts: 806

Re: Работа для бота (требуется помощь ботоводов)

Vort wrote:

конечная цель - предоставление качественного сервиса пользователю
и если для этого прийдётся немного отойти от идеальной модели, то что ж...

Для красивого отображения карты на главной web-странице хорошо бы отойти от идеальной модели.
А для качественной карты в навигаторе Garmin — тоже отойти, но чуть-чуть по-другому.
А для навигаторов Навител — отойти еще по-другому.
Для хитрого стороннего online-сервиса хорошо бы чуть отойти от идеальной модели своим, четвертым способом.

Так каким же из четырех способов мы будем отходить от идеальной модели? Которое из перечисленных назначений OSM объявим более приоритетным?

Вот лично мне от проекта OSM нужна карта для навигатора Garmin, причем в пеше-туристском, а не автомобильном стиле. И больше, собственно, ничего. Я могу начать подгонять данные в базе под отображение в навигаторе. Ну, скажем, какой-то тип магазина, который сейчас не попадает в карту, заменять на shop=convienence, чтоб хоть какая-то иконка магазина была. Но если я так буду делать, меня запинают участники OSM, цели у которых иные. И правильно сделают.

Last edited by Surly (2010-12-12 13:59:10)

Offline

#24 2010-12-12 13:58:04

Vort
Member
Registered: 2010-11-29
Posts: 466

Re: Работа для бота (требуется помощь ботоводов)

Surly wrote:

Для красивого отображения карты на главной web-странице хорошо бы отойти от идеальной модели.
А для качественной карты в навигаторе Garmin — тоже отойти, но чуть-чуть по-другому.
А для навигаторов Навител — отойти еще по-другому.
Для хитрого стороннего online-сервиса хорошо бы чуть отойти от идеальной модели своим, четвернтым способом.

редко одна и та же сущность настолько по-разному отображается, что требуются везде корректировки
конфликт возникает лишь тогда, когда корректное отображение одним рендерером ведёт к некорректному отображению другим
если изменение поможет улучшить вид в одном из рендереров, не повлияв негативно на другие и не нарушив логичность внутренней стуктуры базы, то чем же это плохо?

Surly wrote:

Так каким же из четырех способов мы будем отходить от идеальной модели? Которое из перечисленных назначений OSM объявим более приоритетным?

если всё уж настолько коряво отображается, то велика вероятность что проблема не в рендерере, а в данных
и значит необходимо пересмотреть способ хранения конкретных данных
---
как общее решение - попытаться найти компромисс между отображением самым популярным рендерером и внутренней логичностью данных в базе
если удалось - замечательно, если нет - значит пока трогать нельзя (нужно ждать корректировки модели и/или отображения)

Surly wrote:

...скажем, какой-то тип магазина, который сейчас не попадает в карту, заменять на shop=convienence, чтоб хоть какая-то иконка магазина была...

прокомментировал выше
конфликты бывают не всегда
либо бывают настолько незначительны, что ими можно пренебречь - и поставить приоритетом логичность

Last edited by Vort (2010-12-12 14:04:23)

Offline

#25 2010-12-12 15:23:42

Diomas
Member
From: spb.ru
Registered: 2010-09-15
Posts: 354

Re: Работа для бота (требуется помощь ботоводов)

Прямоуголить здания ботами нельзя - вы весь центр питера похерите (а он и так еще не нарисован до конца smile).

Пакетные переименования лучше тоже проводить в рамках района, в котором вы уверены (или имеете возможность проверить). А то натравите пятёрочка-бота на весь шар, а потом из какой-нибудь болгарии на вас пойдут наезды, что, мол, у них Пятёрочка через Е пишется, и это не convenience ни какой, а секс-шоп

Last edited by Diomas (2010-12-12 15:24:11)

Offline

Board footer

Powered by FluxBB