Как придумать игровой способ сбора и обновления ПОИ на ОСМ

Ага, даёт за 15M$.

Вот эстонсике домики - для меня пример хорошей игры.
Кликай, соревнуйся, делай полезное дело.

http://habrahabr.ru/post/211430/#comment_7280484

потестировал АПИ Foursquare. Инфы много, по популярным категориям (типа кафе, рестораны) мусора мало

Для бесплатной версии есть ограничения в 5000 запросов. И число результатов на bbox 100 штук.

Координаты точек плохие. Смотрел на карте ОСМ на Москву. Но названия в основном совпадают. если матчить по названию+ГЕО (радиус от точки), то можно привязать.

Если протолкнуть концепцию, что засчет ОСМ форсквэр улучшает привязку объектов, а ОСМ получает контактную информацию, то, думаю, улучшить ПОИ ОСМ можно значительно

В фосквэа координаты очень плохие, бывает, что точка рисуется с другой стороны улицы (например, Мясницкой).

Вот валидатор бы на его основе… Кстати, там можно смотреть по последним чекинам - если их нет, скажем, месяц, то точка закрыта (хотя у них она и отображается как действующая)

тут обсуждаем тему текущего поста :slight_smile:

http://forum.openstreetmap.org/viewtopic.php?pid=400885#p400885

Tasheal, мне кажется в вашем проекте вы пытаетесь совместить 4 вещи: маппинг - рисование объектов, валидация/проверка объектов, игра (конкурс) и возможно - плата за работу.

Маппинг значительно более удобен в josm и других уже готовых редакторах и сделать что-то лучшее будет очень сложно.

С проверкой - есть валидаторы. Но они охватывают незначительную (но важную) часть данных OSM. И мне кажется, что тут есть поле для работы. Ещё нужно определить для каждого объекта время повторной проверки (дорога/дом быстро никуда не денется в отличии от небольшого магазина). И как-то надо защитится от удаления объектов и повторного их рисования (что бы повторно их проверить и снова получить много баллов). И потом рекурсия - нужно проверить загруженные фотографии.

И ещё вопрос: на сколько такие конкурсы дают увеличение количества данных и их качество? Может быть лучше нанять несколько человек, которые будут сидеть и целенаправленно рисовать (хотя наверное не стоит в отрытую этого делать - возможно будет демотивировать обычных мапперов)?

Эх если бы мне ещё и платили за моё хобби… :roll_eyes:

Модераторы, может перенесете из добро пожаловать - сюда?

Я так понимаю у Tasheal сейчас один не решенный вопрос - кто возьмется за работу?

помогай найти кто поможет создать это

да. Мне нужен тот кто опишет ТЗ, на форуме оценим ТЗ, оценим проект и в путь.

взять https://github.com/kort/kort (play.kort.ch с телефона) и добавить фишками)

Требуется человек разбирающийся в Leaflet, MapBox или Polymaps.
пишите: мой ник нейм @gmail.com

При ручном составлении базы данных ПОИ нужно много человеко-часов. Причём, с учётом необходимости актуализации, эти человеко-часы нужны не однократно, а постоянно.

Число же участников ОСМ вполне определённое и количество человеко-часов, которые они готовы тратить на ведение базы ПОИ, тоже вполне конкретно.

Текущая ситуация такова, что требуемое число человеко-часов на порядки превышает количество доступных человеко-часов. И данная ситуация вряд ли изменится в перспективе.

Сервисы 2ГИС и подобные имеют большое число работников - столько, сколько необходимо для поддержания базы ПОИ в относительно актуальном и полном виде (стоит заметить, впрочем, что полнота и актуальность данных там далеко не идеальная).

Поэтому сейчас есть 2 способа получить и поддерживать такую базу:

  1. За деньги, платя зарплату требуемому числу работников, вручную поддерживающих базу. Подход коммерческих картографических компаний.
  2. Придумать способ, на порядки снижающий количество ручной работы участников проекта. Мотивация владельцев ПОИ нужна, но она, даже при самом лучшем подходе, даст очень небольшую долю ПОИ от их общего количества, то есть не может, без совместного использования с другими методами, решить задачу. Нужна автоматизация для получения информации - а вот это очень сложная задача, хотя и имеются некоторые практические результаты в её решении (автоматическая обработка панорам, получаемых с автомобилей Google Street View). Пока несуществующий подход некоммерческих картографических сообществ.

Поэтому считаю в рамках ОСМа идею развития ручного сбора ПОИ бесперспективной.

Но перспективной совместное использование следующих методов:
а) мотивация владельцев ПОИ поддерживать информацию в актуальном и полном состоянии (привлекая посетителей)
б) автоматический сбор и обработка информации из открытых источников - главным образом, официальных сайтов
в) автоматический сбор информации на основе фото и видео с камер смартфонов, видеорегистраторов автомобилей и других мобильных камер.

Про остальные данные в OSM говорили ровно тоже самое. Однако со временем картина поменялась и качество данных во многих местах стало не хуже коммерческих. Вы подходите с точки зрения самостоятельного решения задачи. А в социальных проектах надо по другому - “создать условия чтобы задачу могли решить массы”, и после этого наблюдать как она постепенно решается сама. Как поступают, к примеру, создатели валидаторов. :slight_smile:

Я бы на это не рассчитывал. Качество сторонних открытых источников обычно ниже плинтуса. Пробовал использовать списки отелей в Родосе с разных туристических сайтов - больше половины данных в этих списках в итоге имели грубые ошибки (неверные координаты, чужие фото, закрывшиеся и т.п.), причём в разных списках разные. Приходится работать детективом чтобы найти крупицы реальной информации в них.

Ну это сразу после решения всех проблем с автоматическим распознаванием образов. Может лет через 30-40. :slight_smile:

Применение для карты с 50% некорректной информации действительно сложно найти.
Но такие ситуации всё же не так часты.

А вот, скажем, если взять и обработать сайты банков, то мы получим почти полный комплект финансовых ПОИ, причём с небольшим количеством ошибок (по моим грубым оценкам, менее 5% ошибок). С учётом того, что карт вообще без ошибок не бывает, для многих целей такой слой будет вполне подходящим. Точнее так: если у нас будет выбор между халявным набором финансовых ПОИ с 5% ошибок и набором финансовых ПОИ с 1% ошибок за миллион рублей, то часто первый вариант будет предпочтительнее. Но нельзя забывать, что есть и другие методы сбора ПОИ, что уменьшает процент ошибок в конечном результате.

А вот набор ПОИ общепита уже так не получишь - у многих кафешек нет никакого официального сайта.

Так что этот способ вполне применим, но только совместно с остальными, повторю.

Примечание: под ошибками выше понимаются неверные теги точки, в действительности несуществующие точки и существующие, но не нанесённые на карту. Конечно, на практике нужно использовать и более детальные характеристики качества карты, чем просто доля ошибочных точек в их фактическом числе.

Да не, сделать можно хоть сейчас. Взять фотку таблички с режимом работы магазина и распознать в FineReader. Результат распарсить несложно, с учётом того, что таблички все очень похожи по содержанию. Результат парсинга - в теги, географические координаты из EXIF фотографии дают саму точку. С учётом того, что есть свободные альтернативы FineReader, хотя и с, отчасти, худшими характеристиками, но решающими задачу распознавания, такую программу для смартфона вполне можно сотворить, причём научных исследований при этом делать не надо, просто сделать программу на основе готовых технологий и библиотек.

Задача вылавливания табличек и вывесок из видеопотока чуть сложнее, но тоже вполне решаемая при использовании существующих технологий. Вот создание термоядерной электростанции без научных исследований на текущий момент невозможно. А описанная выше система - возможна и даже есть практические реализации.

fndoder & Sergey Astakhov, вы оба правы, но надо хотя бы сделать велосипед, а перекрасить всегда успеем . Мне нужен человек, который в теме и знает как спрограммироовать, свободен и готов заработать. Есть у вас такие?

Tasheal
Предложенный способ вовсе нерабочий. И он совсем не игровой. “Приз” получит тупо тот, кто больше вкалывает, никакой игры нет. И заявленный “приз” совсем мелкий. Что-то может выйти, если увеличить число призов и их размер (скажем, до 150 т. р.). Но тут внезапно становится ясно, что устремив число призов к бесконечности, мы приходим к модели коммерческой картографической компании, такой как 2ГИС, например. Что ясно противоречит исходному требованию одного приза.

Уже это делает проект провальным. Но, помимо этого, в заметках к ТЗ есть и множество совсем не мелких технических, а принципиальных ошибок и заблуждений.

Но если всё же есть упрямое желание делать проект вопреки настойчивым предостережениям, рекомендую обратиться на биржи фриланса.

Я еще раз напомню: чтобы какой-то проект был массовым (был бы реально доступен большему числу пользователей, чем относительно квалифицированные пользователи OSM), он должен быть предельно упрощен с точки зрения внесения данных. Про это пока никаких идей не услышал.

пишу

о игровом способе сайта…

Прислушавшись к BushmanK, что интерфейс и функционал должен быть “упрощен с точки зрения внесения данных”, то возникают вопросы:

  • что Именно можно поручить(доверить) одновременно и новичкам, которые могут только сфотографировать “расписание работы заведения”, уточнить номер дома (так как некоторые дома без адреса http://qa.poole.ch/?zoom=12&lat=59.42091&lon=24.78741&layers=TFB0 ), обозвать POI без названия http://gyazo.com/515d16ed5a30849bd9b0e04cce134a1c (с подтверждающем фото [которое имеет гео привязку] - можно и без фото),…?

для последующего экспорта в базу ОСМ?

Нужны ли вообще фотографии:

  • расписание графика работы кафе? или только текстовая инфа?
  • название - вывески предприятий/кафе или достаточно текстом?

  • если да, то куда экспортировать эти фотки?