Как придумать игровой способ сбора и обновления ПОИ на ОСМ

При ручном составлении базы данных ПОИ нужно много человеко-часов. Причём, с учётом необходимости актуализации, эти человеко-часы нужны не однократно, а постоянно.

Число же участников ОСМ вполне определённое и количество человеко-часов, которые они готовы тратить на ведение базы ПОИ, тоже вполне конкретно.

Текущая ситуация такова, что требуемое число человеко-часов на порядки превышает количество доступных человеко-часов. И данная ситуация вряд ли изменится в перспективе.

Сервисы 2ГИС и подобные имеют большое число работников - столько, сколько необходимо для поддержания базы ПОИ в относительно актуальном и полном виде (стоит заметить, впрочем, что полнота и актуальность данных там далеко не идеальная).

Поэтому сейчас есть 2 способа получить и поддерживать такую базу:

  1. За деньги, платя зарплату требуемому числу работников, вручную поддерживающих базу. Подход коммерческих картографических компаний.
  2. Придумать способ, на порядки снижающий количество ручной работы участников проекта. Мотивация владельцев ПОИ нужна, но она, даже при самом лучшем подходе, даст очень небольшую долю ПОИ от их общего количества, то есть не может, без совместного использования с другими методами, решить задачу. Нужна автоматизация для получения информации - а вот это очень сложная задача, хотя и имеются некоторые практические результаты в её решении (автоматическая обработка панорам, получаемых с автомобилей Google Street View). Пока несуществующий подход некоммерческих картографических сообществ.

Поэтому считаю в рамках ОСМа идею развития ручного сбора ПОИ бесперспективной.

Но перспективной совместное использование следующих методов:
а) мотивация владельцев ПОИ поддерживать информацию в актуальном и полном состоянии (привлекая посетителей)
б) автоматический сбор и обработка информации из открытых источников - главным образом, официальных сайтов
в) автоматический сбор информации на основе фото и видео с камер смартфонов, видеорегистраторов автомобилей и других мобильных камер.

Про остальные данные в OSM говорили ровно тоже самое. Однако со временем картина поменялась и качество данных во многих местах стало не хуже коммерческих. Вы подходите с точки зрения самостоятельного решения задачи. А в социальных проектах надо по другому - “создать условия чтобы задачу могли решить массы”, и после этого наблюдать как она постепенно решается сама. Как поступают, к примеру, создатели валидаторов. :slight_smile:

Я бы на это не рассчитывал. Качество сторонних открытых источников обычно ниже плинтуса. Пробовал использовать списки отелей в Родосе с разных туристических сайтов - больше половины данных в этих списках в итоге имели грубые ошибки (неверные координаты, чужие фото, закрывшиеся и т.п.), причём в разных списках разные. Приходится работать детективом чтобы найти крупицы реальной информации в них.

Ну это сразу после решения всех проблем с автоматическим распознаванием образов. Может лет через 30-40. :slight_smile:

Применение для карты с 50% некорректной информации действительно сложно найти.
Но такие ситуации всё же не так часты.

А вот, скажем, если взять и обработать сайты банков, то мы получим почти полный комплект финансовых ПОИ, причём с небольшим количеством ошибок (по моим грубым оценкам, менее 5% ошибок). С учётом того, что карт вообще без ошибок не бывает, для многих целей такой слой будет вполне подходящим. Точнее так: если у нас будет выбор между халявным набором финансовых ПОИ с 5% ошибок и набором финансовых ПОИ с 1% ошибок за миллион рублей, то часто первый вариант будет предпочтительнее. Но нельзя забывать, что есть и другие методы сбора ПОИ, что уменьшает процент ошибок в конечном результате.

А вот набор ПОИ общепита уже так не получишь - у многих кафешек нет никакого официального сайта.

Так что этот способ вполне применим, но только совместно с остальными, повторю.

Примечание: под ошибками выше понимаются неверные теги точки, в действительности несуществующие точки и существующие, но не нанесённые на карту. Конечно, на практике нужно использовать и более детальные характеристики качества карты, чем просто доля ошибочных точек в их фактическом числе.

Да не, сделать можно хоть сейчас. Взять фотку таблички с режимом работы магазина и распознать в FineReader. Результат распарсить несложно, с учётом того, что таблички все очень похожи по содержанию. Результат парсинга - в теги, географические координаты из EXIF фотографии дают саму точку. С учётом того, что есть свободные альтернативы FineReader, хотя и с, отчасти, худшими характеристиками, но решающими задачу распознавания, такую программу для смартфона вполне можно сотворить, причём научных исследований при этом делать не надо, просто сделать программу на основе готовых технологий и библиотек.

Задача вылавливания табличек и вывесок из видеопотока чуть сложнее, но тоже вполне решаемая при использовании существующих технологий. Вот создание термоядерной электростанции без научных исследований на текущий момент невозможно. А описанная выше система - возможна и даже есть практические реализации.

fndoder & Sergey Astakhov, вы оба правы, но надо хотя бы сделать велосипед, а перекрасить всегда успеем . Мне нужен человек, который в теме и знает как спрограммироовать, свободен и готов заработать. Есть у вас такие?

Tasheal
Предложенный способ вовсе нерабочий. И он совсем не игровой. “Приз” получит тупо тот, кто больше вкалывает, никакой игры нет. И заявленный “приз” совсем мелкий. Что-то может выйти, если увеличить число призов и их размер (скажем, до 150 т. р.). Но тут внезапно становится ясно, что устремив число призов к бесконечности, мы приходим к модели коммерческой картографической компании, такой как 2ГИС, например. Что ясно противоречит исходному требованию одного приза.

Уже это делает проект провальным. Но, помимо этого, в заметках к ТЗ есть и множество совсем не мелких технических, а принципиальных ошибок и заблуждений.

Но если всё же есть упрямое желание делать проект вопреки настойчивым предостережениям, рекомендую обратиться на биржи фриланса.

Я еще раз напомню: чтобы какой-то проект был массовым (был бы реально доступен большему числу пользователей, чем относительно квалифицированные пользователи OSM), он должен быть предельно упрощен с точки зрения внесения данных. Про это пока никаких идей не услышал.

пишу

о игровом способе сайта…

Прислушавшись к BushmanK, что интерфейс и функционал должен быть “упрощен с точки зрения внесения данных”, то возникают вопросы:

  • что Именно можно поручить(доверить) одновременно и новичкам, которые могут только сфотографировать “расписание работы заведения”, уточнить номер дома (так как некоторые дома без адреса http://qa.poole.ch/?zoom=12&lat=59.42091&lon=24.78741&layers=TFB0 ), обозвать POI без названия http://gyazo.com/515d16ed5a30849bd9b0e04cce134a1c (с подтверждающем фото [которое имеет гео привязку] - можно и без фото),…?

для последующего экспорта в базу ОСМ?

Нужны ли вообще фотографии:

  • расписание графика работы кафе? или только текстовая инфа?
  • название - вывески предприятий/кафе или достаточно текстом?

  • если да, то куда экспортировать эти фотки?

Вообще, нужна любая информация. Но в конечном счете, она должна быть приведена к виду текстовых тэгов. Если придумаете способ, кому и как поручить расшифровку фотографий от тех, кто может только сфотографировать - в них самих смысл будет. Если не придумаете - это собирание мертвого груза.

правильно я понял, что “текстовых тэг” потом экспортировать в ОСМ?

А какую еще можно новичкам доверить собирать инфу?
от валидаторов они будут получать миссии(в простом формате через интерфейс на сайте).
валидаторы сейчас нашел только эти:

http://qa.poole.ch/?zoom=12&lat=59.42091&lon=24.78741&layers=TFB0

http://keepright.at/report_map.php?lang=ru&number_of_tristate_checkboxes=8&highlight_error_id=0&highlight_schema=0&lat=58.80029&lon=25.48275&zoom=8&show_ign=1&show_tmpign=1

подскажите другие валидаторы недочетов на карте и как из этих валидаторов забирать данные? (которые будут на сайте переконвертированы в миссии).

Э… ну а ради чего вообще затевается эта ваша штука? Конечно для того, чтобы новые объекты с новыми тэгами или новые дополнительные тэги для старых объектов оказались в базе OSM.

Спасибо!
А какую еще можно новичкам доверить собирать инфу? что бы и задания были у валидаторов которые смогут по API отдавать такие данные.

пока отобрал эти задания:

подскажите как через API забирать мне эти данные?
может напрямую из базы ОСМ?

Спасибо!

Мне кажется еще должна быть возможность простого закрытия/удаления POI. Но надо как-то аккуратно сделать, чтоб избежать вандализма.
Еще можно наверное работать с OSM Notes, показывать их на карте, давать возможность закрывать их и комментировать.

BucketMan - coloring your city

http://forum.openstreetmap.org/viewtopic.php?id=24800

Дак если даже картинку с мобилы запилить то уже вперед :slight_smile:

не проблема аплодить картинки с мобилы, НО

А куда картинКу хостить?

http://commons.wikimedia.org/wiki/Main_Page?uselang=ru

http://openstreetview.org/ забыли. Только его слегка допилить нужно.

Например flickr
Вот такие там лицензии есть https://www.flickr.com/services/api/flickr.photos.licenses.getInfo.html
И есть геоинформация.

Любителям отечественного можно яндекс-фотки … вот только там не понятно где указывать лицензию на фото.

Спасибо!

Спасибо!

я не понял, а причем тут лицензия? на этих фотках никто не планирует делать деньги. или в чем прикол?

кстатит http://wiki.openstreetmap.org/wiki/Photo_mapping
фото отдает GPS и вот подтверждение, что фото сделано в этом районе.