OpenOrganizations

Добрый день,
давно наблюдаю за развитием OSM. В частности, за тем как живет его POI составляющая. Не редко сталкивался с тем, что POI на карте либо устаревают, либо содержат настолько мало информации, что использовать для чего-то сложнее, например, отметить любимый ресторан и указать его номер почти нереально + ограничения, наложенные плоской структурой данных.
Тогда был придуман проект для хранения/представления информации об организациях http://openorganizations.org Структура и архитектура вдохновлены OSM и позволяет укладывать данные по организациям любой сложности, а также отношения между ними.

Сейчас проект находится в глубокой альфе и представлен на суд сообщества для конструктивной критики. В базе нет данных особо, но доступен редактор, который позволит внести типовые данные, поэтому можно вносить что душе угодно, как угодно и так далее. Любые эксперименты приветствуются. API совместимо с OSM API с поправкой на имена сущностей. Если кому будет интересно, могу выложить адаптированную библиотеку на Ruby.
Полноценный запуск запланирован через несколько месяцев. К тому времени будут загружены имеющиеся и собранные данные. Остались доработки по интерфейсу и текстам, но API и хранилище готово на 100% + готов поиск по каталогу и API каталога в удобном для работы виде.

На данный момент определен формат описаний для основных контактов (телефоны, почта, сайты IM), организаций и адресов. Так же есть наработки по способам оплаты, банковским реквизитам и другим, но они не отражены в редакторе.

Если у кого-то будет интерес к данному проекту, либо предложение, да вообще что угодно, можно писать здесь или на почту ajieks(собака)openorganization.org, так же для тех, кто пользуется Slack создана группа. Подключиться к ней можно отправив любое письмо на slack(собака)bot.openorganizations.org в ответ будет выслано приглашение.

Надеюсь данный проект будет интересен OSM сообществу.
Спасибо.

UPD
Как уже написали ниже, анонимность доверея не вызывает. Проект поддерживается и разрабатывается справочником Вектор (http://vmp.ru).

Под какой лицензией доступны данные и где это написано?
Как эти данные планируется связывать с данными ОСМ (и планируется ли).

Данные планируется открывать под аналогичной OSM лицензии. В настоящее время не все тексты заполнены и не все ссылки выставлены. Альфа версия :slight_smile:
Со временем и код серверной части откроем.
Данные связываются в сторону OSM через координаты и osm_id, например запрос:
http://catalog.openorganizations.org/0.1/ru/search?q=sib&boundary=31055
В ответе есть поле building, туда будет вынесена информация из OSM по зданию к которому они привязано, сейчас планета находится отдельно (сделали свой конвертер из OSM в PG) и получить нет возможности. Ближе к запуску все компоненты будут объеденены вместе.

А что планируете делать с изменчивостью айдишек осма?

Кто, предполагается, будет вносить и актуализировать данные, и каковы гарантии, что сервис проживёт дольше месяца? Монетизация, спонсор?

У 2Гис, например, есть целый штат сотрудников для обзвона организаций.

Источника наполнения три:

  • мы сами (http://vmp.ru)
  • наши партнеры
  • люди

У нас есть собственные данные по городам, в первую очередь будут загружены они. Так же будут загружаться данные, которые можно собрать, не нарушая лецензий и тд.
Данный проект является лишь составной частью. Есть основной, который будет объединять данную базу + картографию. Монетизация будет как него так и возможны эдементы на подобии того как сделано в API 2Gis (обязательные для показа рекламные элементы). Но это не повлияет на саму открытость данных.

Данное никто не отменял, модель развития уже продумана.

Закрываться не планируем :slight_smile: наоборот расти и набирать партнеров.
Уже сейчас есть действующий проект, ряд партнеров как в России, так и в СНГ. В целом занимаемся этим уже достаточно давно, так что опыт есть. За проектом стоит команда со стажем :slight_smile:
А решение для перехода на модель подобную OSM была принята для обеспечения большей гибкости, повышению скорости роста ну и привлечению помощи от сообщества.

Данный сервис лишь половина задуманного, в полном объеме запуск запланирован в течении этого года.

Интересный проект. Правда, после регистрации войти не удалось («неправильный пароль»), хотя по ссылке подтверждения аккаунта в письме я переходил. :slight_smile:

Хм, странно, проверю сейчас еще раз. Есть подозрение, сейчас проверю и активирую учетку. Наверно стоит отключить активацию юзеров на тестовый период :).

Upd: хост был старый, утром переезд был :slight_smile: Активировал аккаунт, можно заходить. Приношу свои извинения :slight_smile:

Мы это кто? На вашем сайте никаких выходных данных не нашёл.

Анонимность доверия вам не прибавляет.

Мы это http://vmp.ru/. Обновлю первое сообщение в топике.

Алексей, с почином вас! Я уж было подумал, что проект заглох… Рад, что ошибался.

Наконец-то эту идею реализовали в открытом виде.
Ведь это, как я понял, те же Викиданные, только по организациям - та часть информации, которую Викиданные не охватывают. Как вариант, можно будет в последствии не расписывать организацию в OSM, а указывать тег с идентификатором OpenOrganizations.

Таксономии в ваших данных есть в каком-либо виде? Дело в том что многие теги в OSM исторические и смысла не имеют по большей части: amenity=fuel, amenity=car_repair, amenity=bar.

Сравните это с плоскими тегами OSM:

Модель данных OSM не идеальна и будет работать только до определённого момента сложности иерархий:
http://forum.openstreetmap.org/viewtopic.php?pid=481661#p481661
http://forum.openstreetmap.org/viewtopic.php?pid=482068#p482068
http://forum.openstreetmap.org/viewtopic.php?pid=482379#p482379
http://forum.openstreetmap.org/viewtopic.php?pid=482114#p482114

Насколько сложно будет реализовать в вашей системе иерархии? Если вы выбрали путь как и OSM для POI тегов то рано или поздно вы придёте к такой же проблеме.

Хотелось бы верить что это будет так. Некоторые компании реализуют это юридически авторским правом, а “свободность” обеспечивается только словесно. У некоторых компаний случаются кризисные моменты и они выбирают путь защищать свои данные любой ценой и теряют наполнителей и сообщество. Не повторяйте их ошибки:

https://www.openstreetmap.org/copyright - на данные OpenStreetMap должна быть ссылка в углу
http://opendatacommons.org/licenses/odbl/summary/ - выдержка юр. текста
http://wiki.osmfoundation.org/wiki/License/Contributor_Terms

Если же когда-нибудь захотите импортировать в главную базу OSM будем всегда рады:
https://wiki.openstreetmap.org/wiki/Import/Guidelines - всё сводится к тому, чтобы договориться с сообществом как будет проходить импорт

Выложенная часть была готова давно, просто думали открывать или нет в альфе, вот приняли решения, а чего ждать :slight_smile:

Да именно, так. Видел как в забугорной части OSM указывают тэги со ссылкой на Tiger например или туже Википедию, можно по тому же принципу и здесь.

Хороший вопрос. В свое время читал по онтологиям различную информацию, веселая штука. Касательно иерархии. Если я правильно понял, как расписать сложную конструкцию вида назначение организации и уточнения?
Тут как по мне варианта два:

  • идем через рубрикатор
  • идем через тэги

Первый вариант может иметь древовидную структуру, не проблема. На тэгах можно реализовывать простешие отношения, более сложные разбивать. Например расмотрим случай.
Дано: два ресторана (два юр лица), оба управляются одной компанией (управляющая). В первом ресторане есть WiFi, оплата пластиком и наличкой + отдельно доставка. Второй ресторан также имеет WiFi но с паролем, бонусную программу + специализируется на нескольких кухнях и меню есть на сайте. Представим это в нашей схеме:

Возможно это громоздко, но поставленную задачу решило. Определяя такую структуру исходили из следующего:

  • если сущностей может быть не один экземпляр, то выносим в отдельный Contact;
  • если один, то тэги размещаются внутри;
  • если один, но логичские тэги могут пересечься, то тоже выносим;
  • если сущность может включать другую, то это Relation.

Интересно, с ходу недостатков не найду.

Движок wikibase не хотите использовать? “statements” это что-то похожее на теги в OSM, но лучше - они строго типизированы

https://www.wikidata.org/wiki/Q2:

https://www.wikidata.org/wiki/Property:P585 - тип времени
https://www.wikidata.org/wiki/Special:WhatLinksHere/Property:P585 - объекты мира с этим свойством

http://wikiba.se/ - сам движок

А налоговая не собирается данные открывать?

У нас есть выход на администрацию нашего города, работаем с ними по проекту хранению и обмена данными. Сейчас хотим предложить схему синхронизации их баз с нами. Когда проект сними будет выполнен, можно его показывать и другим структурам как пример. Гос структуры ж они такие, так просто не сдвинутся :slight_smile:

ЗЫ в свое время получили данные из налоговой, это ад, указано что попало. Адреса только юридические, а это половина квартиры, контактов почти нет и так далее. По хорошему от них можно взять только юридическую информацию: ИНН КПП и тд.

OSM в плане хранения POI сильно ограничен тем, что он не может позволить разделить данные на отдельные сущности, т.к. заточен под хранения геоданных. Хотя и там порой не все одназначно, но все же жить можно. А в POI когда смотрели как там устроено, первое с чем столкнулись это невозможность адекватно отобразить множественные данные, одно только это ставит в тупик. Можно извратиться используя различные соглашения, но это тот еще костыль.

А по ссылкам посмотрю, не натыкался раньше. Но с первого взгляда выглядит очень интересно и в чем-то похоже, можно во всяком случае подчерпнуть оттуда что-нибудь.

Сейчас анализируем данные, рассматриваем возможности и способы их укладки. Пробуем сразу прийти к некоторой формализации эти правил. Первый вариант спецификации был подсмотрен здесь, получилось например вот так:


<?xml version="1.0" encoding="UTF-8"?>
<ooc-tag-definition-list release-date="2014-05-05" release-id="0001" version="1" xsi:noNamespaceSchemaLocation="../schema/ooc-tag-definition-list.xsd" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
	<tag-def key="payment" oncontact="yes">
		<description xml:lang="ru">Способ оплаты</description>
		<value-def value="card">
			<display-name xml:lang="ru">Пластиковая карта</display-name>
		</value-def>
		<value-def value="cash">
			<display-name xml:lang="ru">Наличные</display-name>
		</value-def>
		<value-def value="emoney">
			<display-name xml:lang="ru">Электронные деньги</display-name>
		</value-def>
	</tag-def>
	<tag-def key="emoney">
		<display-name xml:lang="ru">Электронные деньги</display-name>
		<description xml:lang="ru">Наименование системы электронных денег</description>
		<value-def value="webmoney"/>
		<value-def value="bitcoin"/>
		<value-def value="yandex"/>
	</tag-def>
	<tag-def key="wallet">
		<display-name xml:lang="ru">Кошелек</display-name>
		<description xml:lang="ru">Кошелек для перевода электронных денег</description>
	</tag-def>
	<tag-def key="card">
		<display-name xml:lang="ru">Платежная система</display-name>
		<description xml:lang="ru">Платежная система, которой выпущена пластиковая карта</description>
		<value-def value="visa">
			<display-name>Visa</display-name>
		</value-def>
		<value-def value="mastercard">
			<display-name>MasterCard</display-name>
		</value-def>
	</tag-def>
	

	<preset name="card-payment">
		<implies key="tag" value="payment/card"/>
		<requires key="card" />
	</preset>
	
	<preset name="emoney-payment">
		<implies key="tag" value="payment/emoney" />
		<requires key="wallet" />
		<requires key="emoney" />
	</preset>
	
</ooc-tag-definition-list>

Ах вот даже как…
В таком случае, категорически рекомендую посмотреть эти ссылки (можно ещё вот эту http://www.youtube.com/watch?v=BUW9S1sVgrQ - с подобными лекциями даже я начал что-то в этом понимать), освежить знания по весёлым онтологиям, Linked Data и Semantic Web.

Пока не поздно и данных мало, есть хорошая возможность вырулить на модель данных будущего. :slight_smile:

Попытался ввести организацию. На чем сразу же “споткнулся”:

  • Наименование организации (кстати, попробуйте найти “Вектор, ООО”, их теперь два). Стоит ли пихать форму организации (ООО, ОАО, ЗАО, ПАО и т.п. в наименование или же эти сведения стоит разделить по отдельным полям)? И всякие там сокращенные наименования и т.п. тоже отдельными полями…
  • При вводе номера телефона не дает указать его в международном формате вида +7(3462)00-00-00. Только в виде 83462000000 или 000000. Причем 83462000000 форматируется после ввода в 73462000000 и +7(346)200-00-00.
  • При вводе web-адреса на дает указывать его с префиксом http://, https://. Только само значение. Причем, после сохранения, в начало адреса префикс http:// подставляется автоматически.
  • Для редактирования организации необходимо нажать на название организации, а кнопка “Редактировать” справа - вообще не при делах.
  • После переименования организации “улетели” все её контакты.

Понятно, что это еще глубокая Альфа-версия.