Под какой лицензией доступны данные и где это написано?
Как эти данные планируется связывать с данными ОСМ (и планируется ли).
Данные планируется открывать под аналогичной OSM лицензии. В настоящее время не все тексты заполнены и не все ссылки выставлены. Альфа версия
Со временем и код серверной части откроем.
Данные связываются в сторону OSM через координаты и osm_id, например запрос:
http://catalog.openorganizations.org/0.1/ru/search?q=sib&boundary=31055
В ответе есть поле building, туда будет вынесена информация из OSM по зданию к которому они привязано, сейчас планета находится отдельно (сделали свой конвертер из OSM в PG) и получить нет возможности. Ближе к запуску все компоненты будут объеденены вместе.
А что планируете делать с изменчивостью айдишек осма?
Кто, предполагается, будет вносить и актуализировать данные, и каковы гарантии, что сервис проживёт дольше месяца? Монетизация, спонсор?
У 2Гис, например, есть целый штат сотрудников для обзвона организаций.
Источника наполнения три:
- мы сами (http://vmp.ru)
- наши партнеры
- люди
У нас есть собственные данные по городам, в первую очередь будут загружены они. Так же будут загружаться данные, которые можно собрать, не нарушая лецензий и тд.
Данный проект является лишь составной частью. Есть основной, который будет объединять данную базу + картографию. Монетизация будет как него так и возможны эдементы на подобии того как сделано в API 2Gis (обязательные для показа рекламные элементы). Но это не повлияет на саму открытость данных.
Данное никто не отменял, модель развития уже продумана.
Закрываться не планируем наоборот расти и набирать партнеров.
Уже сейчас есть действующий проект, ряд партнеров как в России, так и в СНГ. В целом занимаемся этим уже достаточно давно, так что опыт есть. За проектом стоит команда со стажем
А решение для перехода на модель подобную OSM была принята для обеспечения большей гибкости, повышению скорости роста ну и привлечению помощи от сообщества.
Данный сервис лишь половина задуманного, в полном объеме запуск запланирован в течении этого года.
Интересный проект. Правда, после регистрации войти не удалось («неправильный пароль»), хотя по ссылке подтверждения аккаунта в письме я переходил.
Хм, странно, проверю сейчас еще раз. Есть подозрение, сейчас проверю и активирую учетку. Наверно стоит отключить активацию юзеров на тестовый период :).
Upd: хост был старый, утром переезд был Активировал аккаунт, можно заходить. Приношу свои извинения
Мы это кто? На вашем сайте никаких выходных данных не нашёл.
Анонимность доверия вам не прибавляет.
Алексей, с почином вас! Я уж было подумал, что проект заглох… Рад, что ошибался.
Наконец-то эту идею реализовали в открытом виде.
Ведь это, как я понял, те же Викиданные, только по организациям - та часть информации, которую Викиданные не охватывают. Как вариант, можно будет в последствии не расписывать организацию в OSM, а указывать тег с идентификатором OpenOrganizations.
У нас есть собственные данные по городам, в первую очередь будут загружены они.
Таксономии в ваших данных есть в каком-либо виде? Дело в том что многие теги в OSM исторические и смысла не имеют по большей части: amenity=fuel, amenity=car_repair, amenity=bar.
Автолюбителям/АЗС
Автолюбителям/СТО
Заведения общепита/Ресторан
Заведения общепита/Фаст-фуд
Заведения общепита/Столовая
Сравните это с плоскими тегами OSM:
amenity=fuel
amenity=car_repair
amenity=restaurant
amenity=fast_food
amenity=fast_food + fast_food=cafeteria
Модель данных OSM не идеальна и будет работать только до определённого момента сложности иерархий:
http://forum.openstreetmap.org/viewtopic.php?pid=481661#p481661
http://forum.openstreetmap.org/viewtopic.php?pid=482068#p482068
http://forum.openstreetmap.org/viewtopic.php?pid=482379#p482379
http://forum.openstreetmap.org/viewtopic.php?pid=482114#p482114
Насколько сложно будет реализовать в вашей системе иерархии? Если вы выбрали путь как и OSM для POI тегов то рано или поздно вы придёте к такой же проблеме.
Монетизация будет как него так и возможны эдементы на подобии того как сделано в API 2Gis (обязательные для показа рекламные элементы). Но это не повлияет на саму открытость данных.
Хотелось бы верить что это будет так. Некоторые компании реализуют это юридически авторским правом, а “свободность” обеспечивается только словесно. У некоторых компаний случаются кризисные моменты и они выбирают путь защищать свои данные любой ценой и теряют наполнителей и сообщество. Не повторяйте их ошибки:
https://www.openstreetmap.org/copyright - на данные OpenStreetMap должна быть ссылка в углу
http://opendatacommons.org/licenses/odbl/summary/ - выдержка юр. текста
http://wiki.osmfoundation.org/wiki/License/Contributor_Terms
Если же когда-нибудь захотите импортировать в главную базу OSM будем всегда рады:
https://wiki.openstreetmap.org/wiki/Import/Guidelines - всё сводится к тому, чтобы договориться с сообществом как будет проходить импорт
Алексей, с почином вас! Я уж было подумал, что проект заглох… Рад, что ошибался.
Выложенная часть была готова давно, просто думали открывать или нет в альфе, вот приняли решения, а чего ждать
Ведь это, как я понял, те же Викиданные, только по организациям - та часть информации, которую Викиданные не охватывают. Как вариант, можно будет в последствии не расписывать организацию в OSM, а указывать тег с идентификатором OpenOrganizations.
Да именно, так. Видел как в забугорной части OSM указывают тэги со ссылкой на Tiger например или туже Википедию, можно по тому же принципу и здесь.
Насколько сложно будет реализовать в вашей системе иерархии?
Хороший вопрос. В свое время читал по онтологиям различную информацию, веселая штука. Касательно иерархии. Если я правильно понял, как расписать сложную конструкцию вида назначение организации и уточнения?
Тут как по мне варианта два:
- идем через рубрикатор
- идем через тэги
Первый вариант может иметь древовидную структуру, не проблема. На тэгах можно реализовывать простешие отношения, более сложные разбивать. Например расмотрим случай.
Дано: два ресторана (два юр лица), оба управляются одной компанией (управляющая). В первом ресторане есть WiFi, оплата пластиком и наличкой + отдельно доставка. Второй ресторан также имеет WiFi но с паролем, бонусную программу + специализируется на нескольких кухнях и меню есть на сайте. Представим это в нашей схеме:
R1:
- organization=restaurant
- name=Ресторан 1
- name:en=Restaurant 1
- C:
– web=main
– value: http://site.ru- C:
– email=main
– value=hello@site.ru- C:
– email=hr
– value= hr@site.ru
– owner=отдел кадров
– comment=резюме сюда
– person=Марья Ивановна- C:
– email=pr
– value= pr@site.ru
– owner=рекламный отдел- B: (lat, lon)
– branch=restaurant
– country=Страна
– city=Город
– street=Улица
– house=Дом
– C:
— phone=wired
— value=7123456789
— owner=администратор
– C:
— wifi=open
— name=RestWiFi
– С:
— payment=cash
— currency=ruble
– С:
— payment=cash
— currency=euro
– С:
— payment=card
— card=visa
– С:
— payment=card
— card=mastercard- B: (lat, lon)
– branch=delivery
– country=Страна
– city=Город
– street=Улица
– house=Дом
– C:
— phone=wired
— value=7987654321
— owner=заказ
– С:
— payment=cash
— currency=euro
– С:
— payment=card
— card=visa
R2:
- organization=restaurant
- name=Ресторан 2
- name:en=Restaurant 2
- C:
– web=main
– value: http://site2.ru- C:
– email=main
– value=hello@site2.ru- B: (lat, lon)
– branch=restaurant
– country=Страна
– city=Город
– street=Улица
– house=Дом
– C:
— phone=wired
— value=7987654321
— owner=администратор
– C:
— wifi=private
— name=RestWiFi2
— password=12345678
– С:
— payment=cash
— currency=ruble
– С:
— payment=card
— card=visa
– С:
— payment=card
— card=mastercard
– С:
— payment=bonus
— comment=Супер накопительная бонусная программа
— link=http://site2.ru/bonus
– C:
— menu=asia
— link=http://site2.ru/menu1
– C:
— menu=russian
— link=http://site2.ru/menu2
R0:
- organization=true
- name=Управляющая
- C:
– web=main
– value: http://site3.ru- C:
– email=main
– value=hello@site3.ru- B: (lat, lon)
– branch=restaurant
– country=Страна
– city=Город
– street=Улица
– house=Дом
– C:
— phone=wired
— value=7987654321
— owner=директор
← R1 (role=manage)
← R2 (role=manage)
Возможно это громоздко, но поставленную задачу решило. Определяя такую структуру исходили из следующего:
- если сущностей может быть не один экземпляр, то выносим в отдельный Contact;
- если один, то тэги размещаются внутри;
- если один, но логичские тэги могут пересечься, то тоже выносим;
- если сущность может включать другую, то это Relation.
– C:
— phone=wired
— value=7987654321
— owner=администратор
– C:
— wifi=private
— name=RestWiFi2
— password=12345678
← R1 (role=manage)
← R2 (role=manage)
Интересно, с ходу недостатков не найду.
Движок wikibase не хотите использовать? “statements” это что-то похожее на теги в OSM, но лучше - они строго типизированы
https://www.wikidata.org/wiki/Q2:
https://www.wikidata.org/wiki/Property:P585 - тип времени
https://www.wikidata.org/wiki/Special:WhatLinksHere/Property:P585 - объекты мира с этим свойством
http://wikiba.se/ - сам движок
А налоговая не собирается данные открывать?
А налоговая не собирается данные открывать?
У нас есть выход на администрацию нашего города, работаем с ними по проекту хранению и обмена данными. Сейчас хотим предложить схему синхронизации их баз с нами. Когда проект сними будет выполнен, можно его показывать и другим структурам как пример. Гос структуры ж они такие, так просто не сдвинутся
ЗЫ в свое время получили данные из налоговой, это ад, указано что попало. Адреса только юридические, а это половина квартиры, контактов почти нет и так далее. По хорошему от них можно взять только юридическую информацию: ИНН КПП и тд.
Интересно, с ходу недостатков не найду.
OSM в плане хранения POI сильно ограничен тем, что он не может позволить разделить данные на отдельные сущности, т.к. заточен под хранения геоданных. Хотя и там порой не все одназначно, но все же жить можно. А в POI когда смотрели как там устроено, первое с чем столкнулись это невозможность адекватно отобразить множественные данные, одно только это ставит в тупик. Можно извратиться используя различные соглашения, но это тот еще костыль.
А по ссылкам посмотрю, не натыкался раньше. Но с первого взгляда выглядит очень интересно и в чем-то похоже, можно во всяком случае подчерпнуть оттуда что-нибудь.
Сейчас анализируем данные, рассматриваем возможности и способы их укладки. Пробуем сразу прийти к некоторой формализации эти правил. Первый вариант спецификации был подсмотрен здесь, получилось например вот так:
<?xml version="1.0" encoding="UTF-8"?>
<ooc-tag-definition-list release-date="2014-05-05" release-id="0001" version="1" xsi:noNamespaceSchemaLocation="../schema/ooc-tag-definition-list.xsd" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<tag-def key="payment" oncontact="yes">
<description xml:lang="ru">Способ оплаты</description>
<value-def value="card">
<display-name xml:lang="ru">Пластиковая карта</display-name>
</value-def>
<value-def value="cash">
<display-name xml:lang="ru">Наличные</display-name>
</value-def>
<value-def value="emoney">
<display-name xml:lang="ru">Электронные деньги</display-name>
</value-def>
</tag-def>
<tag-def key="emoney">
<display-name xml:lang="ru">Электронные деньги</display-name>
<description xml:lang="ru">Наименование системы электронных денег</description>
<value-def value="webmoney"/>
<value-def value="bitcoin"/>
<value-def value="yandex"/>
</tag-def>
<tag-def key="wallet">
<display-name xml:lang="ru">Кошелек</display-name>
<description xml:lang="ru">Кошелек для перевода электронных денег</description>
</tag-def>
<tag-def key="card">
<display-name xml:lang="ru">Платежная система</display-name>
<description xml:lang="ru">Платежная система, которой выпущена пластиковая карта</description>
<value-def value="visa">
<display-name>Visa</display-name>
</value-def>
<value-def value="mastercard">
<display-name>MasterCard</display-name>
</value-def>
</tag-def>
<preset name="card-payment">
<implies key="tag" value="payment/card"/>
<requires key="card" />
</preset>
<preset name="emoney-payment">
<implies key="tag" value="payment/emoney" />
<requires key="wallet" />
<requires key="emoney" />
</preset>
</ooc-tag-definition-list>
А по ссылкам посмотрю, не натыкался раньше.
…
Сейчас анализируем данные, рассматриваем возможности и способы их укладки. Пробуем сразу прийти к некоторой формализации эти правил.
Ах вот даже как…
В таком случае, категорически рекомендую посмотреть эти ссылки (можно ещё вот эту http://www.youtube.com/watch?v=BUW9S1sVgrQ - с подобными лекциями даже я начал что-то в этом понимать), освежить знания по весёлым онтологиям, Linked Data и Semantic Web.
Пока не поздно и данных мало, есть хорошая возможность вырулить на модель данных будущего.
Попытался ввести организацию. На чем сразу же “споткнулся”:
- Наименование организации (кстати, попробуйте найти “Вектор, ООО”, их теперь два). Стоит ли пихать форму организации (ООО, ОАО, ЗАО, ПАО и т.п. в наименование или же эти сведения стоит разделить по отдельным полям)? И всякие там сокращенные наименования и т.п. тоже отдельными полями…
- При вводе номера телефона не дает указать его в международном формате вида +7(3462)00-00-00. Только в виде 83462000000 или 000000. Причем 83462000000 форматируется после ввода в 73462000000 и +7(346)200-00-00.
- При вводе web-адреса на дает указывать его с префиксом http://, https://. Только само значение. Причем, после сохранения, в начало адреса префикс http:// подставляется автоматически.
- Для редактирования организации необходимо нажать на название организации, а кнопка “Редактировать” справа - вообще не при делах.
- После переименования организации “улетели” все её контакты.
Понятно, что это еще глубокая Альфа-версия.
- Наименование организации (кстати, попробуйте найти “Вектор, ООО”, их теперь два). Стоит ли пихать форму организации (ООО, ОАО, ЗАО, ПАО и т.п. в наименование или же эти сведения стоит разделить по отдельным полям)? И всякие там сокращенные наименования и т.п. тоже отдельными полями…
Это наверно стоит разделить на отдельные, проблемы нет, скорее всего даже нужно сделать будет. Поставлю себе в ToDo на неделе. Достаточно простая задача.
- При вводе номера телефона не дает указать его в международном формате вида +7(3462)00-00-00. Только в виде 83462000000 или 000000. Причем 83462000000 форматируется после ввода в 73462000000 и +7(346)200-00-00.
Интерфейс редактора опирался на наши текущие наработки, точнее даже так, для прототипа редактора были взяты текущие наработки и адаптированы под новую схему. Значение указывается в чистом формате, т.е. без каких либо знаков, только цифры, а вот в поле синоним забивается так, как хотелось бы видеть его. Надо поработать на названиями полей.
- При вводе web-адреса на дает указывать его с префиксом http://, https://. Только само значение. Причем, после сохранения, в начало адреса префикс http:// подставляется автоматически.
Опять же, наследие старого, перетащилось. Тоже в туду.
- После переименования организации “улетели” все её контакты.
Странное поведение, проверю что не так пошло, спасибо.
Понятно, что это еще глубокая Альфа-версия.
Собственно для этого и выложили, т.к. у самих глаз уже замылен, все кажется привычным и очевидным.