Нам нужны вообще ; в значениях для России? Запретим их?

d1g · January 28, 2015, 1:45pm

Да ты меня правильно понял:

нечего выдумывать сложности для 0,1% значений
нечего ради этого 0,1% новичкам горовит слово “регулярка”. Тебе нравится когда твоё имя предлагают найти как ~ди~? Димой тебя не зовут? Dmitry нет такого имени? Зачем я вообще это должен кому-то объяснять?
нечего поддерживать программы которые парсят name=* или считают что highway=* найдёт дороги. Что ~Дми~ это регулярка имени Дмитрий. Ты пол людей тоже по именам определаешь? А не отдельному смысловому тегу “пол”?

Вообще не нужно разделять по точке с запятой. Ты не строки парсишь.

http://wiki.openstreetmap.org/wiki/Tag%3Ashop%3Dsupermarket “A large store for groceries and other goods”
Хотят твои пользователи “groceries and other goods” ищи для них “shop”=“supermarket”. Обрати внимание на кавычки. Я настаиваю что код счиатющие shop= - магазинами сломан изначально. Те кто от лени ищут все с shop=* не должны говорить остальным что магазины это shop=. У нас 200+ тегов магазинов, никих регулярок shop= в OSM нет.

Это делается один раз и выкладывается на гитхаб. Никакого секрета в 200 тегах через дизъюнкцию нет. Вместо этого ты хочешь чтобы каждый разработчик блестал (как ему кажется) регулярками.

Более того, обычные пользователи не могут использовать регулярки в значениях у программ которые пытаешься защищать.

Попробуй-ка мне найти volleyball этими osmosis или osmfilter:
у объектов с sport=soccer;volleyball

Конечно же да. Если osmosis еще можно пожалеть как основную программу импорта.

Ни osmosis
Ни osmfilter

Не могут выполнить функции базы данных. Если ты составлял запросы в них, а не postgres, спешу тебя огорчить, есть более продуктивные инструменты для работы с данными OSM. Пропогандируя менее эффективные инструменты (в т.ч. регулярки) ты не напрямую, но затягиваешь процесс эволюции.

osmosis это утилита выгрузки-загрузки в DB, не более. То, что ты видишь фильтрацию в ней это плюшки, а не основная функция.

Основаную фукнцию запросов выполняют

postgresql
overpass
OSM API 0.6

В блокнотике тоже можно xml читать, но это не значит что это хорошая идея или стоит так советовать всем делать.

Фраза хорошая, но целиком не соглашусь.

Смысл объекта мира нужно дробить, тогда его можно будет впихнуть в маленькие теги OSM.

Если раньше жили sport=soccer;volleyball и казалось нормально, то сегодня нужно два тега:
sport:soccer=yes
sport:volleyball=yes

Получилось впихнуть? Конечно. Можно найти воллебольную площадку? Да запросто:
“sport:volleyball”=“yes”
Никаких регулярок вообще никому или разбиения по ; в коде.

Для обратной совместимости с предыдущими программами можно указать ещё один тег-костыль:
sport=multi либо sport=soccer

phone=* тоже в исключения, нет смысла их разделять на теги. У телефонов нет смыслов poi. Вы не ишете по 11цифрам-значениям. Напротив, для спорта, вам нужен только определённый спорт.

Не нужно писать sport=multi, это почти ничего не значит. Это подойдёт только для совместимости со старыми программами.

То же что и с телефонами, смысла различать их нет как разные POI, пока что у нас нет массивов вместо тупой строки value (tag=value), придётся их писать через ;. Как только появятся массивы, тут же перетегируем без точкозапятых.

Насчёт alt_name= еще можно согласится, то old_name=* точно нельзя смешивать с name=. old_name= значит старое имя, name=* для текущего и действующего.

Про old name: как вариант можно договориться использовать не old_name=, а was:name=. Но это чисто наше Российское соглашение будет, дубов в tagging@ сдвинуть нереально.

dkiselev · January 28, 2015, 1:55pm

В общем аргументы мне твои ясны, заводи пропозал/голосовалку, все спокойно проголосуют как считают нужным, да займемся более интересными делами.

Zkir · January 29, 2015, 8:07am

Формально это правильно, но есть обработка и обработка, конвертирование и конвертирование. Исходная структура данных должна** в принципе** подходить для обработки, с учетом имеющихся алгоритмов.

Например, дороги в осм рисуют линиями, соединенными по общим точкам. Почему? Потому что для навигаторов необходим связный дорожный граф, и чтобы навигаторы могли его получить, он должен в простом виде быть в осм. Попытки заменить линейные дороги на полигональные (как более точные и подробные) встречают ожесточенное сопротивление пользователей данных.

Другой пример. Мапник на обзорных масштабах (z1-6) пустой и выглядит ужасно, по сравнению с бумажными картами сопоставимого масштаба. Почему? Да потому что данных в OSM, пригодных для отображения на этом масштабе ПРОСТО НЕТ. Там, где пустая карта неприемлема (sputnik.ru, обзорки ситигида) вместо osm используется NaturalEarth. И это несмотря на сотни гигабайт точных и подробных данных в planet.osm.

Тут еще такая фигня. Если структура 10 лет подходила для поиска, а потом, внезапно, без объявления войны ее поменяли, и она перестала подходить, это плохо, и действует разрушительно на реальную экосистему OSM.

Есть, скажем так, антипрограмма мапперов, работающих в режиме “только запись” (write-only).

Такого подхода следует избегать

avatar6 · January 29, 2015, 8:42am

Очевидно, что теперь придется создать страницы вики для каждого shop:car_parts= , shop:tea= …

ynx · January 29, 2015, 12:05pm

Zkir:

ynx:

С моей точки зрения нужно разделять данные и обработку этих данных (редакатирование/удаление/добавление данных к этому не относится). … Если используемая структура, например, не подходит для поиска, значит где-то рядом надо создавать индекс по этим данным или вообще конвертировать данные в во внутренние структуры и использовать уже их.

Формально это правильно, но есть обработка и обработка, конвертирование и конвертирование. Исходная структура данных должна** в принципе** подходить для обработки, с учетом имеющихся алгоритмов.

Так вот как раз сейчас, структура в приницпе подходит для обработки. И в как автором темы и предлагается поменять стуктуры данных, для решения какой-то конкретной задачи (чтобы было удобнее).

Не очень понял ниже приведённые пример в контексте стуктуры/хранения данных и их обработки, но попробую прокомментировать.

Конкретно тут проблема в том, что разные данные пытаюся хранить как одну сущность. А данных тут две: дорога, как нечто по чему можно ехать и дорога, как направление движения. По хорошему, это должны быть разные объекты. Тогда и отрисовано это было бы красиво и не надо было бы возиться с отношениями, для запрета поворота и тому подобных вещей. То, что в osm эти две вещи объединены в одну - очень большой недостаток.

Так это просто нет данных. Могу предположить, что такие данные просто сложно запихнуть в стуктуру osm, этим и можно объяснить их отсутствие.

Да вроде ничего не меняли. Или я упустил мысль.

Периодически, мне попадаются вещи типа как мапить магазин “Свет” (light или lights) или что-то типа поменявшегося обозначения шиномонтажа… Но я бы не сказал, что тут есть какие-то принципиальные проблемы - в любом адекватном инструментарии это замена одной строки на другую или просто поддержка и того и другого. С другой стороны, я даже в таких изменениях не вижу большого смысла, в конце коцов, есть решим, что shop=cdtn и есть магазин “Свет”, то вполне можно с этим согласиться.

d1g · January 30, 2015, 3:26pm

Набросал черновик, жду отзывов: получится у нас, не получится?
Если есть спорные после прочтения сформулируйте чтобы на них ответить можно было или отразить в предложении.

Proposed features/Запрет множественных значений в основных ключах

d1g · January 30, 2015, 3:48pm

Это является проблемой перехода, как мы решим поступить на момент пока в osm будут amenity=* которые потом нужно будет выкинуть/запретить/не использовать.

Например 0,1% пользователей отмечают
name=Банкомат
amenity=bank;atm

К чему теперь относится name? Хоть один рендер такое решить может?

Именно поэтому тегируем по точке на тег.
amenity=bank
и отдельно
name=Банкомат
amenity=atm

предлагаемая схема пытается вывести из порочного круга
<бессмысленный тег (amenity, man_made)>=<смысловая часть>

путём переноса всё в key:
<бессмысленный тег (amenity, man_made)>:<смысловая часть>=yes
<бессмысленный тег (amenity, man_made)>:<смысловая часть>=yes
<бессмысленный тег (amenity, man_made)>:<смысловая часть>:name=Банкомат

amenity:bank=yes
amenity:atm=yes
amenity:atm:name=Банкомат

В новой схеме “основными” будут два (три, миллон) тегов-групп

Хотите банкоматы? amenity:atm=yes
Хотите только банки? amenity:bank=yes

Парадигма банк amenity=bank или банкомат amenity=atm всех устраивает? Я явно не один в этом.

Zverik · January 30, 2015, 3:57pm

Офигеть, я понял грандиозную задумку. Она в том, чтобы вместо «ключ=значение» сделать просто «тег». С переходной заглушкой в виде «тег=yes». Эдакий параллельный осм.

d1g · January 30, 2015, 3:58pm

От говорливости в тегах key можно будет избавится путём ввода новой абстракции для тегов. Это очень сложное изменение в рамках 0.6 (deployed 17-21 April 2009) такого не будет никогда вам.

<смысловая коробка>
amenity:bank=yes
</смысловая коробка>
<смысловая коробка>
amenity:atm=yes
amenity:atm:name=Банкомат
</смысловая коробка>

Можно будет сократить до

<смысловая коробка>
bank=yes
</смысловая коробка>
<смысловая коробка>
atm=yes
name=Банкомат
</смысловая коробка>

bank=yes, atm=yes это строгие типы, задокументированные на вики, те самые “основные теги” которые вы ждёте.

Они никогда не случатся просто так.

d1g · January 30, 2015, 4:17pm

Не совсем заглушка.

Прямо сейчас в OSM:

generator:source=gas
generator:method=combustion
generator:output:cold_water=yes
generator:output:electricity=225 kW

После очень сильных изменений в бекенде и во всех приложениях


<семантическая коробка, типизированная>
generator=yes - строгий тип, задокументирован на вики
source=gas
method=combustion
output:cold_water=yes - вложенность коробок-типов тоже можно учесть, их тоже можно строго типизироваться и задокументировать, никаких угадаек по Taginfo и вопросов "как обозначать X"
output:electricity=225 kW
</семантическая коробка, типизированная>

То что ты называешь “просто тег” это строгий тип, задокументированный на вики. Схема тегирования его свойств будет ясна автоматически как только ты открываешь http://taginfo.openstreetmap.org/tags/supermarket=yes

Преимущества строгих типов над строками через ; настоящим программистам не нужно объяснять.

Если хотим развиваться, OSM придётся сделать бочку и вкладывать смысл в key, а не key(дурацкие man_made,amenity,leisure)=value.

wowik · January 30, 2015, 4:18pm

Но кто-нибудь туда обязательно воткнет «тег=no» или даже придумает «тег=что-то» и станет требовать поддержки в рендере

d1g · January 30, 2015, 4:29pm

В предложении речь не только о poi-тег=yes, а о poi-тег=yes, poi-тег=main, poi-тег=partial, poi-тег=no. Это преимущество схемы, а не недостаток. Прямо сейчас вы делаете это через was:leisure…

Вместо stadium=no вы пишете was:leisure=stadium/disused:leisure=stadium/abandoned:leisure=abandoned.

Я по секрету скажу что теги
abandoned=yes
disused=yes

Должны быть основными, а не запрещёнными. Это возможно сделать только и только если у вас есть семантическая коробка или сильная неймспейсовость в key (у пар key=value):


<семантическая коробка>
stadium=yes - строго типизированный тег, задокументированный на вики
disused=yes
name=Спартак
description=уже не тот что раньше
</семантическая коробка>

disused:, abandoned: это костыли которые я всецело поддерживаю в рамках API 0.6 чтобы абсолютно все программы работали нормально.

Не придумают. yes/no/partial/main это всё-всё-всё на свете что вы можете сказать про какой-либо магазин или услугу. Про те “главные теги” (POI) которые вы хотите.

generator:output:electricity=225 kW не запрещаются, наоборот, очень поощряются на переходном этапе, значение 225 kW будет конечно разрешено потом. Куда именно засунут 225 kW авторы строгих типизаций зависит только от них.

wowik · January 30, 2015, 5:48pm

И всё-таки. Какую НОВУЮ задачу позволит решить нововведение? Кроме того, чтобы сломать старое?

Как мне теперь выбрать все amenety:* одним махом?

Простота разбора значений компенсирована сложностью выборки ключей.

d1g · January 30, 2015, 6:46pm

“Преимущества для пользователей” “Преимущества для разработчика”. Я там мало написал, все преимущества могут не сразу очевидны. Zverik-а осенило, но я не уверен что он понял полностью всю задумку.

Почему нужна новая задача когда со старой задачей теги не справлялись?
name=Заправка
amenity=fuel;fast_food

Вы умеете писать рендеры которые будут выдирать правильную иконку? Или давать одну ссылку на документацию которая будет описывать только одну схему?

Зачем конечному пользователю в здравом уме знать все amenity=* теги которые мы напридумывали до этого?

Если вы давно документацию не открывали их пытались сгруппировать на 7 групп уже:
http://wiki.openstreetmap.org/wiki/Key:amenity

Пф. Указываем тег-костыль amenity=yes на время перескакивания через знак равно в key=value.
Пользователи которые считают что регулярка amenity=* хоть что-то значит, остаются в прошлом с их нерешаемыми проблемами двойственности объектов в рамках псведо-смысловых amenity= (amenity не значит ничего! сюрприз!)*.

wowik · January 30, 2015, 6:49pm

Не пользователю, а программе. пользователь вобще тегов не видит.
Что-бы выбрать иконку, к примеру. Да и вообще, узнать сам факт, что это amenity

d1g · January 30, 2015, 6:51pm

что это???

fast_food я знаю.
restaurant я знаю.
pub я знаю.

Объясните теперь мне что такое amenity и почему я должен его приписывать хоть где-то?

wowik · January 30, 2015, 6:54pm

Я знаю 500 тегов amenity, теперь мне надо делать выборку объектов по всем 500 ключам вместо одного?

OverQuantum · January 30, 2015, 6:59pm

То есть предлагается ввести группы и иерархию тэгов?
Тогда предлагаю перепрыгнуть этот этап и сразу перейти к языку разметки - описательный текст в произвольной форме в котором встроены ключевые слова.

Примерно так:


#shop,supermarket
#name: Десяточка
#operator: {ООО "АСП-ГРУПП"} /ИНН 7735108290
#opening_hours: 08:30-22:45 /c 2014-05-23
Отличные пирожные продают

{
Ранее тут был #name: Квартал
Закрыт с 2013-02-22, ООО "АСП-Групп", ИНН 7735108290, Сеть магазинов "Витория Квартал", телефон магазина с сайта "(+7 495) 535-23-58"
#email: inform@victoria-group.ru
#opening_hours: 24/7
#phone: +78002004454
#website: http://www.victoria-group.ru/shops/kvartal/addresses.php?region=msk
#disused,shop,supermarket
}

Кому надо - рендерит красивую страницу с описанием. Кому надо - парсит тэги.

Я примерно так же двигался, когда придумывал как телефонную книжку удобнее организовать. Сначала таблица, потом key=value, потом XML с иерархией полей, а теперь вот разметка текста хэш-тэгами.

d1g · January 30, 2015, 7:01pm

Уже всё продумано кроме реализации плагинов JOSM и конвертеров *для временной совместимости со старыми amenity=**.

Хочет пользователь “заведения питания”, я ему буду искать “amenity:fast_food”=yes | “amenity:restaurant”=yes | “amenity:pub”=yes | …

Я этот запрос напишу один раз в жизни и выложу на гитхаб, другие программисты такие запросы по сотне и тысяче запросов составляют в день только чтобы проверить данные в OSM.

Используют ли они фильтры JOSM при этом
Используют ли они валидаторы
Используют ли они запросы Overpass API

Эти усилия можно объединить в единый репозиторий запросов.
openstreetmap.ru это называет “каталог тегов” или “точки интереса POI”. Эта возможность должна быть

напрямую в JOSM
напрямую в overpass, а не на странице http://wiki.openstreetmap.org/wiki/Overpass_turbo/Examples
быть может как “включаемые-отключаемые слои” в iD, прямо сейчас их придётся строить на основе пресетов в iD. К сожалению там есть пресеты не для всех практик тегирования.

keder · January 30, 2015, 7:17pm

Тег phone=, voltage= (для power объектов) в исключениях не забудьте. А вообще исключения должны быть для всех тегов имеющих несколько числовых или уникальных символьных значений, т.е. то что пихать в tag:* вместо астериска не имеет смысла.