Определение скоростей дорог по трекам

lupin-de-mid · September 9, 2010, 12:12pm

Аргументируйте пожалуйста

liosha · September 9, 2010, 12:13pm

ага. highway и maxspeed.
И м.о. (в качестве прогноза) будет лучше.

Большинство доступных навигаторов умеют только одну циферку.

AMDmi3:

В-третьих, надо проанализировать данные - как скорость изменяется в течение суток и недели, какой она была год назад, и как она меняется в среднем внутри одного трека.
В-четвертых, нужен способ оценки качества того, что получится. Нужны реальные данные по скорости на какой-то момент времени от какого-нибудь пробкосервиса.
В-пятых, качать треки кусочками не дело, нужны все точки Москвы (ну либо другого города где есть другая информация).

Я был бы очень рад получить доступ к такой статистике

liosha · September 9, 2010, 12:15pm

Хм… Первая глава любого текста про прогнозирование.

UPD
Как вариант: http://www.bull-n-bear.ru/risk_in/?risk_in=risk_in5

Ilis · September 9, 2010, 12:18pm

В силу своей субъективности там учитываются вообще все факторы
Но если должно учитываться много объективных факторов, тогда надо чтобы все они не противоречили отсутствию значений этих факторов на других рёбрах.

Если мы проезжаем по одной из параллельных дорог в пробке со скоростью 20 км/ч, и назначаем эту скорость этой дороге, то каким образом можно учесть тот факт, что на соседних дорогах в это же время будет точно такая же скорость? Ведь дефолтная там 60.

С подсчётом МО могу ещё предположить артефакты такого типа, как постоянная езда одним человеком на работу и с работы в час пик по одной и той же дороге, и регулярным выкладыванием этих треков. Дорога, к примеру, не особо транзитная, поэтому там будет сто медленных треков и пара случайных быстрых.

liosha · September 9, 2010, 12:23pm

В силу своей субъективности там вообще не учитываются факторы
Это именно субъективная оценка.

AMDmi3 · September 9, 2010, 12:24pm

Ну это должно решиться грамотным выбором точек, чтобы параллельную дорогу не зацеплять.

Вот-вот, меня это и беспокоит - выборка у нас хреновая. А вне шоссе еще и нерепрезентативная. Это не считая упомянутых велотреков, общественного транспорта (кстати, а напомните все-таки, общественный транспорт в москве заливали?).

Кроме всего этого есть еще светофоры-лежачие полицейские, которые надо тогда то-ли не учитывать в навигаторе, то-ли как-то выкидывать из треков.

AMDmi3 · September 9, 2010, 12:27pm

Софтом я готов заняться, это интересная тема. Надо подумать как достать все треки по Москве и можно ли достать какой-нибудь старый снапшот ожидаемых скоростей от пробочного сервиса.

liosha · September 9, 2010, 12:29pm

AMDmi3, ну дык у своих бы спросил

UPD.
Кстати, на весенний ИМАТ вроде выкладывали статистику по москве за какой-то один месяц

Ilis · September 9, 2010, 12:30pm

Эээ, я совсем не про это… Для одной из дорог, на которой будут треки, будет известно и матожидание, и дивергенция, и медиана и все остальные статистические параметры, и пусть даже с максимально возможной точностью при наилучшем методе подсчёта. А на соседней дороге не будет треков вообще, поэтому не будет никакой статистики. При этом мы догадываемся, что пробки возникают на этих двух дорогах одновременно и пропадают одновременно. Какие дефолтные значения мы должны присвоить обоим дорогам?

AMDmi3 · September 9, 2010, 12:36pm

А, блин жеж, забыл совсем. Надо попробовать.

Что это, где это?

Ilis:

Эээ, я совсем не про это… Для одной из дорог, на которой будут треки, будет известно и матожидание, и дивергенция, и медиана и все остальные статистические параметры, и пусть даже с максимально возможной точностью при наилучшем методе подсчёта. А на соседней дороге не будет треков вообще, поэтому не будет никакой статистики. При этом мы догадываемся, что пробки возникают на этих двух дорогах одновременно и пропадают одновременно. Какие дефолтные значения мы должны присвоить обоим дорогам?

Вот это весьма и весьма сложно. Неизвестно, насколько близка должна быть параллельная дорога для образования пробки, многое зависит от конфигурации перекрестков и наличия съездов с нее. Хотя, если пробки возникают на обеих дорогах, весьма вероятно что треки есть на обеих.

liosha · September 9, 2010, 12:40pm

Дык ваши же опять
http://imat2010.yandex.ru/datasets

UPD. Не, там голый граф был, без геопривязки

Ilis · September 9, 2010, 12:43pm

Да пробки во всём городе возникают одновременно Ну пусть на обеих есть треки, а на третьей, довольно кривой дороге, куда никто не сунется, нет треков. И имеем одну основную дорогу с МО=20, параллельную, менее удобную, но более размытую по трекам с МО=25, и третью, в полтора раза длиннее, но вообще без МО, с дефолтной скоростью 50.

AMDmi3 · September 9, 2010, 12:57pm

Ну понятное дело что будут места где станет хуже. Вопрос насколько при этом станет в общем лучше.

liosha · September 9, 2010, 1:10pm

Избавился

SenatoR · September 9, 2010, 1:23pm

Даже если есть такие дороги, думаю, после того, как навигатор построит по ним, в виду этих 50, треки появятся и ситуация устаканится. По-моему, главное, что здесь надо сделать - это обеспечить непрерывность изменения данных. Средние скорости в тегах должны регулярно обновляться, ведь база треков растет, на дорогах бывают ремонты, сменяются зима и лето. Выборка треков за 4 года способна сгладить многие колебания, как сезонности, так и пробок.

Ilis · September 9, 2010, 1:31pm

Ага, среднего по больнице за 4 года ещё не хватало.

По моему самое плохое во всей этой истории – попытка учитывать пробки. Для долговременных прогнозов использовать быстроизменяющиеся характеристики.

У максимальной скорости такого недостатка практически нет, а пробки должен учитывать (и учитывает же!) пробочный сервис.

liosha · September 9, 2010, 1:34pm

Когда пробочного сервиса нет, прогноз всё равно нужен.
И максимальные скорости в качестве прогноза совершенно не годятся.

SenatoR · September 9, 2010, 1:45pm

Набуханный чудень пролетит на ямахе 270 ночью и капец…

Тогда уж надо отсекать по типам дорог минимальную скорость, отсекать превышения, по типу для города не выше 70, и из остатка строить.

liosha · September 9, 2010, 1:49pm

Отсекать имеет смысл только то, что заведомо не совпадает с целевой ситуацией. Всё остальное погасится статистически.
В нашем случае целевая ситуация определена очень слабо: автомобиль. Других параметров вроде как нет.

Zkir · September 9, 2010, 2:38pm

Попытка учитывать пробки - в этом вся суть и есть. Считается, что пробки возникают в силу систематических причин, и по этому их можно прогнозировать. Если же пробки возникают в силу случайных причин (например исключительно из-за аварий) то прогнозировать их бессмысленно.

Угу, это фундаментальное свойства мат.ожидания. Если эксперементы повторяются, а результаты складываются, то сумма стремится к м.о.*[число экспериментов]