Страница 1 из 1

Интерпретация облака кроссковариации

Добавлено: 21 мар 2013, 00:10
swdartvader
Можно ли по облаку кросс ковариации такого вида сделать вывод о взаимозависимости значений?
Два набора данных - интенсивность транспортного потока и число автомобилей, проходящих в час. Задача - обосновать зависимость между явлениями, чтобы в дальнейших расчетах использовать интенсивность потока вместо числа автомобилей. Информации об интенсивности очень много, а по числу автомобилей нет, а покрыть надо всю исследуемую территорию.
Или нужно исследовать корреляцию наборов?

Интересует еще - как словесно описать значение оси ординат?

Заранее спасибо.

Re: Интерпретация облака кроссковариации

Добавлено: 21 мар 2013, 10:23
novia
что вы принимаете за интенсивность потока? в чем ее измеряете?

Re: Интерпретация облака кроссковариации

Добавлено: 21 мар 2013, 10:51
gamm
swdartvader писал(а):Можно ли по облаку кросс ковариации такого вида сделать вывод о взаимозависимости значений?
Два набора данных - интенсивность транспортного потока и число автомобилей, проходящих в час. Задача - обосновать зависимость между явлениями, чтобы в дальнейших расчетах использовать интенсивность потока вместо числа автомобилей. Информации об интенсивности очень много, а по числу автомобилей нет, а покрыть надо всю исследуемую территорию.
Или нужно исследовать корреляцию наборов?
это похоже чисто статистическая задача, ГИС тут ни причем. Данные можете описать (в частности, что такое "интенсивность"), и что с чем вы сравниваете (откуда лаги)? Дело в том, что вы имеете Пуассоновский (или типа того) поток, а для него методы классической статистики/геостатистики не подходят (особенно при небольшом числе автомобилей).

Re: Интерпретация облака кроссковариации

Добавлено: 21 мар 2013, 13:34
swdartvader
интенсивность транспортного потока (данные яндекс пробок), по их описанию - некоторый балл, описывающий скорость потока - баллы от 4 до 6 в исследуемой ситуации, собраные за месячный промежуток, с высчитанным средним в точках измерений. по логике вещей зависит от состояния полотна, погодных условий и числа автотранспорта (80 значений в каждой для 595 точек). данных по числу траспорта (едениц в час) 34 точки, находящиеся примерно в 25-30 метрах от точки, характеризующей интенсивность (отсюда размер лага, чтобы исследовать только соседние точки). значения в интервале 600- 3000 авто в час.

[ Сообщение с мобильного устройства ]

Re: Интерпретация облака кроссковариации

Добавлено: 21 мар 2013, 13:44
swdartvader
была мысль рассчитать обычный коэф корреляции R, классическим методом матстатистики, сделав таблицу баллы/ число транспорта, приняв условие, что смещения в пространстве нет (тк оно незначительно, 25-30 метров) между точками 2х наборов. а потом на основании этого коэффициента для выборки заявить о зависимости велечин всей ген совокупности.
прошу прощения за пунктуацию, грамматику - пишу с телефона, ну и за дилетантство, разумеется

[ Сообщение с мобильного устройства ]

Re: Интерпретация облака кроссковариации

Добавлено: 21 мар 2013, 14:12
gamm
swdartvader писал(а):интенсивность транспортного потока (данные яндекс пробок), по их описанию - некоторый балл, описывающий скорость потока - баллы от 4 до 6 в исследуемой ситуации, собраные за месячный промежуток, с высчитанным средним в точках измерений. по логике вещей зависит от состояния полотна, погодных условий и числа автотранспорта (80 значений в каждой для 595 точек). данных по числу траспорта (едениц в час) 34 точки, находящиеся примерно в 25-30 метрах от точки, характеризующей интенсивность (отсюда размер лага, чтобы исследовать только соседние точки). значения в интервале 600- 3000 авто в час.

[ Сообщение с мобильного устройства ]
у Яндекса пробки приписаны не к точке, а к отрезку. Но если хочется посчитать, посчитайте, только смысла никакого в этом нет.

Re: Интерпретация облака кроссковариации

Добавлено: 21 мар 2013, 14:45
swdartvader
Да, об отрезке я знаю, однако автоматизированно извлечь эти данные получилось только в точку. Я не очень математик, сложно понять почему нет такой зависимости. Если Вам не трудно - постарайтесь объяснить почему нет смысла, если по сути некоторому баллу интенсивности соответсвует некоторый интервал числа авто и надо лишь степень этого соответствия выяснить. Спасибо.

[ Сообщение с мобильного устройства ]

Re: Интерпретация облака кроссковариации

Добавлено: 21 мар 2013, 15:46
novia
swdartvader писал(а):интенсивность транспортного потока (данные яндекс пробок), по их описанию - некоторый балл, описывающий скорость потока
если интенсивность = скорость, то у вас ничего не выйдет.

если вы внимательно изучали особенности яндекс.пробок - вы знаете, что 2 балла и зеленый цвет для отрезка на МКАД и 2 балла и зеленый цвет для переулка с односторонним движением в центре Москвы, на правой половине которого "перманентно напарковались" - это две большие разности.

например, условно скажу, что при всех занятых 5 полосах и скорости потока в 90км/ч пробки на МКАД покажут 2 балла. будет у вас огромное число машин, несущихся со скоростью 90км/ч, что даст большое число автомобилей.

в то же самое время пара-тройка машин, раз в минуту, проезжающих со скоростью 40 км/ч по тому переулку в центре тоже дадут значение 2 балла на яндекс.пробках потому для для этой улицы это и правда 2 балла загруженности.

бальность на яндексе - это величина определяющая, насколько сейчас по конкретной дороге (отрезке пути) с конкретной шириной и конкретным ограничением скорости плохо едется, относительно идеальной ситуации (движение со скоростью, равной ограничению - но чаще это нарушается водителями, либо недостижимо из-за других причин). бальность пробок никаким образом не связана с интенсивностью потока в абсолютной его величине. она определяется относительно соотношения, в том числе и по времени, минимальной, максимальной и средней величин движения по этому отрезку.

если вы хотите потом по баллам пробок на дорогах прикинуть число автомобилей в другом месте - у вас ничего не выйдет без знания идеальной ситуации на конкретном отрезке пути.

Re: Интерпретация облака кроссковариации

Добавлено: 21 мар 2013, 18:17
gamm
swdartvader писал(а):Если Вам не трудно - постарайтесь объяснить почему нет смысла
потому, что у вас нет ни нормальных данных, ни нормальной модели, описывающей явление.