GIS-LAB

Географические информационные системы и дистанционное зондирование

Расчет коэффициента линейной корреляции

Несколько способов рассчитать коэффициент линейной корреляции между несколькими GRID-файлами в Arcview 3.x и Arcinfo Workstation

Обсудить в форуме Комментариев — 1

В данной заметке рассматривается вопрос расчета коэффициента линейной корреляции (также известной как корреляции Пирсона (Pearson, 1888)), расчет кросс-кореляции (cross-corelation), корреляции по методу наименьших квадратов (least squares correlation), условных корреляций не рассматривается.

Коэффициент корреляции (КК) - важный показатель показывающий взаимосвязь между двумя наборами данных. ККК может принимать значения от -1 до 1. Отрицательный КК показывает что данные взаимосвязанно расходятся, при возрастании значений одних из них значения другой убывают, положительный - что данные взаимосвязанно растут, 0 и близкие значения говорят о том, что данные не связаны друг с другом. Следует помнить, что КК неисключительный математический показатель, который может не иметь никаких связей с реальной ситуацией, так же возможна ситуация, когда 2 набора данных не связаны между собой, но сильно коррелируют через третий набор (т.н. условная корреляция) и т.д.

Формула, по которой вычисляется коэффициент линейной корреляции:

Хорошим примером применения корреляции является процедура поиска соответствие между окнами поиска (Image Matching) при привязке одного растрового изображения к другому в ERDAS IMAGINE.

В целом применение и интепретация КК зависит от конкретной задачи. Значимость определенного коэффициента корреляции зависит от объема выборок

Расчет корреляционной матрицы (КМ) между N-ным количеством растров в формате GRID.
КМ представляет из себя матрицу N*N значений, каждое из которых показывает КК между 2-мя растрами.
Например КМ 3-х растров будет иметь вид:

 

Растр 1

Растр 2

Растр 3

Растр 1

1

0.33

0.81

Растр 2

0.33

1

0.54

Растр 3

0.81

0.54

1

То есть КК считается по отдельности для каждой пары растров, включая КК растра с самим собой (КК в этом случае равен 1). Таким образом в такой таблице заложена некоторая избыточность.

Расчет КМ в Arcview 3.x


Для расчета КМ может использоваться данный скрипт (модифицированная версия скрипта Kenneth R. McVay). Скрипт может работать с несколькими растрами в формате GRID, результатом работы является текстовый файл с матрицей корреляции описанной выше.

Расчет КК в Arcinfo Workstation


Расчет простого КК между двумя растрами в формате GRID может также осуществляется в модуле GRID пакета AI Workstation. Для расчета КК используется команда CORRELATION.
Пример (жирным шрифтом - вводимые команды):

Arc: grid
Grid: correlation ingrid outgrid
Correlation: 0.9986432

КК считается только между двумя растрами. Математический аппарат Arcinfo также дает возможность рассчитывать коэффициенты пространственной автокорреляции, показывающие равномерность распределения значения внутри единственного поля, эти показатели анализируют пространственную корреляцию пикселов между собой (автокорреляция).


Заметка нуждается в следующих добавлениях, продолжениях:
1. Пример тематической задачи с применением КК на практике
2. Описание проблемы корреляции каналов данных ДЗЗ

Если вы можете помочь с одним из этих пунктов, напишите нам, мы с удовольствием разместим их на GIS-Lab.

Обсудить в форуме Комментариев — 1

Последнее обновление: November 18 2010

Дата создания: 12.05.2004
Автор(ы): Максим Дубинин


(Геокруг)

Если Вы обнаружили на сайте ошибку, выберите фрагмент текста и нажмите Ctrl+Enter