exponenta event banner

Линейная корреляция

Введение

Корреляция количественно определяет силу линейной зависимости между двумя переменными. При отсутствии корреляции между двумя переменными отсутствует тенденция увеличения или уменьшения значений переменных в тандеме. Однако две несвязанные переменные не обязательно независимы, поскольку они могут иметь нелинейные отношения.

Можно использовать линейную корреляцию, чтобы выяснить, существует ли линейная взаимосвязь между переменными, не предполагая и не подгоняя определенную модель к данным. Две переменные, которые имеют небольшую линейную корреляцию или не имеют ее, могут иметь сильную нелинейную связь. Однако вычисление линейной корреляции перед подгонкой модели является полезным способом определения переменных, имеющих простую взаимосвязь. Еще один способ изучить, как переменные связаны, - сделать графики рассеяния данных.

Ковариация количественно определяет силу линейной зависимости между двумя переменными в единицах относительно их дисперсий. Корреляции - это стандартизированные ковариации, дающие безразмерную величину, которая измеряет степень линейной зависимости, отдельно от масштаба любой переменной.

Следующие функции MATLAB ® вычисляют коэффициенты корреляции выборки и ковариацию. Эти коэффициенты выборки представляют собой оценки истинной ковариации и коэффициентов корреляции населения, из которого берется выборка данных.

Функция

Описание

corrcoef

Матрица коэффициентов корреляции

cov

Ковариационная матрица

xcorr

Последовательность взаимной корреляции случайного процесса (включает автокорреляцию)

Ковариация

Использование MATLAB cov функция для вычисления выборки ковариационной матрицы для матрицы данных (где каждый столбец представляет отдельную величину).

Образец ковариационной матрицы имеет следующие свойства:

  • cov(X) симметричен.

  • diag(cov(X)) - вектор отклонений для каждого столбца данных. Отклонения представляют собой меру разброса или дисперсии данных в соответствующем столбце. ( var функция вычисляет дисперсию.)

  • sqrt(diag(cov(X))) - вектор стандартных отклонений. ( std функция вычисляет стандартное отклонение.)

  • Внедиагональные элементы ковариационной матрицы представляют ковариации между отдельными столбцами данных.

Здесь, X может быть вектором или матрицей. Для матрицы m-на-n ковариационная матрица является матрицей n-на-n.

В качестве примера вычисления ковариации загрузите данные выборки в count.dat которая содержит матрицу 24 на 3:

load count.dat

Вычислите ковариационную матрицу для этих данных:

cov(count)

MATLAB отвечает следующим результатом:

ans =
    1.0e+003 *
       0.6437  0.9802  1.6567
       0.9802  1.7144  2.6908
       1.6567  2.6908  4.6278

Ковариационная матрица для этих данных имеет следующий вид:

[s211s212s213s221s222s223s231s232s233]s2ij=s2ji

Здесь s2ij - выборка ковариации между столбцом i и столбцом j данных. Потому что count матрица содержит три столбца, ковариационная матрица - 3 на 3.

Примечание

В частном случае, когда вектор является аргументом covфункция возвращает дисперсию.

Коэффициенты корреляции

Функция corrcoef создает матрицу выборочных коэффициентов корреляции для матрицы данных (где каждый столбец представляет отдельную величину). Коэффициенты корреляции находятся в диапазоне от -1 до 1, где

  • Значения, близкие к 1, указывают на наличие положительной линейной взаимосвязи между столбцами данных.

  • Значения, близкие к -1, указывают, что один столбец данных имеет отрицательную линейную связь с другим столбцом данных (антикорреляция).

  • Значения, близкие или равные 0, предполагают отсутствие линейной взаимосвязи между столбцами данных.

Для матрицы m-на-n матрица коэффициента корреляции является матрицей n-на-n. Расположение элементов в матрице коэффициентов корреляции соответствует расположению элементов в ковариационной матрице, как описано в разделе Ковариация.

Для примера вычисления коэффициентов корреляции загрузите данные выборки в count.dat которая содержит матрицу 24 на 3:

load count.dat

Для вычисления коэффициентов корреляции введите следующий синтаксис:

corrcoef(count)

Это приводит к следующей матрице коэффициентов корреляции 3 на 3:

ans = 
    1.0000    0.9331    0.9599
    0.9331    1.0000    0.9553
    0.9599    0.9553    1.0000

Поскольку все коэффициенты корреляции близки к 1, существует сильная положительная корреляция между каждой парой столбцов данных в count матрица.