Линейная корреляция

Введение

Корреляция определяет количество силы линейного соотношения между двумя переменными. Когда нет никакой корреляции между двумя переменными, затем нет никакой тенденции для значений переменных, чтобы увеличиться или уменьшиться в тандеме. Две переменные, которые являются некоррелироваными, не обязательно независимы, однако, потому что у них может быть нелинейное отношение.

Можно использовать линейную корреляцию, чтобы заняться расследованиями, существует ли линейное соотношение между переменными, не имея необходимость принимать или соответствовать определенной модели к данным. Две переменные, которые имеют маленькое или никакую линейную корреляцию, могут иметь сильное нелинейное отношение. Однако вычисление линейной корреляции прежде, чем соответствовать модели является полезным способом идентифицировать переменные, которые имеют простое отношение. Другой способ исследовать, как переменные связаны, состоит в том, чтобы сделать графики рассеивания ваших данных.

Ковариация определяет количество силы линейного соотношения между двумя переменными в модулях относительно их отклонений. Корреляции являются стандартизированными ковариациями, давая безразмерное количество, которое измеряет градус линейного соотношения, отдельного от шкалы любой переменной.

Следующие три функции MATLAB® вычисляют демонстрационные коэффициенты корреляции и ковариацию. Эти демонстрационные коэффициенты являются оценками истинной ковариации и коэффициентами корреляции населения, от которого чертится выборка данных.

Функция

Описание

corrcoef

Матрица коэффициента корреляции

cov

Ковариационная матрица

xcorr (Обработка сигналов функция Toolbox™)

Последовательность взаимной корреляции вероятностного процесса (включает автокорреляцию),

Ковариация

Используйте функцию cov MATLAB, чтобы вычислить демонстрационную ковариационную матрицу для матрицы данных (где каждый столбец представляет отдельное количество).

Демонстрационная ковариационная матрица имеет следующие свойства:

  • cov(X) симметричен.

  • diag(cov(X)) является вектором отклонений для каждого столбца данных. Отклонения представляют меру распространения или дисперсию данных в соответствующем столбце. (Функция var вычисляет отклонение.)

  • sqrt(diag(cov(X))) является вектором стандартных отклонений. (Функция std вычисляет стандартное отклонение.)

  • Недиагональные элементы ковариационной матрицы представляют ковариации между отдельными столбцами данных.

Здесь, X может быть вектором или матрицей. Для матрицы m на n ковариационная матрица n на n.

Для примера вычисления ковариации загрузите демонстрационные данные в count.dat, который содержит 24 3 матрица:

load count.dat

Вычислите ковариационную матрицу для этого данные:

cov(count)

MATLAB отвечает следующим результатом:

ans =
    1.0e+003 *
       0.6437  0.9802  1.6567
       0.9802  1.7144  2.6908
       1.6567  2.6908  4.6278

Ковариационная матрица для этого данные имеет следующую форму:

[s211s212s213s221s222s223s231s232s233]s2ij=s2ji

Здесь, s2ij является демонстрационной ковариацией между столбцом i и столбцом j данных. Поскольку матрица count содержит три столбца, ковариационная матрица 3 3.

Примечание

В особом случае, когда вектор является аргументом cov, функция возвращает отклонение.

Коэффициенты корреляции

corrcoef функции MATLAB производит матрицу демонстрационных коэффициентов корреляции для матрицы данных (где каждый столбец представляет отдельное количество). Коэффициенты корреляции колеблются от-1 до 1, где

  • Значения близко к 1 указывают, что существует положительное линейное соотношение между столбцами данных.

  • Значения близко к-1 указывают, что один столбец данных имеет отрицательное линейное соотношение к другому столбцу данных (антикорреляция).

  • Значения близко к или равный 0 предполагают, что между столбцами данных нет никакого линейного соотношения.

Для матрицы m на n матрица коэффициента корреляции n на n. Расположение элементов в матрице коэффициента корреляции соответствует местоположению элементов в ковариационной матрице, как описано в Ковариации.

Для примера вычисления коэффициентов корреляции загрузите демонстрационные данные в count.dat, который содержит 24 3 матрица:

load count.dat

Введите следующий синтаксис, чтобы вычислить коэффициенты корреляции:

corrcoef(count)

Это приводит к следующему 3 3 матрица коэффициентов корреляции:

ans = 
    1.0000    0.9331    0.9599
    0.9331    1.0000    0.9553
    0.9599    0.9553    1.0000

Поскольку все коэффициенты корреляции близко к 1, существует сильная положительная корреляция между каждой парой столбцов данных в матрице count.

Была ли эта тема полезной?