corrcoef

Коэффициенты корреляции

Описание

пример

R = corrcoef(A) возвращает матрицу коэффициентов корреляции для A, где столбцы A представляйте случайные переменные, и строки представляют наблюдения.

пример

R = corrcoef(A,B) возвращает коэффициенты между двумя случайными переменными A и B.

пример

[R,P] = corrcoef(___) возвращает матрицу коэффициентов корреляции и матрицу p-значений для тестирования гипотезы, что нет никакого отношения между наблюдаемыми явлениями (нулевая гипотеза). Используйте этот синтаксис с любым из аргументов от предыдущих синтаксисов. Если недиагональный элемент P меньше, чем уровень значения (значением по умолчанию является 0.05), затем соответствующая корреляция в R рассматривается значительным. Этот синтаксис недопустим если R содержит комплексные элементы.

пример

[R,P,RL,RU] = corrcoef(___) включает матрицы, содержащие нижние и верхние границы для 95%-го доверительного интервала для каждого коэффициента. Этот синтаксис недопустим если R содержит комплексные элементы.

пример

___ = corrcoef(___,Name,Value) возвращает любой из выходных аргументов от предыдущих синтаксисов с дополнительными опциями, заданными одним или несколькими Name,Value парные аргументы. Например, corrcoef(A,'Alpha',0.1) задает 90%-й доверительный интервал и corrcoef(A,'Rows','complete') не использует все строки A содержа один или несколько NaN значения.

Примеры

свернуть все

Вычислите коэффициенты корреляции для матрицы с двумя нормально распределенными, случайными столбцами и одним столбцом, который задан в терминах другого. Начиная с третьего столбца A является кратным второму, эти две переменные непосредственно коррелируются, таким образом коэффициент корреляции в (2,3) и (3,2) записи R 1.

x = randn(6,1);
y = randn(6,1);
A = [x y 2*y+3];
R = corrcoef(A)
R = 3×3

    1.0000   -0.6237   -0.6237
   -0.6237    1.0000    1.0000
   -0.6237    1.0000    1.0000

Вычислите матрицу коэффициента корреляции между двумя нормально распределенными, случайными векторами из 10 наблюдений каждый.

A = randn(10,1);
B = randn(10,1);
R = corrcoef(A,B)
R = 2×2

    1.0000    0.4518
    0.4518    1.0000

Вычислите коэффициенты корреляции и p-значения нормально распределенной, случайной матрицы с добавленным четвертым столбцом, равным сумме других трех столбцов. Начиная с последнего столбца A линейная комбинация других, корреляция введена между четвертой переменной и каждой из других трех переменных. Поэтому четвертая строка и четвертый столбец P содержите очень маленькие p-значения, идентифицируя их как значительные корреляции.

A = randn(50,3);       
A(:,4) = sum(A,2); 
[R,P] = corrcoef(A)
R = 4×4

    1.0000    0.1135    0.0879    0.7314
    0.1135    1.0000   -0.1451    0.5082
    0.0879   -0.1451    1.0000    0.5199
    0.7314    0.5082    0.5199    1.0000

P = 4×4

    1.0000    0.4325    0.5438    0.0000
    0.4325    1.0000    0.3146    0.0002
    0.5438    0.3146    1.0000    0.0001
    0.0000    0.0002    0.0001    1.0000

Создайте нормально распределенную, случайную матрицу, с добавленным четвертым столбцом, равным сумме других трех столбцов, и вычислите коэффициенты корреляции, p-значения и нижние и верхние границы на коэффициентах.

A = randn(50,3);       
A(:,4) = sum(A,2); 
[R,P,RL,RU] = corrcoef(A)
R = 4×4

    1.0000    0.1135    0.0879    0.7314
    0.1135    1.0000   -0.1451    0.5082
    0.0879   -0.1451    1.0000    0.5199
    0.7314    0.5082    0.5199    1.0000

P = 4×4

    1.0000    0.4325    0.5438    0.0000
    0.4325    1.0000    0.3146    0.0002
    0.5438    0.3146    1.0000    0.0001
    0.0000    0.0002    0.0001    1.0000

RL = 4×4

    1.0000   -0.1702   -0.1952    0.5688
   -0.1702    1.0000   -0.4070    0.2677
   -0.1952   -0.4070    1.0000    0.2825
    0.5688    0.2677    0.2825    1.0000

RU = 4×4

    1.0000    0.3799    0.3575    0.8389
    0.3799    1.0000    0.1388    0.6890
    0.3575    0.1388    1.0000    0.6974
    0.8389    0.6890    0.6974    1.0000

Матрицы RL и RU дайте нижние и верхние границы, соответственно, на каждом коэффициенте корреляции согласно 95%-му доверительному интервалу по умолчанию. Можно изменить доверительный уровень путем определения значения Alpha, который задает доверие процента, 100*(1-Alpha)%. Например, используйте Alpha значение, равное 0,01, чтобы вычислить 99%-й доверительный интервал, который отражается в границах RL и RU. Интервалы, заданные коэффициентом, ограничивают в RL и RU больше для 99%-го доверия по сравнению с 95%, поскольку более высокое доверие требует более содержащей области значений потенциальных значений корреляции.

[R,P,RL,RU] = corrcoef(A,'Alpha',0.01)
R = 4×4

    1.0000    0.1135    0.0879    0.7314
    0.1135    1.0000   -0.1451    0.5082
    0.0879   -0.1451    1.0000    0.5199
    0.7314    0.5082    0.5199    1.0000

P = 4×4

    1.0000    0.4325    0.5438    0.0000
    0.4325    1.0000    0.3146    0.0002
    0.5438    0.3146    1.0000    0.0001
    0.0000    0.0002    0.0001    1.0000

RL = 4×4

    1.0000   -0.2559   -0.2799    0.5049
   -0.2559    1.0000   -0.4792    0.1825
   -0.2799   -0.4792    1.0000    0.1979
    0.5049    0.1825    0.1979    1.0000

RU = 4×4

    1.0000    0.4540    0.4332    0.8636
    0.4540    1.0000    0.2256    0.7334
    0.4332    0.2256    1.0000    0.7407
    0.8636    0.7334    0.7407    1.0000

Создайте нормально распределенную матрицу, включающую NaN значения, и вычисляют матрицу коэффициента корреляции, исключая любые строки, которые содержат NaN.

A = randn(5,3);
A(1,3) = NaN;
A(3,2) = NaN;
A
A = 5×3

    0.5377   -1.3077       NaN
    1.8339   -0.4336    3.0349
   -2.2588       NaN    0.7254
    0.8622    3.5784   -0.0631
    0.3188    2.7694    0.7147

R = corrcoef(A,'Rows','complete')
R = 3×3

    1.0000   -0.8506    0.8222
   -0.8506    1.0000   -0.9987
    0.8222   -0.9987    1.0000

Используйте 'all' включать весь NaN значения в вычислении.

R = corrcoef(A,'Rows','all')
R = 3×3

     1   NaN   NaN
   NaN   NaN   NaN
   NaN   NaN   NaN

Используйте 'pairwise' вычислить каждый коэффициент корреляции 2D столбца на попарном базисе. Если один из этих двух столбцов содержит NaN, та строка не использована.

R = corrcoef(A,'Rows','pairwise')
R = 3×3

    1.0000   -0.3388    0.4649
   -0.3388    1.0000   -0.9987
    0.4649   -0.9987    1.0000

Входные параметры

свернуть все

Входной массив в виде матрицы.

  • Если A скаляр, corrcoef(A) возвращает NaN.

  • Если A вектор, corrcoef(A) возвращает 1.

Типы данных: single | double
Поддержка комплексного числа: Да

Дополнительный входной массив в виде вектора, матрицы или многомерного массива.

  • A и B должен быть одного размера.

  • Если A и B скаляры, затем corrcoef(A,B) возвращает 1. Если A и B равны, однако, corrcoef(A,B) возвращает NaN.

  • Если A и B матрицы или многомерные массивы, затем corrcoef(A,B) преобразует каждый вход в его векторное представление и эквивалентен corrcoef(A(:),B(:)) или corrcoef([A(:) B(:)]).

  • Если A и B пустые массивы 0 на 0, corrcoef(A,B) возвращает матрицу 2 на 2 NaN значения.

Типы данных: single | double
Поддержка комплексного числа: Да

Аргументы name-value

Задайте дополнительные разделенные запятой пары Name,Value аргументы. Name имя аргумента и Value соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Пример: R = corrcoef(A,'Alpha',0.03)

Уровень значения в виде номера между 0 и 1. Значение 'Alpha' параметр задает доверительный уровень процента, 100* (1-Alpha) %, для коэффициентов корреляции, который определяет границы в RL и RU.

Типы данных: single | double

Использование NaN опция в виде одного из этих значений:

  • 'all' — Включайте весь NaN значения во входе прежде, чем вычислить коэффициенты корреляции.

  • 'complete' — Не используйте любые строки входа, содержащего NaN значения прежде, чем вычислить коэффициенты корреляции. Эта опция всегда возвращает положительную полуопределенную матрицу.

  • 'pairwise' — Не используйте любые строки, содержащие NaN только на попарном базисе для каждого вычисления коэффициента корреляции 2D столбца. Эта опция может возвратить матрицу, которая не является положительна полуопределенный.

Типы данных: char

Выходные аргументы

свернуть все

Коэффициенты корреляции, возвращенные как матрица.

  • Для одного матричного входа, R имеет размер [size(A,2) size(A,2)] на основе количества случайных переменных (столбцы) представлен A. Диагональные элементы установлены в один условно, в то время как недиагональные записи являются коэффициентами корреляции переменных пар. Значения коэффициентов могут лежать в диапазоне от-1 до 1, с-1 представлением прямой, отрицательной корреляции, 0 представлениями никакой корреляции и 1 представлением прямой, положительной корреляции. R issymmetric.

  • Для двух входных параметров, R матрица 2 на 2 с единицами по диагонали и коэффициентами корреляции вдоль недиагонального.

  • Если какая-либо случайная переменная является постоянной, ее корреляция со всеми другими переменными не определена, и соответствующим значением строки и столбца является NaN.

P-значения, возвращенные как матрица. P симметрично и одного размера с R. Диагональные элементы являются всеми единицами, и недиагональные записи являются p-значениями для каждой переменной пары. P-значения лежат в диапазоне от 0 до 1, где значения близко к 0 соответствуют значительной корреляции в R и низкая вероятность наблюдения нулевой гипотезы.

Нижняя граница для коэффициента корреляции, возвращенного как матрица. RL симметрично и одного размера с R. Диагональные элементы являются всеми единицами, и недиагональные записи являются 95%-й нижней границей доверительного интервала для соответствующего коэффициента в R. Синтаксис, возвращающий RL недопустимо если R содержит комплексные числа.

Верхняя граница для коэффициента корреляции, возвращенного как матрица. RU симметрично и одного размера с R. Диагональные элементы являются всеми единицами, и недиагональные записи являются 95%-й верхней границей доверительного интервала для соответствующего коэффициента в R. Синтаксис, возвращающий RL недопустимо если R содержит комплексные числа.

Больше о

свернуть все

Коэффициент корреляции

Коэффициент корреляции двух случайных переменных является мерой их линейной зависимости. Если каждая переменная имеет скалярные наблюдения N, то Коэффициент корреляции пирсона задан как

ρ(A,B)=1N1i=1N(AiμAσA)(BiμBσB),

где μA и σA среднее и стандартное отклонение A, соответственно, и μB и σB среднее и стандартное отклонение B. В качестве альтернативы можно задать коэффициент корреляции в терминах ковариации A и B:

ρ(A,B)=cov(A,B)σAσB.

Матрица коэффициента корреляции двух случайных переменных является матрицей коэффициентов корреляции для каждой попарной переменной комбинации,

R=(ρ(A,A)ρ(A,B)ρ(B,A)ρ(B,B)).

Поскольку A и B всегда непосредственно коррелируются себе, диагональные элементы равняются всего 1, то есть,

R=(1ρ(A,B)ρ(B,A)1).

Ссылки

[1] Фишер, R.A. Статистические методы для научных работников, 13-го Эда., Hafner, 1958.

[2] Кендалл, M.G. Усовершенствованная теория статистики, 4-го Эда., Макмиллан, 1979.

[3] Нажмите, W.H., Teukolsky, S.A., Vetterling, W.T., и Flannery, B.P. Числовые рецепты в C, 2-м Эде., издательство Кембриджского университета, 1992.

Расширенные возможности

Смотрите также

| | |

Представлено до R2006a