exponenta event banner

corrcoef

Коэффициенты корреляции

Описание

пример

R = corrcoef(A) возвращает матрицу коэффициентов корреляции для A, где столбцы A представляют случайные величины, а строки представляют наблюдения.

пример

R = corrcoef(A,B) возвращает коэффициенты между двумя случайными переменными A и B.

пример

[R,P] = corrcoef(___) возвращает матрицу коэффициентов корреляции и матрицу p-значений для проверки гипотезы об отсутствии взаимосвязи между наблюдаемыми явлениями (нулевая гипотеза). Используйте этот синтаксис с любым из аргументов предыдущих синтаксисов. Если внедиагональный элемент P меньше уровня значимости (по умолчанию 0.05), то соответствующая корреляция в R считается значимым. Этот синтаксис недопустим, если R содержит сложные элементы.

пример

[R,P,RL,RU] = corrcoef(___) включает в себя матрицы, содержащие нижнюю и верхнюю границы для 95% доверительного интервала для каждого коэффициента. Этот синтаксис недопустим, если R содержит сложные элементы.

пример

___ = corrcoef(___,Name,Value) возвращает любой из выходных аргументов из предыдущих синтаксисов с дополнительными опциями, заданными одним или несколькими Name,Value аргументы пары. Например, corrcoef(A,'Alpha',0.1) задает доверительный интервал 90%, и corrcoef(A,'Rows','complete') пропускает все строки A содержащий один или несколько NaN значения.

Примеры

свернуть все

Вычислите коэффициенты корреляции для матрицы с двумя нормально распределенными, случайными столбцами и одним столбцом, который определен в терминах другого. С третьего столбца A кратно второй, эти две переменные непосредственно коррелируются, таким образом, коэффициент корреляции в (2,3) и (3,2) записи R является 1.

x = randn(6,1);
y = randn(6,1);
A = [x y 2*y+3];
R = corrcoef(A)
R = 3×3

    1.0000   -0.6237   -0.6237
   -0.6237    1.0000    1.0000
   -0.6237    1.0000    1.0000

Вычислите матрицу коэффициентов корреляции между двумя нормально распределенными случайными векторами по 10 наблюдений каждый.

A = randn(10,1);
B = randn(10,1);
R = corrcoef(A,B)
R = 2×2

    1.0000    0.4518
    0.4518    1.0000

Вычислите коэффициенты корреляции и p-значения нормально распределенной случайной матрицы с добавленным четвертым столбцом, равным сумме трех других столбцов. С момента последнего столбца A является линейной комбинацией других переменных, вводится корреляция между четвертой переменной и каждой из трех других переменных. Следовательно, четвертая строка и четвертый столбец P содержат очень маленькие p-значения, идентифицируя их как значимые корреляции.

A = randn(50,3);       
A(:,4) = sum(A,2); 
[R,P] = corrcoef(A)
R = 4×4

    1.0000    0.1135    0.0879    0.7314
    0.1135    1.0000   -0.1451    0.5082
    0.0879   -0.1451    1.0000    0.5199
    0.7314    0.5082    0.5199    1.0000

P = 4×4

    1.0000    0.4325    0.5438    0.0000
    0.4325    1.0000    0.3146    0.0002
    0.5438    0.3146    1.0000    0.0001
    0.0000    0.0002    0.0001    1.0000

Создайте нормально распределенную случайную матрицу с добавленным четвертым столбцом, равным сумме трех других столбцов, и вычислите коэффициенты корреляции, p-значения и нижнюю и верхнюю границы коэффициентов.

A = randn(50,3);       
A(:,4) = sum(A,2); 
[R,P,RL,RU] = corrcoef(A)
R = 4×4

    1.0000    0.1135    0.0879    0.7314
    0.1135    1.0000   -0.1451    0.5082
    0.0879   -0.1451    1.0000    0.5199
    0.7314    0.5082    0.5199    1.0000

P = 4×4

    1.0000    0.4325    0.5438    0.0000
    0.4325    1.0000    0.3146    0.0002
    0.5438    0.3146    1.0000    0.0001
    0.0000    0.0002    0.0001    1.0000

RL = 4×4

    1.0000   -0.1702   -0.1952    0.5688
   -0.1702    1.0000   -0.4070    0.2677
   -0.1952   -0.4070    1.0000    0.2825
    0.5688    0.2677    0.2825    1.0000

RU = 4×4

    1.0000    0.3799    0.3575    0.8389
    0.3799    1.0000    0.1388    0.6890
    0.3575    0.1388    1.0000    0.6974
    0.8389    0.6890    0.6974    1.0000

Матрицы RL и RU задайте нижнюю и верхнюю границы соответственно для каждого коэффициента корреляции в соответствии с 95% доверительным интервалом по умолчанию. Можно изменить уровень достоверности, указав значение Alpha, которая определяет процент достоверности, 100*(1-Alpha)%. Например, используйте Alpha значение, равное 0,01, для вычисления 99% доверительного интервала, который отражается в границах RL и RU. Интервалы, определяемые пределами коэффициентов в RL и RU являются большими для 99% достоверности по сравнению с 95%, поскольку более высокая уверенность требует более широкого диапазона значений потенциальной корреляции.

[R,P,RL,RU] = corrcoef(A,'Alpha',0.01)
R = 4×4

    1.0000    0.1135    0.0879    0.7314
    0.1135    1.0000   -0.1451    0.5082
    0.0879   -0.1451    1.0000    0.5199
    0.7314    0.5082    0.5199    1.0000

P = 4×4

    1.0000    0.4325    0.5438    0.0000
    0.4325    1.0000    0.3146    0.0002
    0.5438    0.3146    1.0000    0.0001
    0.0000    0.0002    0.0001    1.0000

RL = 4×4

    1.0000   -0.2559   -0.2799    0.5049
   -0.2559    1.0000   -0.4792    0.1825
   -0.2799   -0.4792    1.0000    0.1979
    0.5049    0.1825    0.1979    1.0000

RU = 4×4

    1.0000    0.4540    0.4332    0.8636
    0.4540    1.0000    0.2256    0.7334
    0.4332    0.2256    1.0000    0.7407
    0.8636    0.7334    0.7407    1.0000

Создание нормально распределенной матрицы с участием NaN и вычислить матрицу коэффициентов корреляции, исключая любые строки, которые содержат NaN.

A = randn(5,3);
A(1,3) = NaN;
A(3,2) = NaN;
A
A = 5×3

    0.5377   -1.3077       NaN
    1.8339   -0.4336    3.0349
   -2.2588       NaN    0.7254
    0.8622    3.5784   -0.0631
    0.3188    2.7694    0.7147

R = corrcoef(A,'Rows','complete')
R = 3×3

    1.0000   -0.8506    0.8222
   -0.8506    1.0000   -0.9987
    0.8222   -0.9987    1.0000

Использовать 'all' для включения всех NaN значения в расчете.

R = corrcoef(A,'Rows','all')
R = 3×3

     1   NaN   NaN
   NaN   NaN   NaN
   NaN   NaN   NaN

Использовать 'pairwise' вычисляют каждый коэффициент корреляции из двух столбцов попарно. Если один из двух столбцов содержит NaN, эта строка опущена.

R = corrcoef(A,'Rows','pairwise')
R = 3×3

    1.0000   -0.3388    0.4649
   -0.3388    1.0000   -0.9987
    0.4649   -0.9987    1.0000

Входные аргументы

свернуть все

Входной массив, заданный как матрица.

  • Если A является скаляром, corrcoef(A) прибыль NaN.

  • Если A является вектором, corrcoef(A) прибыль 1.

Типы данных: single | double
Поддержка комплексного номера: Да

Дополнительный входной массив, заданный как вектор, матрица или многомерный массив.

  • A и B должен быть одинакового размера.

  • Если A и B являются скалярами, то corrcoef(A,B) прибыль 1. Если A и B равны, однако corrcoef(A,B) прибыль NaN.

  • Если A и B являются матрицами или многомерными массивами, то corrcoef(A,B) преобразует каждый ввод в векторное представление и эквивалентен corrcoef(A(:),B(:)) или corrcoef([A(:) B(:)]).

  • Если A и B пустые массивы: 0 на 0, corrcoef(A,B) возвращает матрицу 2 на 2 NaN значения.

Типы данных: single | double
Поддержка комплексного номера: Да

Аргументы пары «имя-значение»

Укажите дополнительные пары, разделенные запятыми Name,Value аргументы. Name является именем аргумента и Value - соответствующее значение. Name должен отображаться внутри кавычек. Можно указать несколько аргументов пары имен и значений в любом порядке как Name1,Value1,...,NameN,ValueN.

Пример: R = corrcoef(A,'Alpha',0.03)

Уровень значимости, указанный как число от 0 до 1. Значение 'Alpha' параметр определяет процентный уровень достоверности, 100 * (1-Alpha)%, для коэффициентов корреляции, которые определяют границы в RL и RU.

Типы данных: single | double

Использование NaN , указанное как одно из следующих значений:

  • 'all' - Включить все NaN значения на входе перед вычислением коэффициентов корреляции.

  • 'complete' - Опустить любые строки ввода, содержащие NaN значения перед вычислением коэффициентов корреляции. Эта опция всегда возвращает положительную полуопределённую матрицу.

  • 'pairwise' - Опустить любые строки, содержащие NaN только на парной основе для каждого вычисления коэффициента корреляции из двух столбцов. Эта опция может возвращать матрицу, которая не является положительной полуопределённой.

Типы данных: char

Выходные аргументы

свернуть все

Коэффициенты корреляции, возвращаемые в виде матрицы.

  • Для одного ввода матрицы R имеет размер [size(A,2) size(A,2)] на основе числа случайных величин (столбцов), представленных A. Диагональные элементы устанавливаются равными единицам по условию, в то время как внедиагональные элементы являются коэффициентами корреляции пар переменных. Значения коэффициентов могут находиться в диапазоне от -1 до 1, где -1 представляет прямую, отрицательную корреляцию, 0 не представляет корреляцию и 1 представляет прямую, положительную корреляцию. R симметричен.

  • Для двух входных аргументов R является матрицей 2 на 2 с единицами по диагонали и коэффициентами корреляции по диагонали.

  • Если любая случайная величина постоянна, ее корреляция со всеми другими переменными не определена, и соответствующие значение строки и столбца равно NaN.

P-значения, возвращаемые в виде матрицы. P симметричен и имеет тот же размер, что и R. Все диагональные элементы являются единицами, а внедиагональные элементы являются значениями p для каждой пары переменных. P-значения находятся в диапазоне от 0 до 1, где значения, близкие к 0, соответствуют значимой корреляции в R и низкая вероятность наблюдения нулевой гипотезы.

Нижняя граница для коэффициента корреляции, возвращаемого в виде матрицы. RL симметричен и имеет тот же размер, что и R. Все диагональные записи являются единицами, а внедиагональные записи являются нижней границей 95% доверительного интервала для соответствующего коэффициента в R. Возвращаемый синтаксис RL недействителен, если R содержит комплексные значения.

Верхняя граница для коэффициента корреляции, возвращаемого в виде матрицы. RU симметричен и имеет тот же размер, что и R. Все диагональные записи являются единицами, а внедиагональные записи являются верхней границей 95% доверительного интервала для соответствующего коэффициента в R. Возвращаемый синтаксис RL недействителен, если R содержит комплексные значения.

Подробнее

свернуть все

Коэффициент корреляции

Коэффициент корреляции двух случайных величин является мерой их линейной зависимости. Если каждая переменная имеет N скалярных наблюдений, то коэффициент корреляции Пирсона определяется как

(A, B) =1N−1∑i=1N (Ai мкА, A) (Bi − мкВ, B),

где мкА и startА - среднее и стандартное отклонение А, соответственно, а мкВ и В - среднее и стандартное отклонение В. В качестве альтернативы можно определить коэффициент корреляции в терминах ковариации А и В:

start( A, B) = cov (A, B)

Матрица коэффициентов корреляции двух случайных величин является матрицей коэффициентов корреляции для каждой комбинации парных переменных,

R = (start( A, A) (A, B) (B, A) (B, B)).

Поскольку A и B всегда напрямую соотносятся с собой, диагональные элементы равны всего 1, то есть

R = (1start( A, B) (B, A) 1).

Ссылки

[1] Фишер, Р. А. Статистические методы для научных работников, 13-е изд., Хафнер, 1958.

[2] Кендалл, М. Г. Продвинутая теория статистики, 4-й ред., Макмиллан, 1979.

[3] Пресса, W.H., Teukolsky, S.A., Vetterling, W.T. и Flannery, B.P. Численные рецепты в C, 2-е изд., Cambridge University Press, 1992.

Расширенные возможности

.

См. также

| | |

Представлен до R2006a