Коэффициенты корреляции
возвращает матрицу коэффициентов корреляции для R = corrcoef(A)A, где столбцы A представляют случайные величины, а строки представляют наблюдения.
[ возвращает матрицу коэффициентов корреляции и матрицу p-значений для проверки гипотезы об отсутствии взаимосвязи между наблюдаемыми явлениями (нулевая гипотеза). Используйте этот синтаксис с любым из аргументов предыдущих синтаксисов. Если внедиагональный элемент R,P] = corrcoef(___)P меньше уровня значимости (по умолчанию 0.05), то соответствующая корреляция в R считается значимым. Этот синтаксис недопустим, если R содержит сложные элементы.
___ = corrcoef(___, возвращает любой из выходных аргументов из предыдущих синтаксисов с дополнительными опциями, заданными одним или несколькими Name,Value)Name,Value аргументы пары. Например, corrcoef(A,'Alpha',0.1) задает доверительный интервал 90%, и corrcoef(A,'Rows','complete') пропускает все строки A содержащий один или несколько NaN значения.
Вычислите коэффициенты корреляции для матрицы с двумя нормально распределенными, случайными столбцами и одним столбцом, который определен в терминах другого. С третьего столбца A кратно второй, эти две переменные непосредственно коррелируются, таким образом, коэффициент корреляции в (2,3) и (3,2) записи R является 1.
x = randn(6,1); y = randn(6,1); A = [x y 2*y+3]; R = corrcoef(A)
R = 3×3
1.0000 -0.6237 -0.6237
-0.6237 1.0000 1.0000
-0.6237 1.0000 1.0000
Вычислите матрицу коэффициентов корреляции между двумя нормально распределенными случайными векторами по 10 наблюдений каждый.
A = randn(10,1); B = randn(10,1); R = corrcoef(A,B)
R = 2×2
1.0000 0.4518
0.4518 1.0000
Вычислите коэффициенты корреляции и p-значения нормально распределенной случайной матрицы с добавленным четвертым столбцом, равным сумме трех других столбцов. С момента последнего столбца A является линейной комбинацией других переменных, вводится корреляция между четвертой переменной и каждой из трех других переменных. Следовательно, четвертая строка и четвертый столбец P содержат очень маленькие p-значения, идентифицируя их как значимые корреляции.
A = randn(50,3); A(:,4) = sum(A,2); [R,P] = corrcoef(A)
R = 4×4
1.0000 0.1135 0.0879 0.7314
0.1135 1.0000 -0.1451 0.5082
0.0879 -0.1451 1.0000 0.5199
0.7314 0.5082 0.5199 1.0000
P = 4×4
1.0000 0.4325 0.5438 0.0000
0.4325 1.0000 0.3146 0.0002
0.5438 0.3146 1.0000 0.0001
0.0000 0.0002 0.0001 1.0000
Создайте нормально распределенную случайную матрицу с добавленным четвертым столбцом, равным сумме трех других столбцов, и вычислите коэффициенты корреляции, p-значения и нижнюю и верхнюю границы коэффициентов.
A = randn(50,3); A(:,4) = sum(A,2); [R,P,RL,RU] = corrcoef(A)
R = 4×4
1.0000 0.1135 0.0879 0.7314
0.1135 1.0000 -0.1451 0.5082
0.0879 -0.1451 1.0000 0.5199
0.7314 0.5082 0.5199 1.0000
P = 4×4
1.0000 0.4325 0.5438 0.0000
0.4325 1.0000 0.3146 0.0002
0.5438 0.3146 1.0000 0.0001
0.0000 0.0002 0.0001 1.0000
RL = 4×4
1.0000 -0.1702 -0.1952 0.5688
-0.1702 1.0000 -0.4070 0.2677
-0.1952 -0.4070 1.0000 0.2825
0.5688 0.2677 0.2825 1.0000
RU = 4×4
1.0000 0.3799 0.3575 0.8389
0.3799 1.0000 0.1388 0.6890
0.3575 0.1388 1.0000 0.6974
0.8389 0.6890 0.6974 1.0000
Матрицы RL и RU задайте нижнюю и верхнюю границы соответственно для каждого коэффициента корреляции в соответствии с 95% доверительным интервалом по умолчанию. Можно изменить уровень достоверности, указав значение Alpha, которая определяет процент достоверности, 100*(1-Alpha)%. Например, используйте Alpha значение, равное 0,01, для вычисления 99% доверительного интервала, который отражается в границах RL и RU. Интервалы, определяемые пределами коэффициентов в RL и RU являются большими для 99% достоверности по сравнению с 95%, поскольку более высокая уверенность требует более широкого диапазона значений потенциальной корреляции.
[R,P,RL,RU] = corrcoef(A,'Alpha',0.01)R = 4×4
1.0000 0.1135 0.0879 0.7314
0.1135 1.0000 -0.1451 0.5082
0.0879 -0.1451 1.0000 0.5199
0.7314 0.5082 0.5199 1.0000
P = 4×4
1.0000 0.4325 0.5438 0.0000
0.4325 1.0000 0.3146 0.0002
0.5438 0.3146 1.0000 0.0001
0.0000 0.0002 0.0001 1.0000
RL = 4×4
1.0000 -0.2559 -0.2799 0.5049
-0.2559 1.0000 -0.4792 0.1825
-0.2799 -0.4792 1.0000 0.1979
0.5049 0.1825 0.1979 1.0000
RU = 4×4
1.0000 0.4540 0.4332 0.8636
0.4540 1.0000 0.2256 0.7334
0.4332 0.2256 1.0000 0.7407
0.8636 0.7334 0.7407 1.0000
NaN ЦенностиСоздание нормально распределенной матрицы с участием NaN и вычислить матрицу коэффициентов корреляции, исключая любые строки, которые содержат NaN.
A = randn(5,3); A(1,3) = NaN; A(3,2) = NaN; A
A = 5×3
0.5377 -1.3077 NaN
1.8339 -0.4336 3.0349
-2.2588 NaN 0.7254
0.8622 3.5784 -0.0631
0.3188 2.7694 0.7147
R = corrcoef(A,'Rows','complete')
R = 3×3
1.0000 -0.8506 0.8222
-0.8506 1.0000 -0.9987
0.8222 -0.9987 1.0000
Использовать 'all' для включения всех NaN значения в расчете.
R = corrcoef(A,'Rows','all')
R = 3×3
1 NaN NaN
NaN NaN NaN
NaN NaN NaN
Использовать 'pairwise' вычисляют каждый коэффициент корреляции из двух столбцов попарно. Если один из двух столбцов содержит NaN, эта строка опущена.
R = corrcoef(A,'Rows','pairwise')
R = 3×3
1.0000 -0.3388 0.4649
-0.3388 1.0000 -0.9987
0.4649 -0.9987 1.0000
A - Входной массивВходной массив, заданный как матрица.
Если A является скаляром, corrcoef(A) прибыль NaN.
Если A является вектором, corrcoef(A) прибыль 1.
Типы данных: single | double
Поддержка комплексного номера: Да
B - Дополнительный входной массивДополнительный входной массив, заданный как вектор, матрица или многомерный массив.
A и B должен быть одинакового размера.
Если A и B являются скалярами, то corrcoef(A,B) прибыль 1. Если A и B равны, однако corrcoef(A,B) прибыль NaN.
Если A и B являются матрицами или многомерными массивами, то corrcoef(A,B) преобразует каждый ввод в векторное представление и эквивалентен corrcoef(A(:),B(:)) или corrcoef([A(:) B(:)]).
Если A и B пустые массивы: 0 на 0, corrcoef(A,B) возвращает матрицу 2 на 2 NaN значения.
Типы данных: single | double
Поддержка комплексного номера: Да
Укажите дополнительные пары, разделенные запятыми Name,Value аргументы. Name является именем аргумента и Value - соответствующее значение. Name должен отображаться внутри кавычек. Можно указать несколько аргументов пары имен и значений в любом порядке как Name1,Value1,...,NameN,ValueN.
R = corrcoef(A,'Alpha',0.03)'Alpha' - Уровень значимостиУровень значимости, указанный как число от 0 до 1. Значение 'Alpha' параметр определяет процентный уровень достоверности, 100 * (1-Alpha)%, для коэффициентов корреляции, которые определяют границы в RL и RU.
Типы данных: single | double
'Rows' - Использование NaN выбор'all' (по умолчанию) | 'complete' | 'pairwise'Использование NaN , указанное как одно из следующих значений:
'all' - Включить все NaN значения на входе перед вычислением коэффициентов корреляции.
'complete' - Опустить любые строки ввода, содержащие NaN значения перед вычислением коэффициентов корреляции. Эта опция всегда возвращает положительную полуопределённую матрицу.
'pairwise' - Опустить любые строки, содержащие NaN только на парной основе для каждого вычисления коэффициента корреляции из двух столбцов. Эта опция может возвращать матрицу, которая не является положительной полуопределённой.
Типы данных: char
R - Коэффициенты корреляцииКоэффициенты корреляции, возвращаемые в виде матрицы.
Для одного ввода матрицы R имеет размер [size(A,2) size(A,2)] на основе числа случайных величин (столбцов), представленных A. Диагональные элементы устанавливаются равными единицам по условию, в то время как внедиагональные элементы являются коэффициентами корреляции пар переменных. Значения коэффициентов могут находиться в диапазоне от -1 до 1, где -1 представляет прямую, отрицательную корреляцию, 0 не представляет корреляцию и 1 представляет прямую, положительную корреляцию. R симметричен.
Для двух входных аргументов R является матрицей 2 на 2 с единицами по диагонали и коэффициентами корреляции по диагонали.
Если любая случайная величина постоянна, ее корреляция со всеми другими переменными не определена, и соответствующие значение строки и столбца равно NaN.
P - P-значенияP-значения, возвращаемые в виде матрицы. P симметричен и имеет тот же размер, что и R. Все диагональные элементы являются единицами, а внедиагональные элементы являются значениями p для каждой пары переменных. P-значения находятся в диапазоне от 0 до 1, где значения, близкие к 0, соответствуют значимой корреляции в R и низкая вероятность наблюдения нулевой гипотезы.
RL - Нижняя граница для коэффициента корреляцииНижняя граница для коэффициента корреляции, возвращаемого в виде матрицы. RL симметричен и имеет тот же размер, что и R. Все диагональные записи являются единицами, а внедиагональные записи являются нижней границей 95% доверительного интервала для соответствующего коэффициента в R. Возвращаемый синтаксис RL недействителен, если R содержит комплексные значения.
RU - Верхняя граница для коэффициента корреляцииВерхняя граница для коэффициента корреляции, возвращаемого в виде матрицы. RU симметричен и имеет тот же размер, что и R. Все диагональные записи являются единицами, а внедиагональные записи являются верхней границей 95% доверительного интервала для соответствующего коэффициента в R. Возвращаемый синтаксис RL недействителен, если R содержит комплексные значения.
Коэффициент корреляции двух случайных величин является мерой их линейной зависимости. Если каждая переменная имеет N скалярных наблюдений, то коэффициент корреляции Пирсона определяется как
− мкВ, B),
где и - среднее и стандартное отклонение А, соответственно, а и - среднее и стандартное отклонение В. В качестве альтернативы можно определить коэффициент корреляции в терминах ковариации А и В:
)
Матрица коэффициентов корреляции двух случайных величин является матрицей коэффициентов корреляции для каждой комбинации парных переменных,
A) (B, B)).
Поскольку A и B всегда напрямую соотносятся с собой, диагональные элементы равны всего 1, то есть
A) 1).
[1] Фишер, Р. А. Статистические методы для научных работников, 13-е изд., Хафнер, 1958.
[2] Кендалл, М. Г. Продвинутая теория статистики, 4-й ред., Макмиллан, 1979.
[3] Пресса, W.H., Teukolsky, S.A., Vetterling, W.T. и Flannery, B.P. Численные рецепты в C, 2-е изд., Cambridge University Press, 1992.
Примечания и ограничения по использованию:
A и B должен иметь одинаковый размер, даже если оба являются векторами.
Исходные данные A и B не может быть скаляром для corrcoef(A,B).
Второй вход B должно быть 2-D.
'pairwise' параметр не поддерживается.
Дополнительные сведения см. в разделе Массивы Tall.
Примечания и ограничения по использованию:
Ввод вектора строки поддерживается только в том случае, если первые два ввода являются векторами и нескалярными.
Эта функция полностью поддерживает массивы графических процессоров. Дополнительные сведения см. в разделе Запуск функций MATLAB на графическом процессоре (панель инструментов параллельных вычислений).
Эта функция полностью поддерживает распределенные массивы. Дополнительные сведения см. в разделе Запуск функций MATLAB с распределенными массивами (панель инструментов параллельных вычислений).
cov | mean | plotmatrix | std
Имеется измененная версия этого примера. Открыть этот пример с помощью изменений?
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.