corrplot

Постройте переменные корреляции

Синтаксис

corrplot(X)
corrplot(X,Name,Value)
R = corrplot(___)
[R,PValue] = corrplot(___)
corrplot(ax,___)
[R,PValue,H] = corrplot(___)

Описание

пример

corrplot(X) создает матрицу графиков, показывающих корреляции среди пар переменных в X. Гистограммы переменных появляются по матричной диагонали; графики рассеивания переменных пар появляются в от диагонали. Наклоны строк ссылки наименьших квадратов в графиках рассеивания равны отображенным коэффициентам корреляции.

пример

corrplot(X,Name,Value) дополнительные опции использования заданы одним или несколькими аргументами пары "имя-значение". Например, corrplot(X,'type','Spearman','testR','on') вычисляет коэффициент порядковой корреляции Копьеносца и тестирует на значительные коэффициенты корреляции.

пример

R = corrplot(___) возвращает корреляционную матрицу X, отображенного в графиках с помощью любой из комбинаций входных аргументов в предыдущих синтаксисах.

пример

[R,PValue] = corrplot(___) дополнительно возвращает p - значения, следующие из теста нулевой гипотезы никакой корреляции против альтернативы для ненулевой корреляции. Элементы PValue соответствуют элементам R.

corrplot(ax,___) графики на осях заданы ax вместо текущей системы координат (gca). ax может предшествовать любой из комбинаций входных аргументов в предыдущих синтаксисах.

[R,PValue,H] = corrplot(___) дополнительно возвращает указатели на нанесенные на график графические объекты. Используйте элементы h, чтобы изменить свойства графика после того, как вы создадите его.

Примеры

свернуть все

Постройте корреляции между несколькими временными рядами.

Загрузите данные по канадской инфляции и процентным ставкам.

load Data_Canada

Постройте коэффициенты линейной корреляции Пирсона между всеми парами переменных.

corrplot(DataTable)

График корреляции показывает, что краткосрочные, среднесрочные, и долгосрочные процентные ставки высоко коррелируются.

Чтобы исследовать метку времени данной величины, введите gname(dates) в Командное окно, и программное обеспечение представляет интерактивное перекрестие по графику. Чтобы представить метку времени данной величины, кликните по нему с помощью перекрестия.

Постройте порядковые корреляции Кендалла между несколькими временными рядами. Проведите тест гипотезы, чтобы определить, какие корреляции существенно отличаются от нуля.

Загрузите данные по канадской инфляции и процентным ставкам.

load Data_Canada

Постройте коэффициенты порядковой корреляции Кендалла между всеми парами переменных. Задайте тест гипотезы, чтобы определить, какие корреляции существенно отличаются от нуля.

corrplot(DataTable,'type','Kendall','testR','on')

Коэффициенты корреляции, подсвеченные в красном, указывают, какие пары переменных имеют корреляции, существенно отличающиеся от нуля. Для этих временных рядов все пары переменных имеют корреляции, существенно отличающиеся от нуля.

Протестируйте на корреляции, больше, чем нуль между несколькими временными рядами.

Загрузите данные по канадской инфляции и процентным ставкам.

load Data_Canada

Возвратите корреляции попарного Пирсона и соответствующие p-значения для тестирования нулевой гипотезы никакой корреляции против альтернативы с правильным хвостом, что корреляции больше, чем нуль.

[R,PValue] = corrplot(DataTable,'tail','right');

PValue
PValue = 5×5

    1.0000    0.0000    0.0000    0.0000    0.0000
    0.0000    1.0000    0.0000    0.0000    0.0001
    0.0000    0.0000    1.0000    0.0000    0.0000
    0.0000    0.0000    0.0000    1.0000    0.0000
    0.0000    0.0001    0.0000    0.0000    1.0000

Вывод PValue имеет попарные p-значения что-то меньшее чем значение по умолчанию 0,05 уровня значения, указывая, что все пары переменных имеют корреляцию, значительно больше, чем нуль.

Входные параметры

свернуть все

Ряд данных, что использование corrplot, чтобы построить корреляции, заданные как numObs-by-numVars числовой матричный или табличный массив. X состоит из наблюдений numObs, сделанных на переменных numVars, и строит корреляции между переменными numVars.

Если X является табличным массивом, то переменные должны быть числовыми.

Типы данных: double | table

Оси, на которых можно построить, заданный как объект Axes.

По умолчанию corrplot строит к текущей системе координат (gca).

corrplot не поддерживает цели UIAxes.

Аргументы в виде пар имя-значение

Укажите необязательные аргументы в виде пар ""имя, значение"", разделенных запятыми. Имя (Name) — это имя аргумента, а значение (Value) — соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Пример: 'tails','right','alpha',0.1 задает тесты с правильным хвостом на 0,1 уровнях значения

Коэффициент корреляции, чтобы вычислить, заданный как пара, разделенная запятой, состоящая из 'type' и одно из следующего:

'Pearson'Коэффициент линейной корреляции Пирсона
'Kendall'Коэффициент порядковой корреляции Кендалла (τ)
'Spearman'Коэффициент порядковой корреляции копьеносца (ρ)

Пример: 'type','Kendall'

Типы данных: char | string

Опция для обработки строк со значениями NaN, заданными как пара, разделенная запятой, состоящая из 'rows' и одно из следующего:

'all'Используйте все строки, независимо от NaN s.
'complete'Использование только строки без NaN s.
'pairwise'Используйте строки без NaN s в столбце i или j, чтобы вычислить R (i, j).

Пример: 'rows','complete'

Типы данных: char | string

Альтернативная гипотеза (Ha) раньше вычисляла p-значения, заданные как пара, разделенная запятой, состоящая из 'tail' и одно из следующего:

'both'Ha: Корреляция не является нулем.
'right'Ha: Корреляция больше, чем нуль.
'left'Ha: Корреляция является меньше, чем нуль.

Пример: 'tail','left'

Типы данных: char | string

Имена переменных, которые будут использоваться в графиках, заданных как пара, разделенная запятой, состоящая из 'varNames' и вектора строки или массива ячеек из символьных векторов с именами numVars. Все имена переменных являются усеченными к первым пяти символам.

  • Если X является матрицей, то именами переменных по умолчанию является {'var1','var2',...}.

  • Если X является табличным массивом, то именами переменных по умолчанию является X.Properties.VariableNames.

Пример: 'varNames',{'CPF','AGE','BBD'}

Типы данных: cell | string

Значение тестирует индикатор на то, протестировать ли на значительные корреляции, заданные как пара, разделенная запятой, состоящая из 'testR' и один из 'off' или 'on'. Если вы задаете значение 'on', значительные корреляции подсвечены в красном в графике корреляционной матрицы.

Пример: 'testR','on'

Типы данных: char | string

Уровень значения для тестов корреляции, заданной как скаляр между 0 и 1.

Пример: 'alpha',0.01

Типы данных: double

Выходные аргументы

свернуть все

Корреляции между парами переменных в X, которые отображены в графиках, возвратились как numVars-by-numVars матрица.

p-, соответствующие значению, тестируют на элементах R, возвращенного как numVars-by-numVars матрица. P-значения используются, чтобы протестировать гипотезу никакой корреляции против альтернативы для ненулевой корреляции.

Указатели на нанесенные на график графические объекты, возвращенные как numVars-by-numVars графический массив. H содержит уникальные идентификаторы графика, которые можно использовать, чтобы запросить или изменить свойства графика.

Советы

  • Опция 'rows','pairwise', который является значением по умолчанию, может возвратить корреляционную матрицу, которая не является положительна определенный. Опция 'complete' всегда возвращает положительно-определенную матрицу, но в целом оценки основаны на меньшем количестве наблюдений.

  • Используйте gname, чтобы идентифицировать точки в графиках.

Алгоритмы

Программное обеспечение вычисляет:

  • p - значения для корреляции Пирсона путем преобразования корреляции, чтобы создать t - статистическую величину с numObs – 2 степени свободы. Преобразование точно, когда X нормален.

  • p- для порядковых корреляций Кендалла и Копьеносца с помощью любого точные дистрибутивы перестановки (для размеров небольшой выборки) или приближения большой выборки.

  • p - значения для двусторонних тестов путем удвоения более значительного из двух односторонних p - значения.

Смотрите также

| |

Представленный в R2012a