corrplot

Построение переменных корреляций

Описание

пример

corrplot(X) создает матрицу графиков, показывающих корреляции среди пар переменных в X. Гистограммы переменных появляются вдоль диагонали матрицы; графики поля точек переменных пар появляются в отключенной диагонали. Наклоны базовых линий с наименьшими квадратами на графиках поля точек равны отображаемым коэффициентам корреляции.

пример

corrplot(X,Name,Value) использует дополнительные опции, заданные одним или несколькими аргументами пары "имя-значение". Для примера, corrplot(X,'type','Spearman','testR','on') вычисляет ранговый коэффициент корреляции Спирмана и тесты на значимые коэффициенты корреляции.

пример

R = corrplot(___) возвращает корреляционную матрицу X отображается на графиках с использованием любой комбинации входных аргументов в предыдущих синтаксисах.

пример

[R,PValue] = corrplot(___) дополнительно возвращает p значения, следующие из теста нулевой гипотезы об отсутствии корреляции с альтернативой ненулевой корреляции. Элементы PValue соответствуют элементам R.

corrplot(ax,___) графики на осях, заданных ax вместо текущих систем координат (gca). ax может предшествовать любой комбинации входных аргументов в предыдущих синтаксисах.

[R,PValue,H] = corrplot(___) дополнительно возвращает указатели на графические объекты. Используйте элементы h для изменения свойств графика после его создания.

Примеры

свернуть все

Постройте графики корреляций между несколькими временными рядами.

Загрузка данных о канадской инфляции и процентных ставках.

load Data_Canada

Постройте график коэффициентов линейной корреляции Пирсона между всеми парами переменных.

corrplot(DataTable)

MATLAB figure

График корреляции показывает, что краткосрочные, среднесрочные и долгосрочные процентные ставки сильно коррелируют.

Чтобы изучить временную метку данной величины, введите gname(dates) в Командное окно, и программное обеспечение представляет интерактивный перекрестие над графиком. Чтобы открыть временную метку данной величины, щелкните ее с помощью перекрестия.

Постройте ранговые корреляции Кендалла между несколькими временными рядами. Проведите проверку гипотезы, чтобы определить, какие корреляции значительно отличаются от нуля.

Загрузка данных о канадской инфляции и процентных ставках.

load Data_Canada

Постройте график рангов корреляции Кендалла между всеми парами переменных. Задайте проверку гипотезы, чтобы определить, какие корреляции значительно отличаются от нуля.

corrplot(DataTable,'type','Kendall','testR','on')

MATLAB figure

Коэффициенты корреляции, выделенные красным цветом, указывают, какие пары переменных имеют корреляции, значительно отличающиеся от нуля. Для этих временных рядов все пары переменных имеют корреляции, значительно отличающиеся от нуля.

Тест на корреляции, большие нуля между несколькими временными рядами.

Загрузка данных о канадской инфляции и процентных ставках.

load Data_Canada

Верните парные корреляции Пирсона и соответствующие p-значения для проверки нулевой гипотезы об отсутствии корреляции с правохвостой альтернативой, что корреляции больше нуля.

[R,PValue] = corrplot(DataTable,'tail','right');

MATLAB figure

PValue
PValue = 5×5

    1.0000    0.0000    0.0000    0.0000    0.0000
    0.0000    1.0000    0.0000    0.0000    0.0001
    0.0000    0.0000    1.0000    0.0000    0.0000
    0.0000    0.0000    0.0000    1.0000    0.0000
    0.0000    0.0001    0.0000    0.0000    1.0000

Область выхода PValue имеет парные значения p все меньше уровня значимости по умолчанию 0,05, что указывает на то, что все пары переменных имеют корреляцию, значительно большую нуля.

Входные параметры

свернуть все

Данные временных рядов, заданные как numObs-by- numVars числовая матрица, таблица или timetable. X состоит из numObs наблюдения за numVars числовые переменные.

Типы данных: double | table | timetable

Оси, на которых нужно построить график, заданные как Axes объект.

По умолчанию, corrplot графики для текущей системы координат (gca).

corrplot не поддерживает UIAxes цели.

Аргументы в виде пар имя-значение

Задайте необязательные разделенные разделенными запятой парами Name,Value аргументы. Name - имя аргумента и Value - соответствующее значение. Name должны находиться внутри кавычек. Можно задать несколько аргументов в виде пар имен и значений в любом порядке Name1,Value1,...,NameN,ValueN.

Пример: 'tails','right','alpha',0.1 задает правохвостые тесты на уровне 0,1 значения

Коэффициент корреляции для вычисления, заданный как разделенная разделенными запятой парами, состоящая из 'type' и одно из следующих:

'Pearson'Коэффициент линейной корреляции Пирсона
'Kendall'Ранговый коэффициент корреляции Кендалла (τ)
'Spearman'Ранговый коэффициент корреляции Спирмена (ρ)

Пример: 'type','Kendall'

Типы данных: char | string

Опция для обработки строк с NaN значения, заданные как разделенная разделенными запятой парами, состоящая из 'rows' и одно из следующих:

'all'Используйте все строки независимо от NaNс.
'complete'Используйте только строки без NaNс.
'pairwise'Используйте строки без NaNs в столбце i или j для вычисления R (i, j).

Пример: 'rows','complete'

Типы данных: char | string

Альтернативная гипотеза (Ha), используемая для вычисления p-значений, заданных как разделенная разделенными запятой парами, состоящая из 'tail' и одно из следующих:

'both'Ha: Корреляция не равна нулю.
'right'Ha: Корреляция больше нуля.
'left'Ha: Корреляция меньше нуля.

Пример: 'tail','left'

Типы данных: char | string

Имена переменных для использования на графиках, заданные как разделенная разделенными запятой парами, состоящая из 'varNames' и строковый вектор или массив ячеек из векторов символов с numVars имена. Все имена переменных усечены до первых пяти символов.

  • Если X является матрицей, имена переменных по умолчанию {'var1','var2',...}.

  • Если X является таблицей или расписанием, имена переменных по умолчанию X.Properties.VariableNames.

Пример: 'varNames',{'CPF','AGE','BBD'}

Типы данных: cell | string

Индикатор тестов значимости для проверки или нет значительных корреляций, заданный как разделенная разделенными запятой парами, состоящая из 'testR' и один из 'off' или 'on'. Если вы задаете значение 'on'значительные корреляции подсвечены красным цветом на графике корреляционной матрицы.

Пример: 'testR','on'

Типы данных: char | string

Уровень значимости для тестов корреляции, заданный как скаляр между 0 и 1.

Пример: 'alpha',0.01

Типы данных: double

Выходные аргументы

свернуть все

Корреляции между парами переменных в X которые отображаются на графиках, возвращаются как numVars-by- numVars матрица.

p -значения, соответствующие тестам значимости на элементах R, возвращается как numVars-by- numVars матрица. Значения p используются, чтобы проверить гипотезу об отсутствии корреляции с альтернативой ненулевой корреляции.

Указатели на графические объекты, возвращенные как numVars-by- numVars графический массив. H содержит уникальные идентификаторы графика, которые можно использовать для запроса или изменения свойств графика.

Совет

  • Опция 'rows','pairwise', который является значением по умолчанию, может вернуть корреляционную матрицу, которая не положительно определена. The 'complete' опция всегда возвращает положительно-определенную матрицу, но в целом оценки основаны на меньшем количестве наблюдений.

  • Использовать gname идентифицировать точки на графиках.

Алгоритмы

Программа вычисляет:

  • p -значения корреляции Пирсона путем преобразования корреляции, чтобы создать t -статистическую с numObs - 2 степени свободы. Преобразование точно, когда X является нормальным.

  • p - значения для ранговых корреляций Кендалла и Спирмена с использованием или точных распределений сочетаний (для небольших размеров выборки) или приближений с большой выборкой.

  • p значения для двуххвостых тестов путем удвоения более значимых из двух однохвостых p значений.

См. также

| |

Введенный в R2012a