exponenta event banner

Многомерная общая линейная модель

В этом примере показано, как настроить многомерную общую линейную модель для оценки с использованием mvregress.

Загрузить данные образца.

Эти данные содержат измерения по выборке 205 автоимпортов за 1985 год.

Здесь смоделируйте двухмерный ответ MPG города и шоссе (столбцы 14 и 15).

Для предикторов используйте основание колеса (колонка 3), вес бордюра (колонка 7) и тип топлива (колонка 18). Первые два предиктора непрерывны, и для этого примера центрированы и масштабированы. Тип топлива - категориальная переменная с двумя категориями (11 и 20), поэтому фиктивная переменная индикатора необходима для регрессии.

load('imports-85')
Y = X(:,14:15);
[n,d] = size(Y);

X1 = zscore(X(:,3));
X2 = zscore(X(:,7));
X3 = X(:,18)==20;

Xmat = [ones(n,1) X1 X2 X3];

Переменная X3 кодируется, чтобы иметь значение 1 для типа топлива 20 и значение 0 в противном случае.

Для удобства три предиктора (основание колеса, вес бордюра и индикатор типа топлива) объединены в одну матрицу дизайна с добавленным термином перехвата.

Настройка матриц проектирования.

Учитывая эти предикторы, многомерная общая линейная модель для двухмерного ответа MPG составляет

[y11y12y21y22  yn1yn2] = [1x11x12x131x21x22x23 ⋮⋮⋮⋮ 1xn1xn2xn3] [β01β02β11β12β21β22β31β32] + [ϵ11ϵ12ϵ21ϵ22 ϵn1ϵn2],

где ϵi= (ϵi1,ϵi2) -MVN (0, Λ). Всего существует K = 8 коэффициентов регрессии.

Создание массива ячеек длиной n = 205 из матриц 2 на 8 (d на K) для использования сmvregress. i-я матрица в массиве ячеек

X (i) = [10xi10xi20xi30010xi10xi20xi3].

Xcell = cell(1,n);
for i = 1:n
    Xcell{i} = [kron([Xmat(i,:)],eye(d))];
end

Учитывая эту спецификацию матриц проектирования, соответствующий вектор параметров равен

β=[β01β02β11β12β21β22β31β32].

Оценка коэффициентов регрессии.

Подгоните модель, используя максимальную оценку правдоподобия.

[beta,sigma,E,V] = mvregress(Xcell,Y);
beta
beta = 8×1

   33.5476
   38.5720
    0.9723
    0.3950
   -6.3064
   -6.3584
   -9.2284
   -8.6663

Эти оценки коэффициентов показывают:

  • Предполагаемый город и магистраль MPG для автомобилей средней колесной базы, веса бордюра и топлива типа 11: 33.5 и 38.6соответственно. Для топлива типа 20 предполагаемые город и магистраль МПГ 33.5476 - 9.2284 = 24.3192 и 38.5720 - 8.6663 = 29.9057.

  • Увеличение на одно стандартное отклонение веса бордюра оказывает почти такое же влияние на ожидаемый уровень МПГ в городах и автомагистралях. Учитывая, что все остальное равно, ожидаемый MPG уменьшается примерно на 6.3 с каждым стандартным отклонением увеличение веса бордюра, как для города, так и для магистрали MPG.

  • Для каждого увеличения среднеквадратического отклонения в колесной базе ожидаемый городской MPG увеличивается 0.972, в то время как ожидаемая магистраль MPG увеличивается только на 0.395, учитывая все остальное равно.

Вычислить стандартные ошибки.

Стандартными ошибками для коэффициентов регрессии являются квадратный корень диагонали матрицы дисперсионно-ковариационная, V.

se = sqrt(diag(V))
se = 8×1

    0.7365
    0.7599
    0.3589
    0.3702
    0.3497
    0.3608
    0.7790
    0.8037

Изменить форму матрицы коэффициентов.

Можно легко изменить форму коэффициентов регрессии в исходной матрице 4 на 2.

B = reshape(beta,2,4)'
B = 4×2

   33.5476   38.5720
    0.9723    0.3950
   -6.3064   -6.3584
   -9.2284   -8.6663

Проверьте предположения модели.

В предположениях модели z = EΛ-1/2 должен быть независимым, с двумерным стандартным нормальным распределением. В этом 2-D случае можно оценить достоверность этого предположения с помощью графика рассеяния.

z = E/chol(sigma);
figure()
plot(z(:,1),z(:,2),'.')
title('Standardized Residuals')
hold on

% Overlay standard normal contours
z1 = linspace(-5,5);
z2 = linspace(-5,5);
[zx,zy] = meshgrid(z1,z2);
zgrid = [reshape(zx,100^2,1),reshape(zy,100^2,1)];
zn = reshape(mvnpdf(zgrid),100,100);
[c,h] = contour(zx,zy,zn);
clabel(c,h)

Figure contains an axes. The axes with title Standardized Residuals contains 2 objects of type line, contour.

Несколько остатков больше, чем ожидалось, но в целом мало доказательств против многомерного предположения о нормальности.

См. также

|

Связанные примеры

Подробнее