exponenta event banner

Стандартные ошибки коэффициентов и доверительные интервалы

Ковариация коэффициентов и стандартные ошибки

Цель

Оцененные дисперсии коэффициентов и ковариации фиксируют точность оценок коэффициентов регрессии. Дисперсии коэффициентов и их квадратный корень, стандартные ошибки, полезны при проверке гипотез для коэффициентов.

Определение

Оценочная ковариационная матрица

∑=MSE (X′X) 1,

где MSE - среднеквадратичная ошибка, а X - матрица наблюдений за переменными предиктора. CoefficientCovarianceсвойство аппроксимированной модели представляет собой ковариационную матрицу p-за-p оценок коэффициента регрессии. p - число коэффициентов в регрессионной модели. Диагональные элементы являются дисперсиями отдельных коэффициентов.

Как сделать

После получения подогнанной модели, скажем, mdl, использование fitlm или stepwiselm, вы можете отобразить ковариации коэффициентов, используя

mdl.CoefficientCovariance

Ковариация коэффициентов вычисления и стандартные ошибки

В этом примере показано, как вычислить ковариационную матрицу и стандартные ошибки коэффициентов.

Загрузите данные выборки и определите предиктор и переменные ответа.

load hospital
y = hospital.BloodPressure(:,1);
X = double(hospital(:,2:5));

Подгонка модели линейной регрессии.

mdl = fitlm(X,y);

Отображение ковариационной матрицы коэффициентов.

CM = mdl.CoefficientCovariance
CM = 5×5

   27.5113   11.0027   -0.1542   -0.2444    0.2702
   11.0027    8.6864    0.0021   -0.1547   -0.0838
   -0.1542    0.0021    0.0045   -0.0001   -0.0029
   -0.2444   -0.1547   -0.0001    0.0031   -0.0026
    0.2702   -0.0838   -0.0029   -0.0026    1.0829

Вычислите стандартные ошибки коэффициента.

SE = diag(sqrt(CM))
SE = 5×1

    5.2451
    2.9473
    0.0673
    0.0557
    1.0406

Доверительные интервалы коэффициентов

Цель

Доверительные интервалы коэффициентов обеспечивают меру точности для оценок коэффициента линейной регрессии. 100 (1-α)% доверительный интервал дает диапазон, в котором соответствующий коэффициент регрессии будет с 100 (1-α)% достоверности.

Определение

Программа находит доверительные интервалы с помощью метода Вальда. Доверительные  интервалы 100 * (1-α)% для коэффициентов регрессии равны

bi ± t (1 α/2, n p) SE (bi),

где bi - оценка коэффициента, SE (bi) - стандартная ошибка оценки коэффициента, а t (1-α/2, n-p) - 100 (1-α/2) процентиль t-распределения с  n-p степенями свободы. n - число наблюдений, а p - число коэффициентов регрессии.

Как сделать

После получения подогнанной модели, скажем, mdl, использование fitlm или stepwiselm, вы можете получить 95% доверительные интервалы по умолчанию для коэффициентов с помощью

coefCI(mdl)

Можно также изменить уровень достоверности с помощью

coefCI(mdl,alpha)

Для получения более подробной информации см. coefCI функция LinearModel объект.

Доверительные интервалы расчетных коэффициентов

В этом примере показано, как вычислять доверительные интервалы коэффициентов.

Загрузите данные образца и поместите модель линейной регрессии.

load hald
mdl = fitlm(ingredients,heat);

Отображение доверительных интервалов коэффициента 95%.

coefCI(mdl)
ans = 5×2

  -99.1786  223.9893
   -0.1663    3.2685
   -1.1589    2.1792
   -1.6385    1.8423
   -1.7791    1.4910

Значения в каждой строке являются нижним и верхним доверительными пределами, соответственно, для 95% доверительных интервалов по умолчанию для коэффициентов. Например, первая строка показывает нижний и верхний пределы, -99.1786 и 223.9893, для перехвата, β0. Аналогично, вторая строка показывает пределы для β1 и так далее.

Отображение 90% доверительных интервалов для коэффициентов (α = 0,1).

coefCI(mdl,0.1)
ans = 5×2

  -67.8949  192.7057
    0.1662    2.9360
   -0.8358    1.8561
   -1.3015    1.5053
   -1.4626    1.1745

Пределы доверительного интервала становятся более узкими по мере снижения доверительного уровня.

См. также

| | | | | |

Связанные темы