Подгонка линейной регрессионой модели с использованием ступенчатой регрессии
возвращает вектор b
= stepwisefit(X
,y
)b
оценок коэффициентов от ступенчатой регрессии вектора отклика y
на переменных предиктора в матрице X
. stepwisefit
начинается с начальной модели константы и принимает вперед или назад шаги, чтобы добавить или удалить переменные, пока не будет удовлетворен критерий остановки.
задает дополнительные опции, используя один или несколько аргументы пары "имя-значение". Для примера можно задать неконстантную начальную модель или максимальное количество шагов, которые b
= stepwisefit(X
,y
,Name,Value
)stepwisefit
может взять.
[
также возвращает спецификацию переменных в окончательной регрессионой модели b
,se
,pval
,finalmodel
,stats
] = stepwisefit(___)finalmodel
, и статистические stats
об окончательной модели.
Stepwise regression является методом для добавления членов к многолинейной модели и удаления членов из нее, основанным на их статистической значимости. Этот метод начинается с начальной модели, а затем делает последующие шаги, чтобы изменить модель, добавляя или удаляя условия. На каждом шаге p -value F-statistic вычисляется для экспериментальных моделей с потенциальным термином и без него. Если термин не находится в модели в данный момент, нулевая гипотеза заключается в том, что термин будет иметь нулевой коэффициент, если добавлен к модели. Если существует достаточно доказательств, чтобы отклонить нулевую гипотезу, термин добавляется к модели. И наоборот, если член в данный момент находится в модели, нулевая гипотеза заключается в том, что термин имеет нулевой коэффициент. Если нет достаточных доказательств, чтобы отклонить нулевую гипотезу, термин удаляется из модели. Способ протекает следующим образом:
Подгонка начальной модели.
Если какие-либо условия, не входящие в модель, имеют p -значения меньше, чем допуск входа, добавьте единицу с наименьшим p -значением и повторите этот шаг. Например, предположим, что начальная модель является моделью констант по умолчанию, а допуск входа является допуском по умолчанию 0.05
. Алгоритм сначала подходит для всех моделей, состоящих из константы плюс другого члена, и идентифицирует термин, который имеет наименьшее p -значение, например, термин 4
. Если термин 4
p -значение меньше 0.05
, затем термин 4
добавляется к модели. Затем алгоритм выполняет поиск среди всех моделей, состоящих из константы, члена 4
, и еще один термин. Если термин, не входящий в модель, имеет p -значение меньше 0.05
, термин с наименьшим p -значение добавляется к модели, и процесс повторяется. Когда дополнительных членов, которые могут быть добавлены к модели, не существует, алгоритм переходит к шагу 3.
Если какие-либо члены в модели имеют p -значений, больше, чем выходной допуск, удалите тот, с самым большим p -значение и перейдите к шагу 2; в противном случае завершите.
На каждом шаге алгоритма stepwisefit
использует метод наименьших квадратов, чтобы оценить коэффициенты модели. После добавления термина к модели на более раннем этапе алгоритм может впоследствии отказаться от этого термина, если он больше не будет полезен в сочетании с другими терминами, добавленными позже. Метод заканчивается, когда ни один шаг не улучшает модель. Однако конечная модель не гарантирована оптимальной, что означает, что она наилучшим образом соответствует данным. Другая начальная модель или другая последовательность шагов могут привести к лучшей подгонке. В этом смысле ступенчатые модели являются локально оптимальными, но не обязательно глобально оптимальными.
Можно создать модель с помощью fitlm
, а затем вручную настроить модель используя step
, addTerms
, и removeTerms
.
Использование stepwiselm
если у вас есть данные в таблице, у вас есть смесь непрерывных и категориальных предикторов, или вы хотите задать формулы модели, которые потенциально могут включать условия более высокого порядка и взаимодействия.
Использование stepwiseglm
чтобы создать ступенчато обобщенные линейные модели (для примера, если у вас есть двоичная переменная отклика и вы хотите подогнать под классификационную модель).
[1] Дрейпер, Норман Р. и Гарри Смит. Прикладной регрессионный анализ. Hoboken, NJ: Wiley-Interscience, 1998. стр 307–312.
addedvarplot
| regress
| stepwise
| stepwiseglm
| stepwiselm