Подгонка модели линейной регрессии с использованием пошаговой регрессии
возвращает вектор b = stepwisefit(X,y)b оценок коэффициентов из ступенчатой регрессии вектора отклика y на переменных предиктора в матрице X. stepwisefit начинается с начальной постоянной модели и выполняет шаги вперед или назад для добавления или удаления переменных до тех пор, пока не будет удовлетворен критерий остановки.
указывает дополнительные параметры, использующие один или несколько аргументов пары имя-значение. Например, можно указать непостоянную начальную модель или максимальное количество шагов, b = stepwisefit(X,y,Name,Value)stepwisefit может взять.
[ также возвращает спецификацию переменных в окончательной регрессионной модели b,se,pval,finalmodel,stats] = stepwisefit(___)finalmodel, и статистика stats об окончательной модели.
Ступенчатая регрессия - это метод добавления терминов и удаления терминов из многолинейной модели на основе их статистической значимости. Этот метод начинается с начальной модели и затем выполняет последовательные шаги для изменения модели путем добавления или удаления терминов. На каждом этапе значение p F-статистики вычисляется для тестирования моделей с потенциальным термином и без него. Если член в настоящее время не находится в модели, нулевая гипотеза состоит в том, что член будет иметь нулевой коэффициент при добавлении к модели. При наличии достаточных доказательств для отклонения нулевой гипотезы к модели добавляется термин. И наоборот, если член в настоящее время находится в модели, нулевая гипотеза состоит в том, что член имеет нулевой коэффициент. Если доказательств для отклонения нулевой гипотезы недостаточно, термин удаляется из модели. Способ осуществляется следующим образом:
Подгоните исходную модель.
Если какие-либо термины, отсутствующие в модели, имеют значения p, меньшие, чем допуск записи, добавьте элемент с наименьшим значением p и повторите этот шаг. Например, предположим, что начальная модель является постоянной моделью по умолчанию, а допуск ввода - по умолчанию 0.05. Алгоритм сначала подходит для всех моделей, состоящих из константы плюс другого члена и идентифицирует член, который имеет наименьшее p-значение, например член 4. Если термин 4
p-значение меньше, чем 0.05, затем термин 4 добавляется в модель. Далее алгоритм выполняет поиск среди всех моделей, состоящих из константы, члена 4и еще один термин. Если термин, отсутствующий в модели, имеет значение p менее 0.05, к модели добавляется член с наименьшим p-значением и процесс повторяется. Когда не существует дополнительных терминов, которые могут быть добавлены к модели, алгоритм переходит к этапу 3.
Если какие-либо члены в модели имеют p-значения, превышающие допуск выхода, удалите элемент с наибольшим p-значением и перейдите к шагу 2; в противном случае конец.
На каждом шаге алгоритма: stepwisefit использует метод наименьших квадратов для оценки коэффициентов модели. После добавления термина в модель на более ранней стадии алгоритм может впоследствии удалить этот термин, если он больше не будет полезен в сочетании с другими терминами, добавленными позже. Метод завершается, когда ни один шаг не улучшает модель. Однако окончательная модель не гарантирована оптимальной, что означает наилучшее соответствие данным. Другая начальная модель или другая последовательность шагов может привести к лучшей подгонке. В этом смысле пошаговые модели являются локально оптимальными, но не обязательно глобально оптимальными.
Создать модель можно с помощью fitlm, а затем вручную скорректировать модель с помощью step, addTerms, и removeTerms.
Использовать stepwiselm если у вас есть данные в таблице, у вас есть смесь непрерывных и категориальных предикторов, или вы хотите указать формулы модели, которые потенциально могут включать термины более высокого порядка и взаимодействия.
Использовать stepwiseglm для создания пошаговых обобщенных линейных моделей (например, если имеется двоичная переменная отклика и требуется вписать классификационную модель).
[1] Дрейпер, Норман Р. и Гарри Смит. Примененный регрессионный анализ. Хобокен, Нью-Джерси: Wiley-Interscience, 1998. стр 307–312.
addedvarplot | regress | stepwise | stepwiseglm | stepwiselm