Интерактивная ступенчатая регрессия
stepwise
stepwise(X,y)
stepwise(X,y,inmodel,penter,premove)
stepwise
использует выборочные данные в hald.mat
отображение графического интерфейса пользователя для выполнения ступенчатой регрессии значений отклика в heat
на прогнозирующих терминах в ingredients
.
В верхней левой части интерфейса отображаются оценки коэффициентов для всех потенциальных членов с горизонтальными полосами, указывающими 90% (цветные) и 95% (серые) доверительные интервалы. Красный цвет указывает, что, первоначально, условия не в модели. Значения, отображаемые в таблице, являются теми, которые привести к тому, что условия были добавлены к модели.
Средний фрагмент интерфейса отображает сводную статистику для всей модели. Эти статистические данные обновляются с каждым шагом.
Нижний фрагмент интерфейса, Model History, отображает RMSE для модели. График отслеживает RMSE от шага к шагу, поэтому можно сравнить оптимальность различных моделей. Наведите на синие точки в истории, чтобы увидеть, какие условия были в модели на конкретном шаге. Щелкните на синюю точку в истории, чтобы открыть копию интерфейса, инициализированного членами в модели на этом шаге.
Начальные модели, а также допуски на вход/выход для p -значений F -statistics заданы с помощью дополнительных входных параметров stepwise
. По умолчанию это начальная модель без членов, входной допуск 0,05 и выходной допуск 0,10.
Чтобы центрировать и масштабировать входные данные (compute z -счета), чтобы улучшить кондиционирование базовой задачи наименьших квадратов, выберите Scale Inputs
из Stepwise меню.
Вы проходите через ступенчатую регрессию одним из двух способов:
Щелкните Next Step, чтобы выбрать рекомендуемый следующий шаг. Рекомендуемый следующий шаг либо добавляет наиболее значимый термин, либо удаляет наименее значимый термин. Когда регрессия достигает локального минимума RMSE, рекомендуемый следующий шаг - «Move no terms». Можно выполнить все рекомендуемые шаги сразу, нажав All Steps.
Щелкните линию на графике или в таблице, чтобы переключить состояние соответствующего термина. Щелчок красной линии, соответствующий термину, не находящемуся в модели в данный момент, добавляет термин к модели и изменяет строку на синюю. Щелчок по синей линии, соответствующий термину, находящемуся в настоящее время в модели, удаляет термин из модели и изменяет строку на красный.
Звонить addedvarplot
и получите дополнительный график переменной из stepwise
выберите Added Variable Plot из меню Stepwise. Отображается список терминов. Выберите термин, который вы хотите добавить, и нажмите OK.
Щелкните Export, чтобы отобразить диалоговое окно, которое позволяет выбрать информацию из интерфейса, чтобы сохранить в MATLAB® рабочей области. Проверьте информацию, которую вы хотите экспортировать, и, опционально, измените имена переменных рабочей области, которые будут созданы. Щелкните OK, чтобы экспортировать информацию.
stepwise(X,y)
отображает интерфейс с помощью p прогнозирующих членов в матрице n -by- p X
и значения отклика в векторе n -by-1 y
. Отдельные прогнозирующие условия должны появиться в разных столбцах X
.
Примечание
stepwise
автоматически включает в себя постоянный член во всех моделях. Не вводите столбец 1с непосредственно в X
.
stepwise
лечит NaN
значения в любом из X
или y
как отсутствующие значения, и игнорирует их.
stepwise(X,y,inmodel,penter,premove)
дополнительно задает начальную модель (inmodel
) и вход (penter
) и выход (premove
) допуски для p -значений F -статистики. inmodel
является либо логическим вектором с длиной, равной количеству столбцов X
, или вектор индексов со значениями в диапазоне от 1 до количества столбцов в X
. Значение penter
должно быть меньше или равно значению premove
.
Stepwise regression является систематическим методом для добавления и удаления членов из мультилинейной модели, основанным на их статистической значимости в регрессии. Метод начинается с начальной модели, а затем сравнивает объяснительную степень пошагово больших и меньших моделей. На каждом шаге p значение F-statistic вычисляется для экспериментальных моделей с потенциальным термином и без него. Если термин не находится в модели в данный момент, нулевая гипотеза заключается в том, что термин будет иметь нулевой коэффициент, если добавлен к модели. Если существует достаточно доказательств, чтобы отклонить нулевую гипотезу, термин добавляется к модели. И наоборот, если член в данный момент находится в модели, нулевая гипотеза заключается в том, что термин имеет нулевой коэффициент. Если нет достаточных доказательств, чтобы отклонить нулевую гипотезу, термин удаляется из модели. Способ протекает следующим образом:
Подгонка начальной модели.
Если какие-либо условия, не содержащиеся в модели, имеют p -значения меньше, чем входной допуск (то есть, если маловероятно, что они имели бы нулевой коэффициент, если бы добавили к модели), добавьте тот с наименьшим p значением и повторите этот шаг; в противном случае перейдите к шагу 3.
Если какие-либо члены в модели имеют p -значения, большие, чем выходной допуск (то есть, если маловероятно, что гипотеза нулевого коэффициента может быть отклонена), удалите тот, у которого самое большое p значение, и перейдите к шагу 2; в противном случае завершите.
В зависимости от членов, включенных в начальную модель, и порядка, в котором условия перемещаются внутрь и наружу, метод может создавать различные модели из одного и того же набора потенциальных членов. Метод заканчивается, когда ни один шаг не улучшает модель. Однако нет гарантии, что другая начальная модель или другая последовательность шагов не приведут к лучшей подгонке. В этом смысле ступенчатые модели являются локально оптимальными, но могут не быть глобально оптимальными.