stepwise

Интерактивная ступенчатая регрессия

Синтаксис

stepwise
stepwise(X,y)
stepwise(X,y,inmodel,penter,premove)

Описание

stepwise использует выборочные данные в hald.mat отображение графического интерфейса пользователя для выполнения ступенчатой регрессии значений отклика в heat на прогнозирующих терминах в ingredients.

В верхней левой части интерфейса отображаются оценки коэффициентов для всех потенциальных членов с горизонтальными полосами, указывающими 90% (цветные) и 95% (серые) доверительные интервалы. Красный цвет указывает, что, первоначально, условия не в модели. Значения, отображаемые в таблице, являются теми, которые привести к тому, что условия были добавлены к модели.

Средний фрагмент интерфейса отображает сводную статистику для всей модели. Эти статистические данные обновляются с каждым шагом.

Нижний фрагмент интерфейса, Model History, отображает RMSE для модели. График отслеживает RMSE от шага к шагу, поэтому можно сравнить оптимальность различных моделей. Наведите на синие точки в истории, чтобы увидеть, какие условия были в модели на конкретном шаге. Щелкните на синюю точку в истории, чтобы открыть копию интерфейса, инициализированного членами в модели на этом шаге.

Начальные модели, а также допуски на вход/выход для p -значений F -statistics заданы с помощью дополнительных входных параметров stepwise. По умолчанию это начальная модель без членов, входной допуск 0,05 и выходной допуск 0,10.

Чтобы центрировать и масштабировать входные данные (compute z -счета), чтобы улучшить кондиционирование базовой задачи наименьших квадратов, выберите Scale Inputs из Stepwise меню.

Вы проходите через ступенчатую регрессию одним из двух способов:

  1. Щелкните Next Step, чтобы выбрать рекомендуемый следующий шаг. Рекомендуемый следующий шаг либо добавляет наиболее значимый термин, либо удаляет наименее значимый термин. Когда регрессия достигает локального минимума RMSE, рекомендуемый следующий шаг - «Move no terms». Можно выполнить все рекомендуемые шаги сразу, нажав All Steps.

  2. Щелкните линию на графике или в таблице, чтобы переключить состояние соответствующего термина. Щелчок красной линии, соответствующий термину, не находящемуся в модели в данный момент, добавляет термин к модели и изменяет строку на синюю. Щелчок по синей линии, соответствующий термину, находящемуся в настоящее время в модели, удаляет термин из модели и изменяет строку на красный.

Звонить addedvarplot и получите дополнительный график переменной из stepwise выберите Added Variable Plot из меню Stepwise. Отображается список терминов. Выберите термин, который вы хотите добавить, и нажмите OK.

Щелкните Export, чтобы отобразить диалоговое окно, которое позволяет выбрать информацию из интерфейса, чтобы сохранить в MATLAB® рабочей области. Проверьте информацию, которую вы хотите экспортировать, и, опционально, измените имена переменных рабочей области, которые будут созданы. Щелкните OK, чтобы экспортировать информацию.

stepwise(X,y) отображает интерфейс с помощью p прогнозирующих членов в матрице n -by- p X и значения отклика в векторе n -by-1 y. Отдельные прогнозирующие условия должны появиться в разных столбцах X.

Примечание

stepwise автоматически включает в себя постоянный член во всех моделях. Не вводите столбец 1с непосредственно в X.

stepwise лечит NaN значения в любом из X или y как отсутствующие значения, и игнорирует их.

stepwise(X,y,inmodel,penter,premove) дополнительно задает начальную модель (inmodel) и вход (penter) и выход (premove) допуски для p -значений F -статистики. inmodel является либо логическим вектором с длиной, равной количеству столбцов X, или вектор индексов со значениями в диапазоне от 1 до количества столбцов в X. Значение penter должно быть меньше или равно значению premove.

Алгоритмы

Stepwise regression является систематическим методом для добавления и удаления членов из мультилинейной модели, основанным на их статистической значимости в регрессии. Метод начинается с начальной модели, а затем сравнивает объяснительную степень пошагово больших и меньших моделей. На каждом шаге p значение F-statistic вычисляется для экспериментальных моделей с потенциальным термином и без него. Если термин не находится в модели в данный момент, нулевая гипотеза заключается в том, что термин будет иметь нулевой коэффициент, если добавлен к модели. Если существует достаточно доказательств, чтобы отклонить нулевую гипотезу, термин добавляется к модели. И наоборот, если член в данный момент находится в модели, нулевая гипотеза заключается в том, что термин имеет нулевой коэффициент. Если нет достаточных доказательств, чтобы отклонить нулевую гипотезу, термин удаляется из модели. Способ протекает следующим образом:

  1. Подгонка начальной модели.

  2. Если какие-либо условия, не содержащиеся в модели, имеют p -значения меньше, чем входной допуск (то есть, если маловероятно, что они имели бы нулевой коэффициент, если бы добавили к модели), добавьте тот с наименьшим p значением и повторите этот шаг; в противном случае перейдите к шагу 3.

  3. Если какие-либо члены в модели имеют p -значения, большие, чем выходной допуск (то есть, если маловероятно, что гипотеза нулевого коэффициента может быть отклонена), удалите тот, у которого самое большое p значение, и перейдите к шагу 2; в противном случае завершите.

В зависимости от членов, включенных в начальную модель, и порядка, в котором условия перемещаются внутрь и наружу, метод может создавать различные модели из одного и того же набора потенциальных членов. Метод заканчивается, когда ни один шаг не улучшает модель. Однако нет гарантии, что другая начальная модель или другая последовательность шагов не приведут к лучшей подгонке. В этом смысле ступенчатые модели являются локально оптимальными, но могут не быть глобально оптимальными.

См. также

| |

Представлено до R2006a