Интерактивная ступенчатая регрессия
stepwise
stepwise(X,y)
stepwise(X,y,inmodel,penter,premove)
stepwise
использует выборочные данные в hald.mat
отобразить графический интерфейс пользователя для выполнения ступенчатой регрессии значений отклика в heat
на прогнозирующих терминах в ingredients
.
Верхний левый угол интерфейса отображает оценки коэффициентов для всех потенциальных терминов с горизонтальными планками, указывающими на (окрашенных) 90% и 95%-е (серые) доверительные интервалы. Красный цвет указывает, что, первоначально, термины не находятся в модели. Значения, отображенные в таблице, являются теми, которые закончились бы, если бы термины были добавлены к модели.
Средний фрагмент интерфейса отображает итоговую статистику для целой модели. Эти статистические данные обновляются с каждым шагом.
Более низкий фрагмент интерфейса, Model History, отображает RMSE для модели. График отслеживает RMSE от шага до шага, таким образом, можно сравнить оптимальность различных моделей. Наведите на синие точки в истории, чтобы видеть, какие термины были в модели на конкретном шаге. Нажмите на синюю точку в истории, чтобы открыть копию интерфейса, инициализированного членами в модели на том шаге.
Первоначальные модели, а также допуски входа/выхода к p - значения F - статистика, заданы с помощью дополнительных входных параметров для stepwise
. Значениями по умолчанию является первоначальная модель без терминов, допуска входа 0,05 и выходного допуска 0,10.
Чтобы сосредоточить и масштабировать входные данные (вычисляют z - баллы), чтобы улучшить создание условий базовой задачи наименьших квадратов, выберите Scale Inputs
в меню Stepwise.
Вы продолжаете через ступенчатую регрессию одним из двух способов:
Нажмите Next Step, чтобы выбрать рекомендуемый следующий шаг. Рекомендуемый следующий шаг или добавляет старший значащий термин или удаляет младший значащий термин. Когда регрессия достигает локального минимума RMSE, рекомендуемый следующий шаг является “Перемещением никакие термины”. Можно выполнить все рекомендуемые шаги целиком путем нажатия на All Steps.
Кликните по линии в графике или в таблице, чтобы переключить состояние соответствующего термина. Нажатие на красную линию, соответствие термину не в настоящее время в модели, добавляют термин в модель и изменяют линию в синий. Нажатие на синюю линию, соответствие термину в настоящее время в модели, удаляют термин из модели и изменяют линию в красный.
Вызывать addedvarplot
и произведите добавленный переменный график из stepwise
соедините интерфейсом, выберите Added Variable Plot из меню Stepwise. Список терминов отображен. Выберите термин, вы хотите добавить, и затем нажать OK.
Нажмите Export, чтобы отобразить диалоговое окно, которое позволяет вам выбирать информацию из интерфейса, чтобы сохранить в MATLAB® рабочая область. Проверяйте информацию, вы хотите экспортировать и, опционально, изменить названия переменных рабочей области, которые будут созданы. Нажмите OK, чтобы экспортировать информацию.
stepwise(X,y)
отображает интерфейс с помощью p прогнозирующие термины в n-by-p матричный X
и значения отклика в n-by-1 векторный y
. Отличные прогнозирующие термины должны появиться в различных столбцах X
.
Примечание
stepwise
автоматически включает постоянный термин во все модели. Не вводите столбец 1 с непосредственно в X
.
stepwise
обработки NaN
значения в любом X
или y
как отсутствующие значения, и игнорирует их.
stepwise(X,y,inmodel,penter,premove)
дополнительно задает первоначальную модель (inmodel
) и вход (penter
) и выход (premove
) допуски к p - значения F - статистика. inmodel
любой логический вектор с длиной, равной количеству столбцов X
, или вектор из индексов, со значениями в пределах от 1 к количеству столбцов в X
. Значение penter
должно быть меньше чем или равно значению premove
.
Stepwise regression является систематическим методом для добавления и удаления терминов от полилинейного основанного на модели на их статистическом значении в регрессии. Метод начинается с первоначальной модели и затем сравнивает объяснительную силу инкрементно больших и меньших моделей. На каждом шаге значении p F - статистическая величина вычисляется к тестовым моделям с и без потенциального термина. Если бы термин не находится в настоящее время в модели, нулевая гипотеза - то, что термин имел бы нулевой коэффициент, если добавлено к модели. Если существуют достаточные доказательства, чтобы отклонить нулевую гипотезу, термин добавляется к модели. С другой стороны, если термин находится в настоящее время в модели, нулевая гипотеза - то, что термин имеет нулевой коэффициент. Если существуют недостаточные доказательства, чтобы отклонить нулевую гипотезу, термин удален из модели. Метод продолжает можно следующим образом:
Подбирайте первоначальную модель.
Если какие-либо термины не в модели имеют p - значения меньше, чем допуск входа (то есть, если бы маловероятно, что у них был бы нулевой коэффициент, если добавлено к модели), добавьте тот с наименьшим значением p и повторите этот шаг; в противном случае перейдите к шагу 3.
Если какие-либо члены в модели имеют p - значения, больше, чем выходной допуск (то есть, если маловероятно, что гипотеза нулевого коэффициента может быть отклонена), удалите тот с самым большим значением p и перейдите к шагу 2; в противном случае, конец.
В зависимости от терминов, включенных в первоначальную модель и порядок, в котором термины перемещены в и, метод может создать различные модели от того же набора потенциальных терминов. Метод завершает работу, когда никакой один шаг не улучшает модель. Нет никакой гарантии, однако, что различная первоначальная модель или различная последовательность шагов не приведут к лучшей подгонке. В этом смысле пошаговые модели локально оптимальны, но не могут быть глобально оптимальными.