Устойчивая регрессия
b = robustfit(X,y)
b = robustfit(X,y,wfun
,tune)
b = robustfit(X,y,wfun
,tune,const
)
[b,stats] = robustfit(...)
b = robustfit(X,y)
возвращается (p + 1)-by-1 векторный b
из коэффициента оценивает для устойчивой полилинейной регрессии ответов в y
на предикторах в X
X
n-by-p матрица p предикторов при каждом из n наблюдений. y
n-1 вектор наблюдаемых ответов. По умолчанию алгоритм использует итеративно повторно взвешенные наименьшие квадраты с bisquare функцией взвешивания.
По умолчанию, robustfit
добавляет первый столбец 1 с к X
, соответствие постоянному члену в модели. Не вводите столбец 1 с непосредственно в X
. Можно изменить поведение по умолчанию robustfit
использование входа const
, ниже.
robustfit
обработки NaN
s в X
или y
как отсутствующие значения, и удаляет их.
b = robustfit(X,y,
задает функцию взвешивания wfun
,tune)wfun
. tune
настройка, постоянная, который разделен на вектор невязок перед вычислительными весами.
Функция взвешивания wfun
одно из значений, описанных в этой таблице. Значением по умолчанию является 'bisquare'
.
Функция веса | Описание | Значение по умолчанию, настраивающееся постоянный |
---|---|---|
'andrews' | w = (abs(r)<pi) .* sin(r) ./ r | 1.339 |
'bisquare' | w = (abs(r)<1) .* (1 - r.^2).^2 (также названный biweight) | 4.685 |
'cauchy' | w = 1 ./ (1 + r.^2) | 2.385 |
'fair' | w = 1 ./ (1 + abs(r)) | 1.400 |
'huber' | w = 1 ./ max(1, abs(r)) | 1.345 |
'logistic' | w = tanh(r) ./ r | 1.205 |
'ols' | Обычные наименьшие квадраты (никакая функция взвешивания) | 'none' |
'talwar' | w = 1 * (abs(r)<1) | 2.795 |
'welsch' | w = exp(-(r.^2)) | 2.985 |
указатель на функцию | Пользовательская функция веса, которая принимает векторный r из масштабированных остаточных значений, и возвращает вектор весов тот же размер как r | 1 |
Если tune
не задано, robustfit
использует настраивающее значение значения по умолчанию, показанное в таблице. Настраивающие константы значения по умолчанию встроенных функций веса дают содействующие оценки, которые приблизительно на 95% более статистически эффективны, чем обычные оценки наименьших квадратов, если ответ имеет нормальное распределение без выбросов. Уменьшение настраивающихся постоянных увеличений подавление присвоенного к большим остаточным значениям; увеличение настраивающихся постоянных уменьшений подавление присвоенного к большим остаточным значениям.
Значение r
в весе функции
r = resid/(tune*s*sqrt(1-h))
где resid
вектор остаточных значений предыдущей итерации, h
вектор значений рычагов от подгонки наименьших квадратов и s
оценка стандартного отклонения остаточного члена, данного
s = MAD/0.6745
Здесь MAD
среднее абсолютное отклонение остаточных значений их медианы. Постоянные 0.6745 делают оценку несмещенной для нормального распределения. Если существуют p столбцы в X
, самые маленькие p абсолютные отклонения исключены при вычислении медианы.
b = robustfit(X,y,
средства управления, будет ли модель включать постоянный термин. wfun
,tune,const
)const
'on'
включать постоянный термин (значение по умолчанию), или 'off'
не использовать его. Когда const
'on'
, robustfit
добавляет первый столбец 1 с к X
и b
становится (p + 1)-by-1 вектор. Когда const
'off'
, robustfit
не изменяет X
, затем b
p-by-1 вектор.
[b,stats] = robustfit(...)
возвращает структуру stats
, чьи поля содержат диагностическую статистику от регрессии. Поля stats
:
ols_s
— Оценка сигмы (RMSE) от обычных наименьших квадратов
robust_s
— Устойчивая оценка сигмы
mad_s
— Оценка сигмы, вычисленной с помощью среднего абсолютного отклонения остаточных значений их медианы; используемый в масштабировании остаточных значений во время итеративного подбора кривой
s
— Итоговая оценка сигмы, больший из robust_s
и взвешенное среднее ols_s
и robust_s
resid
— Невязка
rstud
— Невязка Studentized (см. regress
для получения дополнительной информации
se
— Стандартная погрешность содействующих оценок
covb
— Предполагаемая ковариационная матрица для содействующих оценок
coeffcorr
— Предполагаемая корреляция содействующих оценок
t
— Отношение b
к se
p
— p-значения для t
w
— Вектор весов для устойчивой подгонки
R
— R включают разложение QR X
dfe
— Степени свободы для ошибки
h
— Вектор значений рычагов для подгонки наименьших квадратов
robustfit
функционируйте оценивает ковариационную матрицу отклонения содействующих оценок с помощью inv(X'*X)*stats.s^2
. Стандартные погрешности и корреляции выведены из этой оценки.
[1] DuMouchel, W. H. и Ф. Л. О'Брайен. “Интегрируя Устойчивую Опцию в Вычислительную среду Регрессии кратного”. Информатика и Статистика: Продолжения 21-го Симпозиума по Интерфейсу. Александрия, ВА: американская Статистическая Ассоциация, 1989.
[2] Голландия, P. W. и Р. Э. Велш. “Устойчивая Регрессия Используя Итеративно Перевзвешенные Наименьшие квадраты”. Коммуникации в Статистике: Теория и Методы, A6, 1977, стр 813–827.
[3] Хубер, P. J. Устойчивая статистика. Хобокен, NJ: John Wiley & Sons, Inc., 1981.
[4] Улица, J. O. Р. Дж. Кэрролл и Д. Рапперт. “Примечание по Вычислению Устойчивых Оценок Регрессии через Итеративно Перевзвешенные Наименьшие квадраты”. Американский Статистик. Издание 42, 1988, стр 152–154.