Класс NonLinearModel

Класс модели нелинейной регрессии

Описание

Объект, содержащий обучающие данные, описание модели, диагностическую информацию и соответствующие коэффициенты для нелинейной регрессии. Прогнозирование ответов модели с помощью predict или feval методы.

Строительство

Создать NonLinearModel объект с использованием fitnlm.

Свойства

развернуть все

`CoefficientCovariance` - Ковариационная матрица оценок коэффициентов
числовая матрица

Это свойство доступно только для чтения.

Ковариационная матрица оценок коэффициентов, заданная как p-by-p матрица числовых значений. p - число коэффициентов в подгоняемой модели.

Дополнительные сведения см. в разделе Стандартные ошибки коэффициентов и доверительные интервалы.

Типы данных: single | double

`CoefficientNames` - Наименования коэффициентов
массив ячеек символьных векторов

Это свойство доступно только для чтения.

Имена коэффициентов, определяемые как массив ячеек символьных векторов, каждый из которых содержит имя соответствующего члена.

Типы данных: cell

`Coefficients` - Значения коэффициентов
стол

Это свойство доступно только для чтения.

Значения коэффициентов, указанные как таблица. Coefficients содержит одну строку для каждого коэффициента и следующие столбцы:

Estimate - Расчетное значение коэффициента
SE - Стандартная погрешность оценки
tStat - t-статистика для теста, что коэффициент равен нулю
pValue - p-значение для t-статистики

Использовать anova (только для модели линейной регрессии) или coefTest для выполнения других тестов коэффициентов. Использовать coefCI для нахождения доверительных интервалов оценок коэффициентов.

Чтобы получить любой из этих столбцов в виде вектора, выполните индексирование в свойство с помощью точечной нотации. Например, получить оцененный вектор коэффициентов в модели mdl:

beta = mdl.Coefficients.Estimate

Типы данных: table

`Diagnostics` - Диагностическая информация
стол

Это свойство доступно только для чтения.

Диагностическая информация для модели, указанная как таблица. Диагностика может помочь выявить отклонения и влиятельные наблюдения. Diagnostics содержит следующие поля.

Область	Значение	Полезность
`Leverage`	Диагональные элементы `HatMatrix`	Леверидж указывает, в какой степени прогнозируемое значение для наблюдения определяется наблюдаемым значением для этого наблюдения. Значение, близкое к `1` указывает, что прогноз в значительной степени определяется этим наблюдением, при незначительном вкладе других наблюдений. Значение, близкое к `0` указывает на то, что посадка в значительной степени определяется другими наблюдениями. Для модели с `P` коэффициенты и `N` наблюдения, среднее значение `Leverage` является `P/N`. Наблюдение с помощью `Leverage` больше, чем `2*P/N` может рассматриваться как имеющий высокие рычаги влияния.
`CooksDistance`	Мера повара по масштабному изменению соответствующих значений	`CooksDistance` - мера масштабированного изменения подгоняемых значений. Наблюдение с помощью `CooksDistance` больше, чем в три раза среднее расстояние Кука может быть больше.
`HatMatrix`	Проекционная матрица для вычисления по наблюдаемым откликам	`HatMatrix` является `N`около-`N` матрица такая, что `Fitted = HatMatrix*Y`, где `Y` - вектор ответа и `Fitted` - вектор аппроксимированных значений отклика.

Типы данных: table

`DFE` - Степени свободы для ошибки
положительное целое число

Это свойство доступно только для чтения.

Степени свободы для ошибки (остатки), равные количеству наблюдений минус число оцененных коэффициентов, указанных как положительное целое число.

Типы данных: double

`Fitted` - Установленные значения отклика на основе входных данных
числовой вектор

Это свойство доступно только для чтения.

Аппроксимированные (прогнозируемые) значения на основе входных данных, заданных как числовой вектор. fitnlm попытки сделать Fitted как можно ближе к ответным данным.

Типы данных: single | double

`Formula` - Информация о модели
`NonLinearFormula` объект

Это свойство доступно только для чтения.

Информация о модели, указанная как NonLinearFormula объект.

Отображение формулы подогнанной модели mdl используя точечную нотацию.

mdl.Formula

`Iterative` - Информация о процессе фитинга
структура

Это свойство доступно только для чтения.

Информация о процессе фитинга, заданная как структура со следующими полями:

InitialCoefs - Начальные значения коэффициентов ( beta0 вектор)
IterOpts - Опции, включенные в Options аргумент пары имя-значение для fitnlm.

Типы данных: struct

`LogLikelihood` - Средства к существованию
числовое значение

Это свойство доступно только для чтения.

Логарифмическое значение распределения модели при значениях ответа, указанных как числовое значение. Среднее значение подгоняется по модели, а другие параметры оцениваются как часть подгонки модели.

Типы данных: single | double

`ModelCriterion` - Критерий сравнения моделей
структура

Это свойство доступно только для чтения.

Критерий сравнения моделей, указанный как структура со следующими полями:

AIC - информационный критерий Акаике. AIC = –2*logL + 2*m, где logL является источником средств к существованию и m - количество оцениваемых параметров.
AICc - информационный критерий Akaike с поправкой на размер выборки. AICc = AIC + (2*m*(m + 1))/(n – m – 1), где n - количество наблюдений.
BIC - байесовский информационный критерий. BIC = –2*logL + m*log(n).
CAIC - Согласованный информационный критерий Акаике. CAIC = –2*logL + m*(log(n) + 1).

Информационные критерии - это инструменты выбора моделей, которые можно использовать для сравнения нескольких моделей, соответствующих одним и тем же данным. Эти критерии являются основанными на правдоподобии показателями соответствия модели, которые включают штраф за сложность (в частности, количество параметров). По форме наказания различают различные информационные критерии.

При сравнении нескольких моделей модель с наименьшим значением информационного критерия является наиболее подходящей моделью. Наиболее подходящая модель может варьироваться в зависимости от критерия, используемого для сравнения модели.

Чтобы получить любое из значений критерия в виде скаляра, проиндексируйте свойство с помощью точечной нотации. Например, получить значение AIC aic в модели mdl:

aic = mdl.ModelCriterion.AIC

Типы данных: struct

`MSE` - Среднеквадратичная ошибка
числовое значение

Это свойство доступно только для чтения.

Среднеквадратичная ошибка, заданная как числовое значение. Среднеквадратичная ошибка - это оценка дисперсии члена ошибки в модели.

Типы данных: single | double

`NumCoefficients` - Количество коэффициентов модели
положительное целое число

Это свойство доступно только для чтения.

Число коэффициентов в подгоняемой модели, указанное как положительное целое число. NumCoefficients является таким же, как NumEstimatedCoefficients для NonLinearModel объекты. NumEstimatedCoefficients равен степеням свободы для регрессии.

Типы данных: double

`NumEstimatedCoefficients` - Количество расчетных коэффициентов
положительное целое число

Это свойство доступно только для чтения.

Количество расчетных коэффициентов в подогнанной модели, указанное как положительное целое число. NumEstimatedCoefficients является таким же, как NumCoefficients для NonLinearModel объекты. NumEstimatedCoefficients равен степеням свободы для регрессии.

Типы данных: double

`NumPredictors` - Количество переменных предиктора
положительное целое число

Это свойство доступно только для чтения.

Число предикторных переменных, используемых для соответствия модели, указанное как положительное целое число.

Типы данных: double

`NumVariables` - Количество переменных
положительное целое число

Это свойство доступно только для чтения.

Число переменных во входных данных, указанное как положительное целое число. NumVariables - количество переменных в исходной таблице или наборе данных или общее число столбцов в матрице предиктора и векторе ответа.

NumVariables также включает любые переменные, которые не используются для соответствия модели в качестве предикторов или в качестве ответа.

Типы данных: double

`ObservationInfo` - Информация о наблюдениях
стол

Это свойство доступно только для чтения.

Информация наблюдения, заданная как таблица n-by-4, где n равно количеству строк входных данных. ObservationInfo содержит столбцы, описанные в этой таблице.

Колонка	Описание
`Weights`	Веса наблюдения, заданные как числовое значение. Значение по умолчанию: `1`.
`Excluded`	Индикатор исключенных наблюдений, указанный как логическое значение. Значение: `true` при исключении наблюдения из посадки с помощью `'Exclude'` аргумент пары имя-значение.
`Missing`	Индикатор отсутствующих наблюдений, указанный как логическое значение. Значение: `true` если наблюдение отсутствует.
`Subset`	Индикатор того, использует ли функция аппроксимации наблюдение, указанное как логическое значение. Значение: `true` если наблюдение не исключено или отсутствует, т.е. функция фитинга использует наблюдение.

Чтобы получить любой из этих столбцов в виде вектора, выполните индексирование в свойство с помощью точечной нотации. Например, получить весовой вектор w модели mdl:

w = mdl.ObservationInfo.Weights

Типы данных: table

`ObservationNames` - Названия наблюдений
массив ячеек символьных векторов

Это свойство доступно только для чтения.

Имена наблюдений, определяемые как массив ячеек символьных векторов, содержащих имена наблюдений, используемых при подгонке.

Если подгонка основана на таблице или наборе данных, содержащих имена наблюдений, ObservationNames использует эти имена.
В противном случае ObservationNames является пустым массивом ячеек.

Типы данных: cell

`PredictorNames` - Названия предикторов, используемых для подгонки модели
массив ячеек символьных векторов

Это свойство доступно только для чтения.

Имена предикторов, используемых для подгонки к модели, заданные как клеточный массив символьных векторов.

Типы данных: cell

`Residuals` - Остатки для установленной модели
стол

Это свойство доступно только для чтения.

Остатки для подогнанной модели, указанные как таблица, содержащая одну строку для каждого наблюдения и столбцы, описанные в этой таблице.

Колонка	Описание
`Raw`	Наблюдаемые минус установленные значения
`Pearson`	Необработанные остатки, разделенные на среднеквадратичную ошибку (RMSE)
`Standardized`	Необработанные остатки, деленные на их расчетное стандартное отклонение
`Studentized`	Необработанный остаток, деленный на независимую оценку остаточного стандартного отклонения. Остаток для наблюдения i делится на оценку среднеквадратического отклонения погрешности на основе всех наблюдений, кроме наблюдения i.

Использовать plotResiduals для создания графика остатков. Дополнительные сведения см. в разделе Остатки.

Строки, не используемые в подгонке из-за отсутствия значений (в ObservationInfo.Missing) или исключенные значения (в ObservationInfo.Excluded) содержат NaN значения.

Чтобы получить любой из этих столбцов в виде вектора, выполните индексирование в свойство с помощью точечной нотации. Например, получить необработанный остаточный вектор r в модели mdl:

r = mdl.Residuals.Raw

Типы данных: table

`ResponseName` - Имя переменной ответа
символьный вектор

Это свойство доступно только для чтения.

Имя ответной переменной, указанное как символьный вектор.

Типы данных: char

`RMSE` - Среднеквадратичная ошибка корня
числовое значение

Это свойство доступно только для чтения.

Среднеквадратическая ошибка корня, заданная как числовое значение. Среднеквадратичная ошибка - это оценка стандартного отклонения члена ошибки в модели.

Типы данных: single | double

`Robust` - Надежная информация о подгонке
структура

Это свойство доступно только для чтения.

Надежная информация о посадке, заданная как структура со следующими полями:

Область	Описание
`WgtFun`	Надежная взвешивающая функция, например `'bisquare'` (см. `robustfit`)
`Tune`	Значение, указанное для параметра настройки (может быть `[]`)
`Weights`	Вектор весов, использованных при окончательной итерации надежной посадки

Эта структура пуста, если fitnlm построил модель с использованием надежной регрессии.

Типы данных: struct

`Rsquared` - R-квадрат для модели
структура

Это свойство доступно только для чтения.

Значение R-квадрата для модели, указанное как структура с двумя полями:

Ordinary - Обычный (нескорректированный) R-квадрат
Adjusted - R-квадрат, скорректированный на количество коэффициентов

R-квадрат - это доля общей суммы квадратов, объясняемая моделью. Обычное значение R-квадрата относится к SSR и SST свойства:

Rsquared = SSR/SST,

где SST - общая сумма квадратов, и SSR - регрессионная сумма квадратов.

Дополнительные сведения см. в разделе Коэффициент определения (R-квадрат).

Чтобы получить любое из этих значений в виде скаляра, выполните индексирование в свойство с помощью точечной нотации. Например, получить скорректированное значение R-квадрата в модели mdl:

r2 = mdl.Rsquared.Adjusted

Типы данных: struct

`SSE` - Сумма квадратичных ошибок
числовое значение

Это свойство доступно только для чтения.

Сумма квадратичных ошибок (остатков), заданная как числовое значение.

Типы данных: single | double

`SSR` - Регрессионная сумма квадратов
числовое значение

Это свойство доступно только для чтения.

Регрессионная сумма квадратов, заданная как числовое значение. Сумма регрессии квадратов равна сумме квадратичных отклонений аппроксимируемых значений от их среднего значения.

Типы данных: single | double

`SST` - Общая сумма квадратов
числовое значение

Это свойство доступно только для чтения.

Общая сумма квадратов, заданная как числовое значение. Общая сумма квадратов равна сумме квадратичных отклонений вектора отклика y от mean(y).

Типы данных: single | double

`VariableInfo` - Информация о переменных
стол

Это свойство доступно только для чтения.

Информация о переменных, содержащихся в Variables, задается как таблица с одной строкой для каждой переменной и столбцов, описанных в этой таблице.

Колонка	Описание
`Class`	Класс переменных, заданный как массив ячеек символьных векторов, например `'double'` и `'categorical'`
`Range`	Диапазон переменных, заданный как массив ячеек векторов Непрерывная переменная - Двухэлементный вектор `[min,max]`, минимальное и максимальное значения Категориальная переменная - вектор различных значений переменных
`InModel`	Индикатор, переменные которого находятся в подогнанной модели, определяемый как логический вектор. Значение: `true` если модель включает переменную.
`IsCategorical`	Индикатор категориальных переменных, указанный как логический вектор. Значение: `true` если переменная категорична.

VariableInfo также включает любые переменные, которые не используются для соответствия модели в качестве предикторов или в качестве ответа.

Типы данных: table

`VariableNames` - имена переменных;
массив ячеек символьных векторов

Это свойство доступно только для чтения.

Имена переменных, определяемые как массив ячеек символьных векторов.

Если аппроксимация основана на таблице или наборе данных, это свойство предоставляет имена переменных в таблице или наборе данных.
Если подгонка основана на матрице предиктора и векторе отклика, VariableNames содержит значения, указанные 'VarNames' аргумент пары имя-значение метода фитинга. Значение по умолчанию 'VarNames' является {'x1','x2',...,'xn','y'}.

VariableNames также включает любые переменные, которые не используются для соответствия модели в качестве предикторов или в качестве ответа.

Типы данных: cell

`Variables` - Входные данные
стол

Это свойство доступно только для чтения.

Входные данные, указанные как таблица. Variables содержит как предикторные, так и ответные значения. Если аппроксимация основана на таблице или массиве наборов данных, Variables содержит все данные из таблицы или массива набора данных. В противном случае Variables - таблица, созданная на основе матрицы входных данных; X и вектор отклика y.

Variables также включает любые переменные, которые не используются для соответствия модели в качестве предикторов или в качестве ответа.

Типы данных: table

Функции объекта

`coefCI`	Доверительные интервалы оценок коэффициентов модели нелинейной регрессии
`coefTest`	Тест линейной гипотезы по коэффициентам модели нелинейной регрессии
`feval`	Оценка прогноза модели нелинейной регрессии
`partialDependence`	Вычислить частичную зависимость
`plotPartialDependence`	Создание графиков частичной зависимости (PDP) и индивидуального условного ожидания (ICE)
`plotDiagnostics`	Диагностика графика нелинейной регрессионной модели
`plotResiduals`	Печать остатков модели нелинейной регрессии
`plotSlice`	График срезов через подогнанную нелинейную регрессионную поверхность
`predict`	Прогнозирование отклика модели нелинейной регрессии
`random`	Моделирование откликов для модели нелинейной регрессии

Копирование семантики

Значение. Сведения о том, как классы значений влияют на операции копирования, см. в разделе Копирование объектов.

Примеры

свернуть все

Подгонка модели нелинейной регрессии

Открыть сценарий в реальном времени

Подгонка модели нелинейной регрессии для автоматического пробега на основе carbig данные. Спрогнозировать пробег среднего автомобиля.

Загрузите образцы данных. Создание матрицы X содержащий измерения для лошадиных сил (Horsepower) и вес (Weight) каждого вагона. Создание вектора y содержащие значения отклика в милях на галлон (MPG).

load carbig
X = [Horsepower,Weight];
y = MPG;

Подгонка нелинейной регрессионной модели.

modelfun = @(b,x)b(1) + b(2)*x(:,1).^b(3) + ...
    b(4)*x(:,2).^b(5);
beta0 = [-50 500 -1 500 -1];
mdl = fitnlm(X,y,modelfun,beta0)

mdl = 
Nonlinear regression model:
    y ~ b1 + b2*x1^b3 + b4*x2^b5

Estimated Coefficients:
          Estimate      SE        tStat       pValue 
          ________    _______    ________    ________

    b1     -49.383     119.97    -0.41164     0.68083
    b2      376.43     567.05     0.66384     0.50719
    b3    -0.78193    0.47168     -1.6578    0.098177
    b4      422.37     776.02     0.54428     0.58656
    b5    -0.24127    0.48325    -0.49926     0.61788


Number of observations: 392, Error degrees of freedom: 387
Root Mean Squared Error: 3.96
R-Squared: 0.745,  Adjusted R-Squared 0.743
F-statistic vs. constant model: 283, p-value = 1.79e-113

Найдите прогнозируемый пробег среднего автомобиля. Поскольку образец данных содержит отсутствующие данные (NaN) наблюдения, вычислите среднее, используя mean с 'omitnan' вариант.

Xnew = mean(X,'omitnan')

Xnew = 1×2
10³ ×

    0.1051    2.9794

MPGnew = predict(mdl,Xnew)

MPGnew = 21.8073

Подробнее

развернуть все

Матрица шляпы

Hat-матрица H определяется в терминах матрицы X данных и Jacobian-матрицы J:

$_{} {\frac{}{_{}}}_{_{} Ji,j=∂f∂βj'xi,β}$

Здесь f - функция нелинейной модели, а β - вектор коэффициентов модели.

Матрица Hat H представляет собой

H = J (^JTJ⁾ ^-1JT.

Диагональные элементы _Hii удовлетворяют

$\begin{array}{l} _{} \\ _{}^{}_{} 0≤hii≤1∑i=1nhii=p, \end{array}$

где n - количество наблюдений (строк X), а p - число коэффициентов в регрессионной модели.

Рычаги

Леверидж - это мера влияния конкретного наблюдения на регрессионные прогнозы из-за положения этого наблюдения в пространстве входных данных.

Леверидж наблюдения i является значением i-го диагонального члена hii матрицы hat H. Поскольку сумма значений левериджа равна p (число коэффициентов в регрессионной модели), наблюдение i можно считать отклонением, если его леверидж существенно превышает p/n, где n - число наблюдений.

Расстояние Кука

Расстояние Кука _Di наблюдения i

$_{} \frac{_{}^{Di=∑j=1n} {\overset{y}{(}}_{}^{\overset{j}{}}_{- y}^{^}}{j (i})$ ) 2p MSE,

где

${\overset{}{y}}_{^}$ j - j-ое совпадающее значение отклика.
${\overset{}{y}}_{^j}$ (i) - значение j-ой подогнанной реакции, где посадка не включает в себя наблюдение i.
MSE - это среднеквадратичная ошибка.
p - число коэффициентов в регрессионной модели.

Расстояние Кука алгебраически эквивалентно следующему выражению:

$_{Di} \frac{=_{}^{}}{ri2p} \frac{{MSE}_{(}}{{hii_{(1}}^{−}}$ hii) 2),

где _ei - i-й остаток.

См. также

fitnlm | GeneralizedLinearModel | LinearModel | nlinfit | predict

Документация

Класс NonLinearModel

Описание

Строительство

Свойства

CoefficientCovariance - Ковариационная матрица оценок коэффициентов числовая матрица

CoefficientNames - Наименования коэффициентов массив ячеек символьных векторов

Coefficients - Значения коэффициентов стол

Diagnostics - Диагностическая информация стол

DFE - Степени свободы для ошибки положительное целое число

Fitted - Установленные значения отклика на основе входных данных числовой вектор

Formula - Информация о модели NonLinearFormula объект

Iterative - Информация о процессе фитинга структура

LogLikelihood - Средства к существованию числовое значение

ModelCriterion - Критерий сравнения моделей структура

MSE - Среднеквадратичная ошибка числовое значение

NumCoefficients - Количество коэффициентов модели положительное целое число

NumEstimatedCoefficients - Количество расчетных коэффициентов положительное целое число

NumPredictors - Количество переменных предиктора положительное целое число

NumVariables - Количество переменных положительное целое число

ObservationInfo - Информация о наблюдениях стол

ObservationNames - Названия наблюдений массив ячеек символьных векторов

PredictorNames - Названия предикторов, используемых для подгонки модели массив ячеек символьных векторов

Residuals - Остатки для установленной модели стол

ResponseName - Имя переменной ответа символьный вектор

RMSE - Среднеквадратичная ошибка корня числовое значение

Robust - Надежная информация о подгонке структура

Rsquared - R-квадрат для модели структура

SSE - Сумма квадратичных ошибок числовое значение

SSR - Регрессионная сумма квадратов числовое значение

SST - Общая сумма квадратов числовое значение

VariableInfo - Информация о переменных стол

VariableNames - имена переменных; массив ячеек символьных векторов

Variables - Входные данные стол

Функции объекта

Копирование семантики

Примеры

Подгонка модели нелинейной регрессии

Подробнее

Матрица шляпы

Рычаги

Расстояние Кука

См. также

Темы

Документация по инструментам для статистического и машинного обучения

Поддержка

`CoefficientCovariance` - Ковариационная матрица оценок коэффициентов
числовая матрица

`CoefficientNames` - Наименования коэффициентов
массив ячеек символьных векторов

`Coefficients` - Значения коэффициентов
стол

`Diagnostics` - Диагностическая информация
стол

`DFE` - Степени свободы для ошибки
положительное целое число

`Fitted` - Установленные значения отклика на основе входных данных
числовой вектор

`Formula` - Информация о модели
`NonLinearFormula` объект

`Iterative` - Информация о процессе фитинга
структура

`LogLikelihood` - Средства к существованию
числовое значение

`ModelCriterion` - Критерий сравнения моделей
структура

`MSE` - Среднеквадратичная ошибка
числовое значение

`NumCoefficients` - Количество коэффициентов модели
положительное целое число

`NumEstimatedCoefficients` - Количество расчетных коэффициентов
положительное целое число

`NumPredictors` - Количество переменных предиктора
положительное целое число

`NumVariables` - Количество переменных
положительное целое число

`ObservationInfo` - Информация о наблюдениях
стол

`ObservationNames` - Названия наблюдений
массив ячеек символьных векторов

`PredictorNames` - Названия предикторов, используемых для подгонки модели
массив ячеек символьных векторов

`Residuals` - Остатки для установленной модели
стол

`ResponseName` - Имя переменной ответа
символьный вектор

`RMSE` - Среднеквадратичная ошибка корня
числовое значение

`Robust` - Надежная информация о подгонке
структура

`Rsquared` - R-квадрат для модели
структура

`SSE` - Сумма квадратичных ошибок
числовое значение

`SSR` - Регрессионная сумма квадратов
числовое значение

`SST` - Общая сумма квадратов
числовое значение

`VariableInfo` - Информация о переменных
стол

`VariableNames` - имена переменных;
массив ячеек символьных векторов

`Variables` - Входные данные
стол