Оценка качества подгонки

Как оценить качество подгонки

После подгонки данных с одной или несколькими моделями необходимо оценить качество подгонки. Визуальный осмотр подобранной кривой, отображенный в приложении Аппроксимирование Кривыми, должен стать вашим первым шагом. Кроме того, тулбокс предоставляет эти методы для оценки качества подгонки как для линейных, так и для нелинейных параметрических подгонок:

Как распространено в статистической литературе, термин качество подгонки используется здесь в нескольких смыслах: «хорошая подгонка» может быть моделью

что ваши данные могли исходить разумно, учитывая предположения методом наименьших квадратов подбора кривой
в котором коэффициенты модели могут быть оценены с малой неопределенностью
что объясняет высокую долю изменчивости в ваших данных и способно предсказывать новые наблюдения с высокой степенью уверенности

Конкретное приложение может диктовать другие аспекты модели, которые важны для достижения хорошей подгонки, такие как простая модель, которую легко интерпретировать. Методы, описанные здесь, могут помочь вам определить качество подгонки во всех этих чувствах.

Эти методы сгруппированы в два типа: графический и численный. Построение графиков невязок и границ предсказания являются графическими методами, которые помогают визуальной интерпретации, в то время как вычисление качества подгонки статистики и ограничений доверия коэффициентов приводит к численным мерам, которые помогают статистическим рассуждениям.

Вообще говоря, графические измерения более выгодны, чем числовые, потому что они позволяют вам просматривать весь набор данных сразу, и они могут легко отображать широкую область значений отношений между моделью и данными. Числовые показатели более узко ориентированы на конкретный аспект данных и часто пытаются сжать эту информацию в одно число. На практике, в зависимости от ваших данных и требований анализа, вам может потребоваться использовать оба типа для определения наилучшей подгонки.

Обратите внимание, что возможно, что ни одна из ваших подгонок не может считаться подходящей для ваших данных, основываясь на этих методах. В этом случае может быть, что вам нужно выбрать другую модель. Возможно также, что все измерения качества подгонки указывают на то, что конкретная подгонка является подходящей. Однако, если ваша цель состоит в том, чтобы извлечь подобранные коэффициенты, которые имеют физический смысл, но ваша модель не отражает физику данных, получившиеся коэффициенты бесполезны. В этом случае понимание того, что представляют ваши данные и как они были измерены, так же важно, как и оценка качества подгонки.

Статистика качества подгонки

После использования графических методов для оценки качества подгонки, необходимо изучить статистику качества подгонки. Программное обеспечение Curve Fitting Toolbox™ поддерживает эту статистику качества подгонки для параметрических моделей:

Сумма квадратов из-за ошибки (SSE)
R-квадрат
Скорректированный R-квадрат
Корневая средняя квадратичная невязка (RMSE)

Для текущей подгонки эти статистические данные отображаются на панели результатов в приложении Аппроксимирование Кривыми. Для всех подгонок в текущем сеансе аппроксимирования кривыми можно сравнить статистику качества подгонки в таблице подгонки.

Чтобы получить статистику качества подгонки в командной строке, также:

В приложении Аппроксимирование Кривыми выберите Fit > Save to Workspace, чтобы экспортировать вашу подгонку и качество подгонки в рабочую область.
Задайте gof выходной аргумент с fit функция.

Сумма квадратов из-за ошибки

Эта статистическая величина измеряет общее отклонение значений отклика от подгонки к значениям отклика. Он также называется суммированным квадратом невязок и обычно помечается как SSE.

$S S E = \sum_{i = 1}^{n} w_{i} {(y_{i} - {\hat{y}}_{i})}^{2}$

Значение ближе к 0 указывает, что модель имеет меньший компонент случайной ошибки и что подгонка будет более полезной для предсказания.

R-квадрат

Эта статистическая величина измеряет, насколько успешно подгонка в объяснении изменения данных. Другой способ, R-квадрат является квадратом корреляции между значениями отклика и предсказанными значениями отклика. Это также называется квадратом множественного коэффициента корреляции и коэффициентом множественного определения.

R-квадрат определяется как отношение суммы квадратов регрессии (SSR) и общей суммы квадратов (SST). SSR определяется как

$S S R = \sum_{i = 1}^{n} w_{i} {({\hat{y}}_{i} - \bar{y})}^{2}$

SST также называется суммой квадратов о среднем, и определяется как

$S S T = \sum_{i = 1}^{n} w_{i} {(y_{i} - \bar{y})}^{2}$

где SST = SSR + SSE. Учитывая эти определения, R-квадрат выражается как

$R-square = \frac{S S R}{S S T} = 1 - \frac{S S E}{S S T}$

R-квадрат может иметь любое значение от 0 до 1 со значением ближе к 1, указывающим, что большая доля отклонения учитывается моделью. Для примера значение R-квадрат 0,8234 означает, что подгонка объясняет 82,34% от общего изменения данных о среднем значении.

Если вы увеличите количество коэффициентов уравнения аппроксимации в вашей модели, R-квадрат увеличится, хотя подгонка может не улучшиться в практическом смысле. Чтобы избежать этой ситуации, вы должны использовать степени свободы, скорректированная статистическая величина R-квадрата описана ниже.

Обратите внимание, что можно получить отрицательный R-квадрат для уравнений, которые не содержат постоянного члена. Поскольку R-квадрат задан как доля отклонения, объясняемая подгонкой, если подгонка на самом деле хуже, чем просто подбор кривой горизонтальной линии, то R-квадрат отрицателен. В этом случае R-квадрат не может быть интерпретирован как квадрат корреляции. Такие ситуации указывают, что в модель должен быть добавлен постоянный термин.

Скорректированный по степеням свободы R-квадрат

Эта статистическая величина использует статистическую величину R-квадрат, заданную выше, и корректирует ее на основе остаточных степеней свободы. Остаточные степени свободы определяются как количество значений отклика n минус количество коэффициентов уравнения аппроксимации, m оценивается из значений отклика.

v = n – m

v указывает количество независимых частей информации, связанных с n точками данных, которые требуются для вычисления суммы квадратов. Обратите внимание, что если параметры ограничены, и одна или несколько оценок находятся в своих границах, то эти оценки рассматриваются как фиксированные. Степени свободы увеличиваются на количество таких параметров.

Скорректированная статистическая величина R-квадрата обычно является лучшим показателем качества подгонки, когда вы сравниваете две модели, которые вложены - то есть серия моделей, каждая из которых добавляет дополнительные коэффициенты к предыдущей модели.

$adjusted R-square = 1 - \frac{S S E (n - 1)}{S S T (v)}$

Скорректированная статистическая величина R-квадрата может иметь любое значение, меньше чем или равное 1 со значением ближе к 1, указывающим на лучшую подгонку. Отрицательные значения могут возникнуть, когда модель содержит условия, которые не помогают предсказать ответ.

Среднее значение корня Квадратичной невязки

Эта статистическая величина также известна как стандартная ошибка подгонки и стандартная ошибка регрессии. Это - оценка стандартного отклонения случайного компонента в данных, и определяется как

$R M S E = s = \sqrt{M S E}$

где MSE - средняя квадратная ошибка или остаточный средний квадрат

$M S E = \frac{S S E}{v}$

Как и в случае с SSE, MSE значение ближе к 0 указывает на подгонку, которая более полезна для предсказания.

См. также

fit

Документация