Двухэтапные модели для двигателей

Обзор математики двухэтапных моделей

Этот раздел содержит обзор математики двухэтапных моделей. Комплексной ссылкой для двухэтапного моделирования являются Давидиан и Гильтинан [3]. Информация разделена на следующие разделы:

Lindstrom и Bates [6] определяют повторные измерения как данные, сгенерированные наблюдением ряда особей неоднократно в различных экспериментальных условиях, где индивидуумы считаются случайной выборкой из представляющей интерес населения. Важным классом повторных измерений являются продольные данные, где наблюдения упорядочены по времени или положению в пространстве. В более общем случае продольные данные определяются как повторные измерения, где наблюдения за отдельным индивидуумом не назначаются или не могут быть случайным образом отнесены к уровням обработки, представляющей интерес.

Данные моделирования этого рода обычно включают характеристику связи между измеренным откликом, y и повторным фактором измерения или ковариатным x. Часто, базовая систематическая связь между y и x является нелинейной. В некоторых случаях соответствующая нелинейная модель может быть выведена на физических или механистических основаниях. Однако в других контекстах нелинейное соотношение может быть введено просто для обеспечения удобного эмпирического описания данных. Наличие повторных наблюдений у индивидуума требует особой осторожности при характеристике изменения экспериментальных данных. В частности, важно явно представлять два источника изменения: случайные изменения среди измерений внутри данного индивидуума (intraindividual) и случайные изменения среди индивидуумов (interindividual). Инференциальные процедуры включают эти различные компоненты отклонения в рамках соответствующей иерархической статистической модели. Это фундаментальная идея анализа повторных данных измерений.

Холлидей [1,2] был, возможно, первым, кто применил нелинейные процедуры анализа повторных измерений к данным двигателя зажигания. В особом внимании работы Холлидея было моделирование данных, взятых из экспериментов по отображению двигателей. В этих экспериментах скорость вращения двигателя, нагрузка и соотношение воздух/топливо поддерживались постоянными, в то время как искра изменялась. Различные характеристики отклика двигателя, например крутящий момент или величины выбросов, измерялись при каждой установке искры. Холлидей смоделировал характеристики отклика для каждого свипа как функции усовершенствования. Изменения в отдельных параметрах свипа затем моделировались как функция от глобальных рабочих переменных двигателя скорость, нагрузка и отношение воздух/топливо. Концептуально, изменения в измерениях, взятых в ходе свипа, представляют внутритрубный компонент отклонения. Точно так же изменение специфичных для сдвига параметров между свипами представляет собой промежуточный компонент отклонения. Можно обобщить эти принципы к другим упражнениям по моделированию установившегося двигателя, где природа набора данных обычно включает в себя развертку одной переменной управления двигателем, в то время как остальная часть удерживается при фиксированных значениях. Эти точки предполагают, что нелинейный повторный анализ измерений представляет собой общий подход к параметризации моделей двигателей среднего значения для ориентированной на системы управления разработки.

Другое применение для моделей этой формы является уравнениями потока для тела дросселя. Если предположить, что уравнения потока основаны на обычном одномерном принципе изентропного потока, то они должны быть изменены термином эффективной площади, Ae, который учитывает тот факт, что истинный поток многомерен и необратим. Можно сопоставить характеристики потока дросселя путем протаскивания положения дросселя при фиксированной скорости вращения двигателя. Эта методология набора данных, естественно, накладывает иерархию, анализ которой согласуется с применением нелинейных повторных измерений. Опыт моделирования эффективной площади предполагает, что модели свободного сплайна узла или биологического роста обеспечивают хорошие локальные предсказания. Глобальная фаза процедуры моделирования связана с предсказанием систематического изменения функций отклика на скорости вращения двигателя. Модель сплайна свободного узла оказалась полезной для этой цели.

Локальные модели

Реакции моделирования локально в сдвиге как функция только от независимой переменной. То есть,

yij=fi(sij,θi)+εij     для j=1,2,...mi(1)

где индекс i относится к отдельным тестам, и j к данным в тесте, является jth независимое значение, θi является (rx1) вектором параметра, является j th ответ, и является обычно распределенной случайной переменной с нулем среднего и отклонением2. Обратите внимание, что уравнение (4-1) может быть либо линейной, либо нелинейной функцией параметров подгонки кривой. Предположение о независимо нормально распределенных ошибках подразумевает, что оценки методом наименьших квадратов θ являются также параметрами максимальной вероятности.

Локальное ковариационное моделирование

Локальная модель описывает как систематическое, так и случайное изменение, связанное с измерениями, принятыми во время ith тест. Систематическое изменение характеризуется через функцию f, в то время как изменение характеризуется через распределительные допущения, сделанные на векторе случайных ошибок ei. Следовательно, спецификация модели для распределения ei завершает описание модели внутриэкспериментальной модели. Основанный на модели продукт Toolbox™ калибровки позволяет получить очень общую спецификацию локальной ковариации:

(2)

то, где Ci (ni x ni) ковариационная матрица, является коэффициентом изменчивости, и ξi - (q-1) вектор параметров дисперсии, которые составляют разнородность отклонения и возможность последовательно коррелированых данных. Спецификация является очень общей и обеспечивает значительную гибкость с точки зрения определения ковариационной модели для адекватного описания случайного компонента самого внутритрубного изменения.

Продукт Model-Based Calibration Toolbox поддерживает следующие ковариационные модели:

  • Модель отклонения степени:

    (3)
  • Экспоненциальная модель Отклонения:

    (4)
  • Модель смешанных отклонений:

    (5)

где diag {x} является диагональной матрицей.

Корреляционные модели доступны только для равномерных данных в продукте Model-Based Calibration Toolbox. Возможно объединить корреляционные модели с моделями с дисперсионными моделями, такими как степень.

Одной из самых простых структур, которая может использоваться для учета последовательно коррелированных ошибок, является модель AR (m) (авторегрессионная модель с задержкой m). Общая форма модели AR (m) является

(6)

где kth lag коэффициент и vj является экзогенным стохастическим входом, идентично и независимо распределенным как. Авторегрессивные модели первого и второго порядка реализованы в продукте Model-Based Calibration Toolbox.

Другой возможностью является модель скользящего среднего значения (MA). Общая структура:

(7)

где kth lag коэффициент и vj является экзогенным стохастическим входом, идентично и независимо распределенным как. В продукте Model-Based Calibration Toolbox реализована только модель скользящего среднего значения первого порядка.

Функции отклика

С технической точки зрения параметры подгонки кривых обычно не имеют никакой интуитивной интерпретации. Интересны довольно характерные геометрические функции кривой. Терминология «функций отклика» Краудера и Руки [8] используется для описания этих интересующих геометрических функций. В целом вектор функции отклика pi для ith свип является нелинейной функцией (g) соответствующего вектора параметра подгонки кривых θi, таким что

(8)

Глобальные модели

Моделирование изменения признаков отклика как функции от глобальных переменных. Функции отклика переносятся на второй этап процедуры моделирования, а не на параметры подгонки кривых, поскольку они имеют инженерную интерпретацию. Это гарантирует, что второй этап процесса моделирования остается относительно интуитивно понятным. Гораздо более вероятно, что инженер будет лучше знать, как функция отклика, такая как MBT, ведет себя в рабочей области значений двигателя (по крайней мере, на основе основных эффектов) в отличие от оценки параметра подгонки эзотерической кривой.

Глобальная связь представлена одной из глобальных моделей, доступных в продукте Model-Based Calibration Toolbox. В этом разделе мы рассматриваем только линейные модели, которые могут быть представлены как

Pi=Xiβ+γi  for i=1,2,...,r(9)

где Xi содержит информацию об условиях работы двигателя вth spark sweep, β является вектором глобальных оценок параметров, которые должны быть оценены процедурой аппроксимации, и γi является вектором нормально распределенных случайных ошибок. Необходимо сделать некоторое предположение о распределении ошибок для γ, и это обычно нормальное распределение с

(10)

где r - количество функций отклика. Размерности D являются (rxr), и, будучи дисперсионно-ковариационной матрицей, D является как симметричным, так и положительно определенным. Условия на начальной диагонали D представляют отклонение «тест-тест», связанную с оценкой отдельных функций отклика. Off-диагональные условия представляют ковариацию между парами функций отклика. Оценка этих дополнительных ковариационных терминов в многомерном анализе улучшает точность оценок параметров.

Двухэтапные модели

Чтобы объединить две модели, сначала необходимо просмотреть распределительные допущения, относящиеся к вектору pi функции отклика. Отклонение pi (Var (pi)) задаётся как

(11)

Для простоты в обозначении2Ci должен обозначать Var (pi). Таким образом, pii распределяется как

(12)

где Ci зависит от fi через отклонение θi а также на gi через преобразование θi к характеристикам отклика pi. При определении Ci используются два стандартных предположения: асимптотическое приближение для отклонения максимальных оценок правдоподобия и приближение для отклонения функций максимальных оценок правдоподобия, которая основана на разложении gi ряда Тейлора. В сложение для нелинейных или gi Ci зависит от неизвестного θi; поэтому мы будем использовать смету на ее месте. Эти приближения, вероятно, будут хорошими в случае, когда2 является маленьким, или число точек на сдвиг (mi) велико. В любом случае мы предполагаем, что эти приближения действительны во всем.

Теперь вернемся к вопросу оценки параметра. Предположим, что γi не зависят от. Затем, допуская аддитивную ошибку репликации в функциях отклика, функции отклика распределяются как

(13)

Когда все тесты рассматриваются одновременно, уравнение (6-13) может быть записано в компактном виде

(14)

где P - вектор, образованный сложением n векторов pi поверх друг друга, Z - матрица, образованная сложением n Xi матриц, W - блочная диагональная взвешивающая матрица с матрицами на диагонали, являющимися2Ci + D, и Для многомерного нормального распределения (6-14) может быть записана отрицательная функция журнала правдоподобия:

(15)

Таким образом, максимальными оценками правдоподобия являются векторы βML и Обычно параметров подгонки намного больше, чем параметров дисперсии; то есть, размерность β намного больше, чем Таким образом, выгодно уменьшить количество параметров, участвующих в минимизации logL (β, Ключ состоит в том, чтобы понять, что уравнение (6-15) является условно линейным относительно β. Следовательно, при заданных оценках,, уравнение (6-15) может быть дифференцировано непосредственно относительно β, и получившееся выражение устанавливается на нуль. Это уравнение может быть решено непосредственно для β следующим образом:

(16)

Ключевой точкой является то, что теперь вероятность зависит только от вектора параметра дисперсии, который, как уже обсуждалось, имеет только скромные размерности. После минимизации вероятности с получением, в таком случае, в связи с тем, что W (В) известно, уравнение (6-16) может быть впоследствии использовано для определения βML.

Выбор глобальной модели

Прежде чем предпринимать минимизацию уравнения 15 (см. Двухэтапные модели), сначала необходимо установить форму Xi матрица. Это эквивалентно установлению глобального выражения для каждого из признаков отклика априори. Одномерная ступенчатая регрессия используется, чтобы выбрать форму глобальной модели для каждой функции отклика. Минимизация соответствующей статистики PRESS используется как принцип построения моделей, как указано в Stepwise в процессе построения моделей. Базовый принцип заключается в том, что, используя одномерные методы для установления возможных моделей, максимальные методы правдоподобия впоследствии используются для оценки их параметров.

Начальные значения для ковариаций

Первоначальная оценка глобальной ковариации получена с использованием стандартной двухэтапной оценки Steimer et al. [10],

(17)

где β - оценки из всех одномерных глобальных моделей. Эта оценка является предвзятой.

Алгоритм Квази-Ньютона

Неявным для минимизации уравнения (6-17) является то, что D положительно определено. Это простое дело, чтобы гарантировать это, отмечая, что D положительно определено тогда и только тогда, когда существует верхняя треугольная матрица, G, скажем, такая, что

(18)

Эта факторизация используется в алгоритме Квази-Ньютона. В первую очередь преимущество этого подхода заключается в том, что полученный поиск в G, в отличие от D, не ограничен.

Алгоритм максимизации ожиданий

Алгоритм максимизации ожиданий является итерационным методом, который сходится к максимальному решению функции правдоподобия. Каждая итерация имеет два шага:

  1. Шаг ожидания - создание уточненных оценок характеристик отклика с учетом текущих оценок параметра.

  2. Шаг максимизации - получите новые оценки параметров (глобальные параметры модели и ковариация матрица) для новых функций отклика.

Эти шаги повторяются до тех пор, пока улучшение значения функции журнала правдоподобия не станет меньше допуска. Подробная информация об алгоритме содержится в [3, глава 5].

Ссылки

  1. Holliday, T., Проект and Analysis of Engine Mapping Experiments: A Two-Stage Approach, Ph.D. Thesis, University of Birmingham, 1995.

  2. Holliday, T., Lawrance, A. J., Davis, T. P., Engine-Mapping Experiments: A Two-Stage Regression Approach, Technometrics, 1998, Vol. 40, pp 120-126.

  3. Davidian, M., Giltinan, D. M., Nonlinear Models for Reputed Measurement Data, Chapman & Hall, First Edition, 1995.

  4. Davidian, M., Giltinan, D. M., Анализ данных повторных измерений с использованием нелинейной модели смешанных эффектов, Chemometrics and Intelligent Laboratory Systems, 1993, Vol. 20, pp 1-24.

  5. Davidian, M., Giltinan, D. M., Анализ данных повторных измерений с использованием нелинейной модели смешанных эффектов, Journal of Biopharmaceutical Statistics, 1993, Vol. 3, part 1, pp 23-55.

  6. Lindstrom, M. J., Bates, D. M., Нелинейные модели смешанных эффектов для данных повторных измерений, биометрия, 1990, Vol. 46, pp 673-687.

  7. Davidian, M., Giltinan, D. M., Некоторые простые методы для оценки внутривенной изменчивости в нелинейных моделях смешанных эффектов, биометрия, 1993, Vol. 49, pp 59-73.

  8. Hand, D. J., Crowder, M. J., Practical Longitudinal Data Analysis, Chapman and Hall, First Edition, 1996.

  9. Франклин, Г.Ф., Пауэлл, Джей-Ди, Workman, M.L., Digital Control of Динамические Системы, Addison-Wesley, Second Edition, 1990.

  10. Steimer, J.-L., Mallet, A., Golmard, J.L., and Boisvieux, J.F., Альтернативные подходы к оценке населения фармакокинетических параметров: Сравнение с нелинейной моделью смешанного эффекта. Обзоры метаболизма наркотиков, 1984, 15, 265-292.

Линейная регрессия

Построение регрессионной модели, которая включает только подмножество от общего количества доступных терминов, включает компромисс между двумя конфликтующими целями:

  • Увеличение количества членов модели всегда уменьшает Суммарную Квадратичную невязку.

  • Однако вы не хотите так много терминов модели, что перегружаете, гоняясь за точками и пытаясь подогнать модель, чтобы сигнализировать о шуме. Это уменьшает прогнозирующее значение вашей модели.

Лучшее регрессионное уравнение является тем, которое обеспечивает удовлетворительный компромисс между этими конфликтующими целями, по крайней мере, в сознании аналитика. Хорошо известно, что нет уникального определения лучшего. Различные критерии построения моделей (для примера, прямого выбора, обратного выбора, поиска PRESS, пошагового поиска, Mallows Cp Statistic...) дают различные модели. В сложение, даже если оптимальное значение построения моделей статистики найдено, нет гарантии, что полученная модель будет оптимальной в любом другом из принятых чувств.

В основном цель построения регрессионной модели для калибровки состоит в прогнозировании будущих наблюдений среднего значения функции отклика. Поэтому цель состоит в том, чтобы выбрать подмножество условий регрессии, так что PRESS минимизируется. Минимизация PRESS согласуется с целью получения регрессионой модели, которая обеспечивает хорошую прогнозирующую способность в экспериментальном факторном пространстве. Этот подход может применяться как к полиному, так и к сплайну моделей. В любом случае процесс построения моделей идентичен.

  1. Матрицу регрессии можно просмотреть в Design Evaluation Tool. Условия в этой матрице определяют полную модель. В целом, пошаговая модель является подмножеством этого полного набора терминов.

  2. Все регрессии выполняются с факторами, представленными на их закодированных шкалах (-1,1).

Определения терминов и статистики тулбокса

Определения

СимволОпределение

N

Количество точек данных

p

Количество терминов, включенных в модель

q

Общее количество возможных параметров модели (q = p + r)

r

Количество терминов, не включенных в модель

y

(Nx1) вектор отклика

X

Регрессионная матрица. X имеет размерности (Nxq)

Xp

(Nxp) матрица модели, соответствующая терминам, включенным в настоящее время в модель

Xr

(Nxr) матрица, соответствующая терминам, в настоящее время исключенным из модели

(px1) вектор коэффициентов модели

PEV

Отклонение ошибки предсказания

Пользовательские пороговые критерии для автоматического отклонения терминов

(Nx1) вектор предсказанных ответов.

e

(Nx1) вектор невязок.

e (i)

(Nx1) вектор невязок PRESS.

H

Матрица шляп.

L

(Nx1) вектор значений рычага.

VIF

Дисперсионные коэффициенты инфляции

SSE

Сумма ошибок квадратов. SSE = e 'e

SSR

Регрессионная сумма квадратов. SSE =

SST

Общая сумма квадратов. SST = y 'y - N

MSE

Средняя квадратная ошибка. MSE = SSE/( N-p)

MSR

Средняя площадь регрессии. MSR = SSR/P

F

F-статистический. F = MSR/MSE

MSE (i)

MSE, рассчитанный с ith точка удалена из набора данных.

RMSE

Корневая средняя квадратичная невязка: стандартное отклонение регрессии.

СИ

яth R-Student или External Scaled Studentized Residual.

ri

яth Стандартизированный или внутренне масштабированный исследуемая невязка.

D

Диагностика влияния D Кука.

SEBETA

(px1) вектор стандартных ошибок коэффициента модели.

где

Пресса

Предсказанная сумма ошибок квадратов. PRESS = e '(i) e (i)

Для получения дополнительной информации о PRESS и других отображаемых статистических данных смотрите статистические данные PRESS, Инструкции по выбору наилучшей Подгонки модели и Объединенная статистика.