exponenta event banner

Двухступенчатые модели для двигателей

Обзор математики двухэтапных моделей

Этот раздел содержит обзор математики двухступенчатых моделей. Полным справочником для двухэтапного моделирования являются Давидиан и Гилтинан [3]. Информация разделена на следующие разделы:

Линдстрем и Бейтс [6] определяют повторные измерения как данные, полученные при многократном наблюдении ряда индивидуумов в различных экспериментальных условиях, где предполагается, что индивидуумы составляют случайную выборку из интересующей популяции. Важным классом повторных измерений являются продольные данные, в которых наблюдения упорядочены по времени или положению в пространстве. В более общем случае продольные данные определяются как повторные измерения, когда наблюдения на одном индивидууме не или не могут быть случайным образом распределены по уровням интересующего лечения.

Данные моделирования такого рода обычно включают в себя характеристику взаимосвязи между измеренным откликом, y, и повторяющимся коэффициентом измерения, или ковариатом x. Часто лежащая в основе систематическая взаимосвязь между y и x является нелинейной. В некоторых случаях соответствующая нелинейная модель может быть получена на физических или механистических основаниях. Однако в других контекстах нелинейная связь может быть навязана просто для обеспечения удобного эмпирического описания данных. Наличие повторных наблюдений на индивидууме требует особой осторожности при характеристике вариаций в экспериментальных данных. В частности, важно явно представлять два источника вариаций: случайные вариации среди измерений в пределах данного индивидуума (внутрираздельные) и случайные вариации среди индивидуумов (межраздельные). Процедуры вывода учитывают эти различные компоненты дисперсии в рамках соответствующей иерархической статистической модели. Это фундаментальная идея, лежащая в основе анализа данных повторных измерений.

Холлидей [1,2] был, пожалуй, первым, кто применил нелинейные повторные процедуры анализа измерений к данным двигателя зажигания. В центре внимания работы Холлидея было моделирование данных, взятых из экспериментов по картированию двигателей. В этих экспериментах частота вращения двигателя, нагрузка и соотношение воздух/топливо оставались постоянными, в то время как искра изменялась. При каждой установке искры измерялись различные характеристики реакции двигателя, например крутящий момент или количество выбросов. Холлидей смоделировал характеристики отклика для каждого свипа как функцию искрового опережения. Затем были смоделированы изменения индивидуальных параметров стреловидности в зависимости от общей рабочей частоты вращения двигателя, нагрузки и соотношения воздух/топливо. Концептуально, вариации в измерениях, проводимых в рамках развертки, представляют собой дисперсионную составляющую внутри отдельного компонента. Аналогично, изменение специфичных для протягивания параметров между протягиваниями представляет собой внутреннюю составляющую дисперсии. Эти принципы можно обобщить на другие упражнения по стационарному моделированию двигателя, в которых характер сбора данных обычно включает в себя подметание одной управляющей переменной двигателя, в то время как остальные хранятся при фиксированных значениях. Эти моменты свидетельствуют о том, что анализ нелинейных повторных измерений представляет собой общий подход к параметризации моделей двигателей среднего значения для разработки, ориентированной на контроль.

Другим приложением для моделей этой формы являются уравнения расхода для корпуса дросселя. Предполагая, что уравнения потока основаны на обычном одномерном изэнтропическом принципе потока, они должны быть модифицированы эффективным членом площади Ae, который учитывает тот факт, что истинный поток является многомерным и необратимым. Можно отобразить характеристики потока дроссельной заслонки, подметая положение дроссельной заслонки при фиксированной частоте вращения двигателя. Эта методология сбора данных, естественно, устанавливает иерархию, анализ которой согласуется с применением нелинейных повторяющихся мер. Опыт моделирования эффективной области предполагает, что модели свободного сплайна или биологического роста обеспечивают хорошие локальные прогнозы. Глобальная фаза процедуры моделирования связана с предсказанием систематического изменения характеристик отклика по частоте вращения двигателя. Для этой цели оказалась полезной модель сплайна со свободным узлом.

Локальные модели

Моделирование ответов локально в рамках сдвига как функция только независимой переменной. То есть

yij = fi (sij, starti)  +   αij для j = 1,2,... mi(1)

где подстрочный индекс i относится к отдельным тестам и j - к данным в тесте, является j-м независимым значением, (rx1) -вектором параметров, является j-м откликом и является нормально распределенной случайной величиной с нулевым средним и дисперсией start2. Обратите внимание, что уравнение (4-1) может быть линейной или нелинейной функцией параметров аппроксимации кривой. Допущение о независимо нормально распределенных ошибках подразумевает, что оценки наименьших квадратов в,, также являются максимальными параметрами правдоподобия.

Локальное ковариационное моделирование

Локальная модель описывает как систематические, так и случайные изменения, связанные с измерениями, проводимыми во время i-го теста. Систематическая вариация характеризуется через функцию f, а вариация - через распределительные допущения, сделанные на векторе случайных ошибок ei. Следовательно, спецификация модели для распределения ei завершает описание модели intratest. Продукт Model-Based Calibration Toolbox™ обеспечивает очень общую спецификацию локальной ковариации:

(2)

где Ci является (ni x ni) ковариационной матрицей, является коэффициентом вариации, а starti является (q-by-1) вектором параметров дисперсии, которые учитывают неоднородность дисперсии и возможность серийно коррелированных данных. Описание является очень общим и обеспечивает значительную гибкость с точки зрения определения ковариационной модели для адекватного описания случайной составляющей самого внутреннего изменения.

Продукт Model-Based Calibration Toolbox поддерживает следующие ковариационные модели:

  • Модель отклонения мощности:

    (3)
  • Экспоненциальная модель расхождения:

    (4)
  • Модель смешанного отклонения:

    (5)

где diag {x} - диагональная матрица.

Корреляционные модели доступны только для равнораспределенных данных в изделии Model-Based Calibration Toolbox. Можно комбинировать корреляционные модели с моделями дисперсии, такими как мощность.

Одной из простейших структур, которая может использоваться для учета последовательно коррелированных ошибок, является модель AR (m) (авторегрессионная модель с запаздыванием m). Общая форма модели AR (m):

(6)

где - коэффициент k-го запаздывания, а vj - экзогенный стохастический вход, одинаково и независимо распределенный как. Авторегрессионные модели первого и второго порядка реализуются в изделии Model-Based Calibration Toolbox.

Другой возможностью является модель скользящего среднего (MA). Общая структура:

(7)

где - коэффициент k-го запаздывания, а vj - экзогенный стохастический вход, одинаково и независимо распределенный как. В изделии Model-Based Calibration Toolbox реализована только модель скользящего среднего первого порядка.

Функции ответа

С инженерной точки зрения параметры аппроксимации кривой обычно не имеют какой-либо интуитивной интерпретации. Интерес представляют скорее характерные геометрические особенности кривой. Терминология «особенности ответа» Краудера и Руки [8] используется для описания этих интересующих геометрических особенностей. В общем, вектор характеристик отклика pi для i-ой развертки является нелинейной функцией (g) соответствующего вектора параметра аппроксимации кривой, такого, что

(8)

Глобальные модели

Моделирование вариаций характеристик ответа как функции глобальных переменных. Элементы отклика переносятся на второй этап процедуры моделирования, а не на параметры аппроксимации кривой, поскольку они имеют инженерную интерпретацию. Это гарантирует, что второй этап процесса моделирования остается относительно интуитивно понятным. Гораздо более вероятно, что инженер будет лучше знать, как функция отклика, такая как ЦГБ, ведет себя во всем диапазоне работы двигателя (по меньшей мере, на основе основных эффектов), в отличие от оценки параметров соответствия эзотерической кривой.

Глобальная взаимосвязь представлена одной из глобальных моделей, доступных в продукте Model-Based Calibration Toolbox. В этом разделе рассматриваются только линейные модели, которые могут быть представлены как

Pi = Xiβ  + γ i для i = 1,2,..., r(9)

где Xi содержит информацию об условиях работы двигателя при i-м свипе искры, β - вектор оценок глобальных параметров, которые должны быть оценены процедурой подгонки, γ i - вектор нормально распределенных случайных ошибок. Необходимо сделать некоторое предположение о распределении ошибок для γ, и это обычно нормальное распределение с

(10)

где r - число функций ответа. Размеры D равны (rxr) и, являясь матрицей дисперсии-ковариации, D является как симметричным, так и положительным определённым. Термины на ведущей диагонали D представляют дисперсию от теста к тесту, связанную с оценкой индивидуальных характеристик ответа. Внедиагональные члены представляют ковариацию между парами признаков ответа. Оценка этих дополнительных ковариационных терминов в многомерном анализе повышает точность оценок параметров.

Двухступенчатые модели

Чтобы объединить две модели, сначала необходимо проанализировать допущения распределения, относящиеся к вектору pi признаков отклика. Дисперсия pi (Var (pi)) задается как

(11)

Для простоты обозначение σ2Ci должно обозначать Var (pi). Таким образом, pii распределяется как

(12)

где Ci зависит от fi через различие θi, и также на gi посредством преобразования θi к ответу показывает пи. При определении Ci используются два стандартных предположения: асимптотическая аппроксимация для дисперсии оценок максимального правдоподобия и аппроксимация для дисперсии функций оценок максимального правдоподобия, которая основана на расширении gi рядов Тейлора. Кроме того, для нелинейных или gi, Ci зависит от неизвестного starti; поэтому мы будем использовать оценку вместо нее. Эти аппроксимации, скорее всего, будут хорошими в том случае, когда start2 мал или число точек на свип (mi) велико. В любом случае мы предполагаем, что эти приближения действительны на всем протяжении.

Теперь вернемся к вопросу оценки параметров. Предположим, что γ i не зависят от. Затем, допуская аддитивную ошибку репликации в функциях ответа, функции ответа распределяются как

(13)

Когда все тесты рассматриваются одновременно, уравнение (6-13) может быть записано в компактной форме

(14)

где P - вектор, образованный укладкой n векторов pi друг на друга, Z - матрица, образованная укладкой n матриц Xi, W - матрица блочного диагонального взвешивания с матрицами на диагонали σ2Ci + D, и λ - вектор параметров дисперсии. Для многомерного нормального распределения (6-14) можно записать функцию отрицательного логарифмического правдоподобия:

(15)

Таким образом, оценки максимального правдоподобия представляют собой векторы βML и startML, которые минимизируют logL (β, λ). Обычно параметров подгонки намного больше, чем параметров дисперсии; то есть размерность β намного больше, чем λ. Таким образом, выгодно уменьшить число параметров, участвующих в минимизации logL (β, λ). Ключ состоит в том, чтобы понять, что уравнение (6-15) условно линейно относительно β. Следовательно, при заданных оценках λ уравнение (6-15) может быть дифференцировано непосредственно относительно β и результирующее выражение установлено в ноль. Это уравнение можно решить непосредственно для β следующим образом:

(16)

Ключевым моментом является то, что теперь вероятность зависит только от вектора параметра дисперсии, который, как уже обсуждалось, имеет лишь скромные размеры. После того, как вероятность минимизируется, чтобы получить startML, тогда, поскольку W (startML) тогда известен, уравнение (6-16) может быть впоследствии использовано для определения βML.

Выбор глобальной модели

Перед минимизацией уравнения 15 (см. Двухэтапные модели) необходимо сначала установить форму Xi матрица. Это эквивалентно установлению глобального выражения для каждого из признаков ответа априори. Одномерная ступенчатая регрессия используется для выбора формы глобальной модели для каждого элемента ответа. Минимизация соответствующей статистики PRESS используется в качестве принципа построения модели, как указано в пошаговом описании процесса построения модели. Основной принцип состоит в том, что, использовав одномерные методы для установления возможных моделей, методы максимального правдоподобия впоследствии используются для оценки их параметров.

Начальные значения ковариаций

Исходную оценку глобальной ковариации получают, используя стандартную двухэтапную оценку Steimer et al. [10],

(17)

где β - оценки из всех одномерных глобальных моделей. Эта оценка является предвзятой.

Алгоритм Квази-Ньютона

Для минимизации уравнения (6-17) подразумевается, что D является положительным определенным. Обеспечить это простым делом, заметив, что D является положительным определенным тогда и только тогда, когда существует верхняя треугольная матрица, G, скажем, такая, что

(18)

Эта факторизация используется в алгоритме Квази-Ньютона. В первую очередь преимущество этого подхода заключается в том, что результирующий поиск в G, в отличие от D, является неограниченным.

Алгоритм максимизации ожидания

Алгоритм максимизации ожидания - итеративный метод, сходящийся к максимальному решению функции правдоподобия. Каждая итерация состоит из двух этапов:

  1. Шаг ожидания - получение уточненных оценок характеристик отклика с учетом текущих оценок параметров.

  2. Шаг максимизации - получение новых оценок параметров (параметров глобальной модели и ковариационной матрицы) для новых характеристик отклика.

Эти шаги повторяются до тех пор, пока улучшение значения логарифмической функции правдоподобия не будет меньше допуска. Подробная информация об алгоритме приведена в [3, глава 5].

Ссылки

  1. Холлидей, Т., Разработка и анализ экспериментов по картированию двигателей: двухэтапный подход, кандидатская диссертация, Бирмингемский университет, 1995 год.

  2. Холлидей, Т., Лоуранс, А. Дж., Дэвис, Т. П., Эксперименты по картированию двигателя: двухэтапный регрессионный подход, технометрия, 1998, том 40, стр. 120-126.

  3. Давидиан, М., Гилтинан, Д. М., Нелинейные модели для данных повторных измерений, Chapman & Hall, First Edition, 1995.

  4. Давидиан, М., Гилтинан, Д. М., Анализ данных повторных измерений с использованием модели нелинейных смешанных эффектов, Chemometrics and Intelligent Laboratory Systems, 1993, том 20, стр. 1-24.

  5. Davidian, M., Giltinan, D. M., Анализ данных повторных измерений с использованием модели нелинейных смешанных эффектов, Journal of Biopharmaceutical Statistics, 1993, Vol. 3, part 1, pp. 23-55.

  6. Линдстрем, М. Дж., Бейтс, Д. М., Модели нелинейных смешанных эффектов для данных повторных измерений, биометрия, 1990, том 46, стр. 673-687.

  7. Davidian, M., Giltinan, D. M., Некоторые простые методы оценки внутрираздельной изменчивости в моделях нелинейных смешанных эффектов, биометрия, 1993, том 49, стр. 59-73.

  8. Хэнд, Д. Дж., Краудер, М. Дж., Практический анализ продольных данных, Чепмен и Холл, первое издание, 1996 год.

  9. Франклин, Г.Ф., Пауэлл, Джей Ди, Workman, M.L., Digital Control of Dynamic Systems, Addison-Wesley, Second Edition, 1990.

  10. Steimer, J.-L., Mallet, A., Golmard, J.L. и Boisvieux, J.F., Альтернативные подходы к оценке фармакокинетических параметров популяции: Сравнение с нелинейной моделью смешанного эффекта. Обзоры метаболизма лекарственных средств, 1984, 15, 265-292.

Линейная регрессия

Построение регрессионной модели, включающей только подмножество общего числа доступных терминов, предполагает компромисс между двумя конфликтующими целями:

  • Увеличение числа членов модели всегда уменьшает ошибку Sum Squared.

  • Тем не менее, вы не хотите так много модельных терминов, что вы переборщиваете, преследуя точки и пытаясь подогнать модель к сигналу шума. Это снижает прогностическую ценность модели.

Лучшее уравнение регрессии - это уравнение, которое обеспечивает удовлетворительный компромисс между этими противоречивыми целями, по крайней мере, в сознании аналитика. Хорошо известно, что нет уникального определения лучшего. Различные критерии построения модели (например, прямой выбор, обратный выбор, НАЖАТЬ поиск, пошаговый поиск, Mallows Cp Statistic...) дают различные модели. Кроме того, даже если будет найдено оптимальное значение статистики построения модели, нет гарантии, что полученная модель будет оптимальной в любом другом из принятых чувств.

Главным образом цель построения регрессионной модели для калибровки состоит в прогнозировании будущих наблюдений среднего значения характеристики отклика. Поэтому цель состоит в том, чтобы выбрать подмножество членов регрессии таким образом, чтобы НАЖАТЬ был сведен к минимуму. Минимизация PRESS согласуется с целью получения регрессионной модели, которая обеспечивает хорошую прогностическую способность в экспериментальном факторном пространстве. Этот подход можно применить как к полиномиальным, так и к сплайновым моделям. В любом случае процесс построения модели идентичен.

  1. Матрицу регрессии можно просмотреть в инструменте оценки конструкции. Термины в этой матрице определяют полную модель. В общем, ступенчатая модель является подмножеством этого полного набора терминов.

  2. Все регрессии выполняются с учетом факторов, представленных на их закодированных шкалах (-1,1).

Определения терминов и статистики набора инструментов

Определения

СимволОпределение

N

Количество точек данных

p

Количество терминов, включенных в модель в настоящее время

q

Общее количество возможных параметров модели (q = p + r)

r

Количество терминов, не включенных в настоящее время в модель

y

(Nx1) вектор ответа

X

Матрица регрессии. X имеет размеры (Nxq)

Xp

(Nxp) матрица модели, соответствующая терминам, включенным в модель в настоящее время

Xr

(Nxr) матрица, соответствующая терминам, в настоящее время исключенным из модели

(px1) вектор коэффициентов модели

PEV

Отклонение ошибки прогнозирования

Определяемые пользователем пороговые критерии для автоматического отклонения терминов

(Nx1) вектор прогнозируемых ответов.

e

(Nx1) остаточный вектор .

e (i)

(Nx1) вектор остатков ПРЕССЫ .

H

Матрица шляпы.

L

(Nx1) вектор значений рычагов.

VIF

Отклоняющиеся инфляционные факторы

SSE

Ошибочная сумма квадратов. МРЗ = e 'e

SSR

Регрессионная сумма квадратов. МРЗ =

SST

Общая сумма квадратов. SST = y 'y - N

MSE

Среднеквадратическая ошибка. MSE = SSE/( N-p)

MSR

Средний квадрат регрессии. MSR = SSR/P

F

F-статистика. F = MSR/MSE

MSE (i)

MSE, рассчитанный с i-ой точкой, удаленной из набора данных.

RMSE

Среднеквадратичная ошибка: стандартное отклонение регрессии.

СИ

ith R-Student или внешне масштабированный изученный остаток.

ri

ith Стандартизированный или внутренне масштабированный изученный остаток.

D

D-диагностика влияния Кука.

SEBETA

(px1) вектор стандартных ошибок коэффициентов модели.

где

Пресса

Прогнозируемая сумма ошибок квадратов. PRESS = e '(i) e (i)

Дополнительные сведения о PRESS и других отображаемых статистических данных см. в разделах Статистика PRESS, Рекомендации по выбору наилучшего соответствия модели и Объединенная статистика.