Управление поиском экстремума

Управление поиском экстремума (ESC) является алгоритмом адаптивного управления в реальном времени, без моделей, который полезен для адаптации параметров к неизвестной системной динамике и неизвестным отображениям от параметров управления до целевой функции. Можно использовать экстремум, стремящийся решить статические задачи оптимизации и оптимизировать параметры динамических систем.

Экстремум, ища алгоритм использует следующие этапы, чтобы настроить значение параметров.

Модуляция — Тревожит значение параметра, оптимизируемого с помощью низкой амплитуды синусоидальный сигнал.
Отклик системы — оптимизируемая система реагирует на возмущения параметра. Эта реакция вызывает соответствующее изменение в значении целевой функции.
Демодуляция — Умножает сигнал целевой функции на синусоиду с той же частотой как сигнал модуляции. Этот этап включает дополнительный фильтр высоких частот, чтобы удалить смещение из сигнала целевой функции.
Обновление параметра — Обновление значение параметров путем интеграции демодулируемого сигнала. Значение параметров соответствует состоянию интегратора. Этот этап включает дополнительный фильтр lowpass, чтобы удалить высокочастотный шум из демодулируемого сигнала.

Simulink^® Программное обеспечение Control Design™ реализует этот алгоритм с помощью блока Extremum Seeking Control. Для примеров ищущего экстремум управления см.:

Временной интервал

Используя блок Extremum Seeking Control, можно реализовать и контроллеры непрерывного времени и дискретного времени. Алгоритм ESC является тем же самым в обоих случаях. Изменение временного интервала контроллера влияет на область времени фильтров высоких частот, фильтров lowpass и интеграторов, используемых в настраивающихся циклах.

Чтобы сгенерировать развертываемый на оборудовании код для блока Extremum Seeking Control, используйте контроллер дискретного времени.

Следующая таблица показывает передаточные функции непрерывного времени и дискретного времени для фильтров и интеграторов в блоке Extremum Seeking Control.

Элемент контроллера	Передаточная функция непрерывного времени	Передаточная функция дискретного времени
Фильтр высоких частот	$\frac{s}{s + ω_{h}}$	$\frac{1 - z^{- 1}}{1 - ω_{h} z^{- 1}}$
Фильтр lowpass	$\frac{1}{s + ω_{l}}$	$\frac{1}{1 - ω_{l} z^{- 1}}$
Интегратор	$\frac{1}{s}$	Прямой Эйлер: $\frac{T_{s}}{z - 1}$ Обратный Эйлер: $\frac{T_{s} z}{z - 1}$ Трапециевидный: $\frac{T_{s}}{2} \frac{z + 1}{z - 1}$

Элемент контроллера

Передаточная функция непрерывного времени

Передаточная функция дискретного времени

Фильтр высоких частот

$\frac{s}{s + ω_{h}}$

$\frac{1 - z^{- 1}}{1 - ω_{h} z^{- 1}}$

Фильтр lowpass

$\frac{1}{s + ω_{l}}$

$\frac{1}{1 - ω_{l} z^{- 1}}$

Интегратор

$\frac{1}{s}$

Прямой Эйлер:

$\frac{T_{s}}{z - 1}$

Обратный Эйлер:

$\frac{T_{s} z}{z - 1}$

Трапециевидный:

$\frac{T_{s}}{2} \frac{z + 1}{z - 1}$

Здесь:

_ωl является частотой среза фильтра lowpass.
_ωh является частотой среза фильтра высоких частот.
_Ts является шагом расчета контроллера дискретного времени скорость обучения.

Статическая оптимизация

Чтобы продемонстрировать поиск экстремума, рассмотрите следующую статическую задачу оптимизации.

Extremum seeking control diagram showing the modulation, demodulation, and parameter update stages.

Здесь:

$\hat{θ}$ предполагаемое значение параметров.
θ является сигналом модуляции
y = f (θ) является функциональный максимизируемый выход, то есть, целевая функция.
ω является частотой принуждения сигналов модуляции и демодуляции.
b· (ωt) является сигналом модуляции.
a· (ωt) является сигналом демодуляции.
k является скоростью обучения.

Оптимальное значение параметров, θ*, происходит в максимальном значении f (θ).

Чтобы оптимизировать несколько параметров, вы используете отдельный настраивающий цикл для каждого параметра.

Следующая фигура демонстрирует экстремум, ищущий увеличивающийся фрагмент кривой целевой функции. Модулируемый θ сигнала является суммой текущего предполагаемого параметра и сигнала модуляции. Применение f (θ) производит встревоженную целевую функцию с той же фазой как сигнал модуляции. Умножение встревоженной целевой функции сигналом демодуляции производит положительный сигнал. Интеграция этого сигнала увеличивает значение θ, который двигает его поближе к пику целевой функции.

Graph of an objective function with modulation and demodulation demonstrated on an increasing portion of the curve.

Следующая фигура демонстрирует экстремум, ищущий уменьшающийся фрагмент кривой целевой функции. В этом случае применение f (θ) производит встревоженную целевую функцию, которая является 180 градусами, несовпадающими по фазе от сигнала модуляции. Умножение на сигнал демодуляции производит отрицательный сигнал. Интеграция этого сигнала уменьшает значение θ, который двигает его поближе к пику целевой функции.

Graph of an objective function with modulation and demodulation demonstrated on a decreasing portion of the curve

Следующая фигура демонстрирует экстремум, ищущий плоский фрагмент кривой целевой функции, то есть, фрагмент кривой около максимума. В этом случае применение f (θ) производит встревоженную целевую функцию почти нуля. Умножение на сигнал демодуляции и интеграция этого сигнала не значительно изменяют значение θ, который уже является около его оптимального значения θ*.

Graph of an objective function with modulation and demodulation demonstrated on a nearly flat portion of the curve

Оптимизация динамической системы

Оптимизация поиска экстремума динамической системы происходит подобным способом как статическая оптимизация. Однако в этом случае параметр θ влияет на выход зависящей от времени динамической системы. Целевая функция, которая будет максимизироваться, вычисляется из системы выход. Следующий рисунок показывает общий настраивающий цикл для динамической системы.

Extremum seeking for a time-dependent dynamic system.

Здесь:

$\dot{x} = f (x, α (x, θ))$ функция состояния динамической системы.
z = h (x) является выход динамической системы.
y = g (z) является целевой функцией, выведенной из выхода динамической системы.
ϕ ₁ является фазой сигнала демодуляции.
ϕ ₂ является фазой сигнала модуляции.

Руководство по проектированию ESC

При разработке ищущего экстремум контроллера рассмотрите следующие инструкции.

Убедитесь, что системные движущие силы находятся на самом быстром масштабе времени, частоты принуждения находятся на среднем масштабе времени, и частоты среза фильтра находятся на самом медленном масштабе времени.
Задайте амплитуду для сигнала демодуляции, который очень больше, модуляция сигнализируют об амплитуде (a ≫ b).
Выберите углы фазы для модуляции, и демодуляция сигнализирует таким образом что because(ϕ ₁ – ϕ ₂₎> 0.
При настройке нескольких параметров частота принуждения для каждого настраивающего цикла должна отличаться.
Попытайтесь проектировать свою систему без фильтров lowpass и высокой передачи. Если эффективность не является удовлетворительной, можно затем рассмотреть добавление того или обоих фильтров.

Ссылки

[1] Ariyur, Картик Б. и Мирослав Крстик. Оперативная оптимизация управлением поиском экстремума. Хобокен, NJ: межнаука Вайли, 2003.

Документация