Адаптивное управление моделью - ссылкой

Адаптивное управление моделью - ссылкой (MRAC) является основанным на модели, алгоритмом адаптивного управления в реальном времени, который вычисляет действия управления, чтобы заставить неопределенную управляемую систему отследить поведение данной ссылочной модели объекта управления. Используя Simulink® Программное обеспечение Control Design™, можно реализовать MRAC использование блока Model Reference Adaptive Control.

Следующий рисунок показывает структуру контроллера MRAC.

MRAC controller that finds the error between the reference model and plant states and computes control actions using learnable gains and disturbance model.

Цель контроллера состоит в том, чтобы сделать состояния (x) управляемой системной дорожки состояния (xm) образца модели для данного опорного сигнала (r). Для получения дополнительной информации об управляемой системе и образцах модели, смотрите Номинал и Образцы модели. Диспетчер MRAC использует следующий процесс, чтобы сгенерировать управляющий сигнал.

  1. Вычислите ошибку e между состояниями управляемой системы и состояниями образца модели.

  2. Вычислите функции ϕ(x) для внутренней модели системных воздействий и неопределенности.

  3. Обновите параметры веса возмущения на основе ошибки e.

  4. Обновите значения обратной связи и усилений прямого распространения на основе ошибки e. Можно принять решение сделать, чтобы контроллер адаптировал усиления прямого распространения, усиления обратной связи или обоих.

  5. Примените обновленные коэффициенты усиления и параметры к опорному сигналу, состояниям объекта и функциям возмущения.

  6. Вычислите действие управления u. Для получения дополнительной информации смотрите Структуру управления.

Номинал и образцы модели

Управляемая система, которая обычно показывает неопределенность моделирования и внешние возмущения, имеет следующее номинальное уравнение состояния. Эта модель представляет номинальное поведение, которое вы ожидаете от объекта.

x˙(t)=Ax(t)+B(u(t)+f(x))

Здесь:

  • x (t) является состоянием системы, которой вы хотите управлять.

  • u (t) является входом управления.

  • A является постоянной матрицей Грина.

  • B является постоянным управлением эффективная матрица.

  • f (x) является совпадающей неопределенностью в системе.

Ссылочная модель объекта управления является идеальной системой, которая характеризует желаемое поведение, которого вы хотите достигнуть на практике.

x˙m(t)=Amxm(t)+Bmr(t)

Здесь:

  • r (t) является сигналом внешней ссылки

  • xm (t) является состоянием ссылочной модели объекта управления. Поскольку r (t) известен, можно симулировать образец модели, чтобы получить xm (t).

  • Am является матрицей постоянного состояния. Для устойчивого образца модели Am должен быть матрицей Гурвица, для которой каждое собственное значение должно иметь строго отрицательную действительную часть.

  • Bm является управлением эффективная матрица.

Структура управления

MRAC вычисляет вход u управления (t) с помощью следующей структуры управления.

u(t)=kxx(t)+krr(t)uaduad=wTϕ(x)

Здесь:

  • kx является матрицей усиления обратной связи.

  • kr является матрицей усиления прямого распространения.

  • uad является компонентом адаптивного управления, выведенным из возмущения.

  • ϕ (x) содержит особенности модели воздействия и неопределенности. Для получения дополнительной информации об особенностях модели смотрите Особенности модели Воздействия и Неопределенности.

  • w является вектором веса адаптивного управления.

Диспетчер MRAC может изучить значения kx, kr и w в режиме реального времени.

Когда вы заменяете структурой управления в номинальную модель и упрощаете результат, вы получаете следующее уравнение состояния.

x˙(t)=(A+Bkx)x(t)+Bkrr(t)+B(f(x)wTϕ(x))

Неопределенность и ошибочная динамика

Используя универсальное свойство приближения нейронных сетей, можно принять, что идеальная нейронная сеть с неизвестными идеальными весами может параметрировать истинную неопределенность.

f(x)=w*Tϕ(x)+ε

Здесь, w* содержит неизвестные идеальные веса, и ε является ошибкой приближения.

Далее, если вы задаете ошибку вектора веса как w˜=w*w и замените им в структуру управления, вы получаете следующее уравнение состояния.

x˙(t)=(A+Bkx)x(t)+Bkrr(t)+B(w˜Tϕ(x)+ε)

Целью контроллера MRAC является асимптотическая сходимость состояния, отслеживающего ошибку e (t), чтобы обнулить.

e(t)=x(t)xm(t)e˙(t)=x˙(t)x˙m(t)

Замените структурой управления и уравнениями образца модели, чтобы получить следующее уравнение для ошибочной динамики.

e˙(t)=(A+Bkx)x(t)+Bkrr(t)+B(w˜Tϕ(x)+ε)Amxm(t)Bmr(t)

Можно переписать это уравнение можно следующим образом.

e˙(t)=Ame(t)+Bk˜xx(t)+Bk˜rr(t)+B(w˜Tϕ(x)+ε)k˜x=kx*kxk˜r=kr*kr

Здесь, k˜x и k˜r обратная связь и ошибки усиления прямого распространения, соответственно. kx* и kr* неизвестная идеальная обратная связь и усиления прямого распространения.

Обновления параметра

Чтобы вывести уравнения обновления параметра MRAC, сначала задайте следующую функцию Ляпунова на основе ошибочной динамики.

V(e,k˜x,k˜r,w˜)=eTQe+Γxk˜x22+Γrk˜r22+w˜TΓww˜2

Здесь, Γx, Γr и Γw являются скоростями обучения для обновлений параметра. Q является матрицей взвешивания для ошибок отслеживания состояния.

Чтобы получить следующие уравнения обновления параметра, возьмите производную Ли предыдущей функции Ляпунова вдоль ошибочной динамики и приравняйте его, чтобы обнулить.

k˙x=Γxx(t)eT(t)PBk˙r=Γrx(t)eT(t)PBw˙x=Γwϕ(t)eT(t)PB

Здесь, P является решением следующей функции Ляпунова на основе матрицы состояния образца модели.

AmTP+PAm+Q=0

Изучение модификации

Чтобы добавить робастность на уровнях высшего образования, можно изменить обновления параметра, чтобы включать дополнительный термин импульса. Можно выбрать один из двух возможных методов модификации изучения: модификация сигмы и электронная модификация.

Для модификации сигмы термин импульса для каждого обновления параметра является продуктом параметра веса импульса σ и текущее значение параметров.

k˙x=Γxx(t)eT(t)PB+σkxk˙r=Γrx(t)eT(t)PB+σkxw˙x=Γwϕ(t)eT(t)PB+σw

Для электронной модификации контроллер масштабирует термин импульса модификации сигмы нормой вектора ошибок.

k˙x=Γxx(t)eT(t)PB+σ|e(t)|kxk˙r=Γrx(t)eT(t)PB+σ|e(t)|kxw˙x=Γwϕ(t)eT(t)PB+σ|e(t)|w

Чтобы настроить объем модификации изучения для любого метода, измените значение параметра веса импульса σ.

Воздействие и особенности модели неопределенности

Блок Model Reference Adaptive Control обеспечивает внутреннюю модель uad воздействия и неопределенности модели в управляемой системе.

uad=wTϕ(x)

Здесь, ϕ (x) является вектором из особенностей модели. w является вектором веса адаптивного управления, который контроллер обновляет в режиме реального времени.

Чтобы задать ϕ (x), можно использовать одно из следующих определений функции.

  • Вектор состояния управляемого объекта — Этот подход может под - представлять неопределенность и выполнять плохо. Используйте эту опцию, когда воздействие и неопределенность модели будут линейны. Используя вектор состояния может также быть полезная начальная точка, когда вы не знаете сложности воздействия и неопределенности модели.

  • Гауссовы радиальные основные функции — Использование эта опция, когда воздействие и неопределенность модели нелинейны и структура возмущения, неизвестно.

  • Внешний источник, предоставленный блоку контроллера — Использование эта опция, чтобы задать ваш собственный характеристический вектор. Можно использовать эту опцию, когда вы знаете структуру модели воздействия и неопределенности. Например, можно использовать пользовательский характеристический вектор, чтобы идентифицировать определенные неизвестные параметры объекта.

Смотрите также

Блоки

Похожие темы

Для просмотра документации необходимо авторизоваться на сайте