nlmpcmove

Вычислите действие оптимального управления для нелинейного контроллера MPC

Описание

mv = nlmpcmove(nlmpcobj,x,lastmv) вычисляет оптимальное действие управления переменными, которым управляют, в течение текущего времени. Чтобы симулировать нелинейное MPC управление с обратной связью, вызовите nlmpcmove неоднократно.

пример

mv = nlmpcmove(nlmpcobj,x,lastmv,ref) задает ссылочные значения для объекта выходные параметры. Если вы не задаете ссылочные значения, nlmpcmove нули использования по умолчанию.

mv = nlmpcmove(nlmpcobj,x,lastmv,ref,md) указывает, что время выполнения измерило значения воздействия. Если ваш контроллер измерил воздействия, необходимо задать md.

пример

mv = nlmpcmove(nlmpcobj,x,lastmv,ref,md,options) задает дополнительные опции во время выполнения для вычисления перемещений оптимального управления. Используя options, вы можете задать исходные предположения для состояния и управляли переменными траекториями, настраивающими весами обновления при ограничениях, или измените параметры модели предсказания.

пример

[mv,opt] = nlmpcmove(___) возвращает nlmpcmoveopt объект, который содержит исходные предположения для состояния и траекторий, которыми управляют, которые будут использоваться в следующем контрольном интервале.

пример

[mv,opt,info] = nlmpcmove(___) возвращает дополнительные детали решения, включая итоговое значение функции стоимости оптимизации и оптимальную переменную, которой управляют, состояние и выходные траектории.

Примеры

свернуть все

Создайте нелинейный контроллер MPC с шестью состояниями, шестью выходными параметрами и четырьмя входными параметрами.

nx = 6;
ny = 6;
nu = 4;
nlobj = nlmpc(nx,ny,nu);
In standard cost function, zero weights are applied by default to one or more OVs because there are fewer MVs than OVs.

Задайте шаг расчета контроллера и горизонты.

Ts = 0.4;
p = 30;
c = 4;
nlobj.Ts = Ts;
nlobj.PredictionHorizon = p;
nlobj.ControlHorizon = c;

Задайте функцию состояния модели предсказания и якобиан функции состояния. В данном примере используйте модель летающего робота.

nlobj.Model.StateFcn = "FlyingRobotStateFcn";
nlobj.Jacobian.StateFcn = "FlyingRobotStateJacobianFcn";

Задайте пользовательскую функцию стоимости для контроллера, который заменяет стандартную функцию стоимости.

nlobj.Optimization.CustomCostFcn = @(X,U,e,data) Ts*sum(sum(U(1:p,:)));
nlobj.Optimization.ReplaceStandardCost = true;

Задайте пользовательскую ограничительную функцию для контроллера.

nlobj.Optimization.CustomEqConFcn = @(X,U,data) X(end,:)';

Задайте линейные ограничения на переменные, которыми управляют.

for ct = 1:nu
    nlobj.MV(ct).Min = 0;
    nlobj.MV(ct).Max = 1;
end

Подтвердите модель предсказания и пользовательские функции в начальных состояниях (x0) и начальные входные параметры (u0) из робота.

x0 = [-10;-10;pi/2;0;0;0];
u0 = zeros(nu,1); 
validateFcns(nlobj,x0,u0);
Model.StateFcn is OK.
Jacobian.StateFcn is OK.
No output function specified. Assuming "y = x" in the prediction model.
Optimization.CustomCostFcn is OK.
Optimization.CustomEqConFcn is OK.
Analysis of user-provided model, cost, and constraint functions complete.

Вычислите оптимальное состояние, и управлял переменными траекториями, которые возвращены в info.

[~,~,info] = nlmpcmove(nlobj,x0,u0);
Slack variable unused or zero-weighted in your custom cost function. All constraints will be hard.

Постройте оптимальные траектории.

FlyingRobotPlotPlanning(info)
Optimal fuel consumption =   4.712383

Создайте нелинейный контроллер MPC с четырьмя состояниями, двумя выходными параметрами и одним входом.

nlobj = nlmpc(4,2,1);
In standard cost function, zero weights are applied by default to one or more OVs because there are fewer MVs than OVs.

Задайте шаг расчета и горизонты контроллера.

Ts = 0.1;
nlobj.Ts = Ts;
nlobj.PredictionHorizon = 10;
nlobj.ControlHorizon = 5;

Задайте функцию состояния для контроллера, который находится в файле pendulumDT0.m. Эта модель дискретного времени интегрирует непрерывную модель времени, заданную в pendulumCT0.m использование многоступенчатого прямого Метода Эйлера.

nlobj.Model.StateFcn = "pendulumDT0";
nlobj.Model.IsContinuousTime = false;

Модель предсказания использует дополнительный параметр, Ts, представлять шаг расчета. Задайте количество параметров.

nlobj.Model.NumberOfParameters = 1;

Задайте выходную функцию модели, передав параметр шага расчета как входной параметр.

nlobj.Model.OutputFcn = @(x,u,Ts) [x(1); x(3)];

Задайте стандартные ограничения для контроллера.

nlobj.Weights.OutputVariables = [3 3];
nlobj.Weights.ManipulatedVariablesRate = 0.1;
nlobj.OV(1).Min = -10;
nlobj.OV(1).Max = 10;
nlobj.MV.Min = -100;
nlobj.MV.Max = 100;

Подтвердите функции модели предсказания.

x0 = [0.1;0.2;-pi/2;0.3];
u0 = 0.4;
validateFcns(nlobj, x0, u0, [], {Ts});
Model.StateFcn is OK.
Model.OutputFcn is OK.
Analysis of user-provided model, cost, and constraint functions complete.

Только два из состояний объекта измеримы. Поэтому создайте расширенный Фильтр Калмана для оценки четырех состояний объекта. Его функция изменения состояния задана в pendulumStateFcn.m и его функция измерения задана в pendulumMeasurementFcn.m.

EKF = extendedKalmanFilter(@pendulumStateFcn,@pendulumMeasurementFcn);

Задайте начальные условия для симуляции, инициализируйте расширенное состояние Фильтра Калмана и укажите, что нулевая начальная буква управляла значением переменных.

x = [0;0;-pi;0];
y = [x(1);x(3)];
EKF.State = x;
mv = 0;

Задайте выходное значение ссылки.

yref = [0 0];

Создайте nlmpcmoveopt объект, и задает параметр шага расчета.

nloptions = nlmpcmoveopt;
nloptions.Parameters = {Ts};

Запустите симуляцию для 10 секунды. Во время каждого контрольного интервала:

  1. Откорректируйте предыдущее предсказание с помощью текущего измерения.

  2. Вычислите перемещения оптимального управления с помощью nlmpcmove. Эта функция возвращает вычисленные оптимальные последовательности в nloptions. Передача обновленных опций возражает против nlmpcmove в следующем контрольном интервале обеспечивает исходные предположения для оптимальных последовательностей.

  3. Предскажите состояния модели.

  4. Примените первое вычисленное перемещение оптимального управления к объекту, обновив состояния объекта.

  5. Сгенерируйте данные о датчике с белым шумом.

  6. Сохраните состояния объекта.

Duration = 10;
xHistory = x;
for ct = 1:(Duration/Ts)
    % Correct previous prediction
    xk = correct(EKF,y);
    % Compute optimal control moves
    [mv,nloptions] = nlmpcmove(nlobj,xk,mv,yref,[],nloptions);
    % Predict prediction model states for the next iteration
    predict(EKF,[mv; Ts]);
    % Implement first optimal control move
    x = pendulumDT0(x,mv,Ts);
    % Generate sensor data
    y = x([1 3]) + randn(2,1)*0.01;
    % Save plant states
    xHistory = [xHistory x];
end

Постройте получившиеся траектории состояния.

figure
subplot(2,2,1)
plot(0:Ts:Duration,xHistory(1,:))
xlabel('time')
ylabel('z')
title('cart position')
subplot(2,2,2)
plot(0:Ts:Duration,xHistory(2,:))
xlabel('time')
ylabel('zdot')
title('cart velocity')
subplot(2,2,3)
plot(0:Ts:Duration,xHistory(3,:))
xlabel('time')
ylabel('theta')
title('pendulum angle')
subplot(2,2,4)
plot(0:Ts:Duration,xHistory(4,:))
xlabel('time')
ylabel('thetadot')
title('pendulum velocity')

Входные параметры

свернуть все

Нелинейный контроллер MPC в виде nlmpc объект.

Текущая модель предсказания утверждает в виде вектора lengthNx, где Nx является количеством состояний модели предсказания. Поскольку нелинейный контроллер MPC не выполняет оценку состояния, необходимо или измерить или оценить текущие состояния модели предсказания в каждом контрольном интервале. Для получения дополнительной информации о нелинейных моделях предсказания MPC смотрите, Задают Модель Предсказания для Нелинейного MPC.

Управляющие сигналы использовали на объекте в предыдущем контрольном интервале в виде вектора lengthNmv, где Nmv является количеством переменных, которыми управляют.

Примечание

Задайте lastmv когда переменные сигналы, которыми управляют, применились к объекту в предыдущем контрольном интервале. Как правило, эти сигналы являются значениями, сгенерированными контроллером, хотя это не всегда имеет место. Например, если ваш контроллер является оффлайновым и рабочим в режиме отслеживания; то есть, контроллер вывел, не управляет объектом, затем кормя фактическим управляющим сигналом last_mv может помочь достигнуть передачи bumpless, когда контроллер переключается назад онлайн.

Выходные значения ссылки объекта в виде вектора-строки из длины Ny или массив со столбцами Ny, где Ny является количеством выходных переменных. Если вы не задаете ref, ссылочные значения по умолчанию являются нулем.

Чтобы использовать те же ссылочные значения через горизонт предсказания, задайте вектор-строку.

Чтобы варьироваться ссылочные значения по горизонту предсказания со времени k +1 ко времени k +p, задайте массив с до строк p. Здесь, k является текущим временем, и p является горизонтом предсказания. Каждая строка содержит ссылочные значения для одного шага горизонта предсказания. Если вы задаете меньше, чем строки p, значения в итоговой строке используются в остающихся шагах горизонта предсказания.

Измеренные значения воздействия в виде вектора-строки из длины Nmd или массив со столбцами Nmd, где Nmd является количеством измеренных воздействий. Если ваш контроллер измерил воздействия, необходимо задать md. Если у вашего контроллера нет измеренных воздействий, задайте md как [].

Чтобы использовать те же значения воздействия через горизонт предсказания, задайте вектор-строку.

Чтобы варьироваться значения воздействия по горизонту предсказания со времени k ко времени k +p, задайте массив с до p +1 строка. Здесь, k является текущим временем, и p является горизонтом предсказания. Каждая строка содержит значения воздействия для одного шага горизонта предсказания. Если вы задаете меньше, чем строки p, значения в итоговой строке используются в остающихся шагах горизонта предсказания.

Опции во время выполнения в виде nlmpcmoveopt объект. Используя эти опции, вы можете:

  • Настройте веса контроллера

  • Обновите линейные ограничения

  • Поставьте переменные цели, которыми управляют,

  • Задайте параметры модели предсказания

  • Обеспечьте исходные предположения для состояния, и управлял переменными траекториями

Эти опции применяются только к текущему nlmpcmove момент времени.

Чтобы повысить эффективность решателя, это - лучшая практика задать исходные предположения для состояния и управляло переменными траекториями.

Выходные аргументы

свернуть все

Оптимальное действие управления переменными, которым управляют, возвращенное как вектор-столбец длины Nmv, где Nmv является количеством переменных, которыми управляют.

Если решатель сходится к решению для локального оптимума (info.ExitFlag положительно), затем mv содержит оптимальное решение.

Если решатель достигает максимального количества итераций, не находя оптимальное решение (info.ExitFlag = 0) и:

  • nlmpcobj.Optimization.UseSuboptimalSolution true, затем mv содержит субоптимальное решение

  • nlmpcobj.Optimization.UseSuboptimalSolution false, затем mv содержит lastmv

Если решатель перестал работать (info.ExitFlag отрицательно), затем mv содержит lastmv.

Опции во время выполнения с исходными предположениями для состояния и переменных траекторий, которыми управляют, которые будут использоваться в следующем контрольном интервале, возвращенном как nlmpcmoveopt объект. Любые опции во время выполнения, что вы задали использование options, такой как веса, ограничения или параметры, копируются в opt.

Исходные предположения для состояний (opt.X0) и переменные, которыми управляют (opt.MV0) оптимальные траектории, вычисленные nlmpcmove и соответствуйте последнему p-1 строка info.Xopt и info.MVopt, соответственно.

Чтобы использовать эти исходные предположения в следующем контрольном интервале, задайте opt как options входной параметр к nlmpcmove.

Детали решения, возвращенные как структура со следующими полями.

Оптимальная переменная последовательность, которой управляют, возвращенная как (p +1)-by-Nmv массив, где p является горизонтом предсказания и Nmv, является количеством переменных, которыми управляют.

MVopt(i,:) содержит расчетные оптимальные значения переменных, которыми управляют, во время k+i-1, для i = 1,...,p, где k текущее время. MVopt(1,:) содержит те же значения переменных, которыми управляют, как выходной аргумент mv. Поскольку контроллер не вычисляет перемещения оптимального управления во время k+p, MVopt(p+1,:) равно MVopt(p,:).

Оптимальная модель предсказания утверждает последовательность, возвращенную как (p +1)-by-Nx массив, где p является горизонтом предсказания, и Nx является количеством состояний в модели предсказания.

Xopt(i,:) содержит расчетные значения состояния во время k+i-1, для i = 2,...,p+1, где k текущее время. Xopt(1,:) совпадает с текущими состояниями в x.

Оптимальная последовательность выходной переменной, возвращенная как (p +1)-by-Ny массив, где p является горизонтом предсказания и Ny, является количеством выходных параметров.

Yopt(i,:) содержит расчетные выходные значения во время k+i-1, для i = 2,...,p+1, где k текущее время. Yopt(1,:) вычисляется на основе текущих состояний в x и текущие измеренные воздействия в md,если таковые имеются.

Последовательность времени горизонта предсказания, возвращенная как вектор-столбец длины p +1, где p является горизонтом предсказания. Topt содержит последовательность времени со времени k ко времени k +p, где k является текущим временем.

Topt(1) = 0 представляет текущее время. Последующие временные шаги Topt(i) Ts*(i-1), где Ts шаг расчета контроллера.

Используйте Topt при графическом выводе MVopt, Xopt, или Yopt последовательности.

Ослабьте переменную, ε, используемый в ограничительном смягчении, возвращенном как неотрицательное скалярное значение.

  • ε = 0 — Всем мягким ограничениям удовлетворяют по целому горизонту предсказания.

  • ε> 0 — По крайней мере одно мягкое ограничение нарушено. Когда больше чем одно ограничение нарушено, ε представляет худший случай мягкое нарушение ограничений (масштабируемый вашими значениями ECR для каждого ограничения).

Код выхода оптимизации, возвращенный как одно из следующего:

  • Положительное Целое число — Оптимальное решение найдено

  • 0 — Выполнимое субоптимальное решение, найденное после максимального количества итераций

  • Отрицательное целое число — Никакое возможное решение не найдено

Стоимость целевой функции, возвращенная как неотрицательное скалярное значение. Стоимость определяет количество степени, до которой контроллер достиг ее целей.

Величина затрат только значима когда ExitFlag является неотрицательным.

Советы

Во время симуляций с обратной связью это - лучшая практика к горячему запуску нелинейный решатель при помощи предсказанного состояния и управляло переменными траекториями от предыдущего контрольного интервала как исходные предположения для текущего контрольного интервала. Использовать эти траектории в качестве исходных предположений:

  1. Возвратите opt выходной аргумент при вызове nlmpcmove. Этот nlmpcmoveopt объект содержит любые опции во время выполнения, которые вы задали в предыдущем вызове nlmpcmove, наряду с исходными предположениями для состояния (opt.X0) и переменная, которой управляют (opt.MV0) траектории.

  2. Передайте этот объект в как options входной параметр к nlmpcmove для следующего контрольного интервала.

Эти шаги являются лучшой практикой, даже если вы не задаете никакие другие опции во время выполнения.

Введенный в R2018b