Reinforcement Learning Toolbox

Разработайте и обучите политики с помощью изучения укрепления

Reinforcement Learning Toolbox™ обеспечивает функции и блоки для учебных политик с помощью укрепления, изучая алгоритмы включая DQN, A2C и DDPG. Можно использовать эти политики реализовать контроллеры и алгоритмы принятия решений для сложных систем, таких как роботы и автономные системы. Можно проводить политику с помощью глубоких нейронных сетей, полиномов или интерполяционных таблиц.

Тулбокс позволяет вам обучить политики, позволяя им взаимодействовать со средами, представленными моделями Simulink® или MATLAB®. Можно оценить алгоритмы, эксперимент с гиперустановками параметров, и контролировать учебный прогресс. Чтобы улучшать учебную производительность, можно запустить симуляции параллельно на облаке, компьютерных кластерах и графических процессорах (с Parallel Computing Toolbox™ и MATLAB Parallel Server™).

Через формат модели ONNX™ существующие политики могут быть импортированы из сред глубокого обучения, таких как TensorFlow™ Keras и PyTorch (с Deep Learning Toolbox™). Можно сгенерировать оптимизированный C, C++ и код CUDA, чтобы развернуть обученные политики по микроконтроллерам и графическим процессорам.

Тулбокс включает справочные примеры для использования укрепления, учащегося разработать контроллеры для робототехники, и автоматизировал ведущие приложения.

Начало работы

Изучите основы Reinforcement Learning Toolbox

Среды MATLAB

Образцовое использование динамики среды обучения укрепления MATLAB

Окружения Simulink

Образцовая динамика среды обучения укрепления с помощью моделей Simulink

Политики и функции значения

Задайте политику и представления функции значения, такие как таблицы Q и глубокие нейронные сети

Агенты

Создайте и сконфигурируйте укрепление, изучив агенты с помощью общих алгоритмов, таких как SARSA, DQN, DDPG и A2C

Обучение и валидация

Обучите и моделируйте агенты изучения укрепления

Развертывание политики

Генерация кода и развертывание обученных политик