Reinforcement Learning Toolbox

Разработайте и обучите политики с помощью обучения с подкреплением

Reinforcement Learning Toolbox™ обеспечивает функции и блоки для настройки политик с помощью алгоритмов обучения с подкреплением, включая DQN, A2C и DDPG. Можно использовать эти политики для реализации контроллеров и алгоритмы принятия решений в сложных системах, таких как роботы и автономные системы. Представлять политики можно с помощью глубоких нейронных сетей, полиномов или интерполяционных таблиц.

Тулбокс позволяет вам обучить политики, позволяя им взаимодействовать со средами, представленными моделями Simulink® или MATLAB®. Можно оценить алгоритмы, эксперимент с установками гиперпараметров, и контролировать процесс обучения. Чтобы улучшить производительность обучения, можно запустить параллельные симуляции в облаке, компьютерных кластерах и графических процессорах (с Parallel Computing Toolbox™ и MATLAB Parallel Server™).

Через формат модели ONNX™ существующие политики могут быть импортированы из сред глубокого обучения, таких как TensorFlow™ Keras и PyTorch (с Deep Learning Toolbox™). Можно сгенерировать оптимизированный C, C++ и код CUDA, чтобы развернуть обученные политики на микроконтроллерах и графических процессорах.

Тулбокс включает справочные примеры по использованию обучения с подкреплением для разработки контроллеров в робототехнике и беспилотных аппаратах.

Запуск

Изучите основы Reinforcement Learning Toolbox

Окружения MATLAB

Моделируйте динамику окружения обучения с подкреплением, используя MATLAB

Окружения Simulink

Моделируйте динамику окружения обучения с подкреплением с помощью моделей Simulink

Агенты

Создайте и сконфигурируйте агентов обучения с подкреплением с помощью общих алгоритмов, таких как SARSA, DQN, DDPG и A2C

Политики и функции ценности

Задайте представления политики и функции значения в виде глубоких нейронных сетей и Q-таблиц

Обучение и валидация

Обучите и симулируйте агентов обучения с подкреплением

Развертывание политики

Генерация кода и развертывание обученных политик