Обучение с подкреплением с использованием глубоких нейронных сетей

Обучите агентов глубоких нейронных сетей путем взаимодействия с неизвестным динамическим окружением

Обучение с подкреплением является направленным на достижение цели вычислительным подходом, где агент учится выполнять задачу путем взаимодействия с неизвестным динамическим окружением. Во время обучения алгоритм обучения обновляет параметры политики агента. Цель алгоритма обучения состоит в том, чтобы найти оптимальную политику, которая максимизирует долгосрочное вознаграждение, полученное во время задачи.

В зависимости от типа агента политика представлена одной или несколькими представлениями политики и функции ценности. Можно реализовать эти представления с помощью глубоких нейронных сетей. Затем можно обучить эти сети с помощью пакета Reinforcement Learning Toolbox™.

Для получения дополнительной информации см. «Обучение с подкреплением с использованием глубоких нейронных сетей».

Темы

Обучение с подкреплением с использованием глубоких нейронных сетей

Обучение с подкреплением является направленным на достижение цели вычислительным подходом, в котором компьютер учится выполнять задачу путем взаимодействия с неизвестным динамическим окружением.

Создайте окружение Simulink и Обучите Агента

Обучите контроллер, используя обучение с подкреплением для объекта, смоделированного в Simulink^® как окружение обучения.

Создайте агента с помощью Deep Network Designer и обучите с использованием наблюдений изображений

Создайте агента обучения с подкреплением с помощью приложения Deep Network Designer из Deep Learning Toolbox™.

Обучите агента DDPG качаться вверх и балансировать маятник с наблюдением изображений

Обучите агента обучения с подкреплением, используя основанный на изображении сигнал наблюдения.

Обучите агента DQN для поддержки маршрута с помощью параллельных вычислений

Обучите агента обучения с подкреплением для вспомогательного приложения по хранению маршрутов.

Имитируйте контроллер MPC для помощи в поддержании маршрута

Обучите глубокую нейронную сеть, чтобы имитировать поведение прогнозирующего контроллера модели.

Рекомендуемые примеры

Train DDPG Agent to Control Flying Robot

Обучите агента DDPG управлять летающим роботом

Обучите агента обучения с подкреплением управлять моделью летающего робота.

Открыть Live Script

Train Biped Robot to Walk Using Reinforcement Learning Agents

Обучите двойного робота ходить, используя агентов обучения с подкреплением

Обучите агента обучения с подкреплением управлять двухскатным ходячим роботом, смоделированным в Simscape™ Multibody™.

Открыть Live Script

Train DDPG Agent for Adaptive Cruise Control

Обучите агента DDPG для адаптивного круиз-контроля

Обучите агента обучения с подкреплением для адаптивного приложения круиз-контроля.

Открыть Live Script

Train DDPG Agent for Path-Following Control

Обучите агента DDPG для управления следующими путями

Обучите агента обучения с подкреплением для маршрута, следующего за приложением.

Открыть Live Script

Обучите гуманоидного ходунка

Обучите гуманоидный робота ходить с помощью генетического алгоритма или обучения с подкреплением.

Открыть Live Script

Train PPO Agent for Automatic Parking Valet

Обучите агента PPO для автоматической парковки

Обучите агента обучения с подкреплением парковать автомобиль на открытом парковочном пространстве.

Открыть Live Script

Документация

Обучение с подкреплением с использованием глубоких нейронных сетей

Темы

Рекомендуемые примеры

Обучите агента DDPG управлять летающим роботом

Обучите двойного робота ходить, используя агентов обучения с подкреплением

Обучите агента DDPG для адаптивного круиз-контроля

Обучите агента DDPG для управления следующими путями

Обучите гуманоидного ходунка

Обучите агента PPO для автоматической парковки

Документация по Deep Learning Toolbox

Поддержка