Обучение с подкреплением Используя глубокие нейронные сети

Обучите агентов глубокой нейронной сети путем взаимодействия с неизвестной динамической средой

Обучение с подкреплением является направленным на достижение цели вычислительным подходом, где агент учится выполнять задачу путем взаимодействия с неизвестной динамической средой. Во время обучения алгоритм обучения обновляет параметры политики агента. Цель алгоритма обучения состоит в том, чтобы найти оптимальную политику, которая максимизирует долгосрочное вознаграждение, полученное во время задачи.

В зависимости от типа агента политика представлена одним или несколькими представления функции ценности и политика. Можно реализовать эти представления с помощью глубоких нейронных сетей. Можно затем обучить эти сети с помощью пакета Reinforcement Learning Toolbox™.

Для получения дополнительной информации смотрите, что Обучение с подкреплением Использует Глубокие нейронные сети.

Темы

Обучение с подкреплением Используя глубокие нейронные сети

Обучение с подкреплением является направленным на достижение цели вычислительным подходом, где компьютер учится выполнять задачу путем взаимодействия с неизвестной динамической средой.

Создайте среду Simulink и Обучите Агента

Обучите диспетчера, использующего обучение с подкреплением с объектом, смоделированным в Simulink^® как учебная среда.

Создайте агента Используя Deep Network Designer и обучайтесь Используя наблюдения изображений

Создайте агента обучения с подкреплением с помощью приложения Deep Network Designer от Deep Learning Toolbox™.

Обучите агента DDPG к Swing и маятнику баланса с наблюдением изображений

Обучите агента обучения с подкреплением с помощью основанного на изображении сигнала наблюдения.

Обучайтесь агент DQN для хранения маршрута помогают Используя параллельные вычисления

Обучайтесь агент обучения с подкреплением для хранения маршрута помогают приложению.

Подражайте контроллер MPC для хранения маршрута помогают

Обучите глубокую нейронную сеть подражать поведению прогнозирующего контроллера модели.

Рекомендуемые примеры

Train DDPG Agent to Control Flying Robot

Обучите агента DDPG управлять летающим роботом

Обучите агента обучения с подкреплением управлять летающей моделью робота.

Скрипт Open Live Script

Train Biped Robot to Walk Using Reinforcement Learning Agents

Обучите двуногого робота идти Используя агентов обучения с подкреплением

Обучите агента обучения с подкреплением управлять двуногим, обойдя робота, смоделированного в Simscape™ Multibody™.

Скрипт Open Live Script

Train DDPG Agent for Adaptive Cruise Control

Обучите агента DDPG адаптивному круиз-контролю

Обучите агента обучения с подкреплением адаптивному приложению круиз-контроля.

Скрипт Open Live Script

Train DDPG Agent for Path-Following Control

Обучите агента DDPG управлению следования траектории

Обучите агента обучения с подкреплением маршруту после приложения.

Скрипт Open Live Script

Обучите гуманоида Уокера

Обучите гуманоидного робота обходить использование или генетический алгоритм или обучение с подкреплением.

Скрипт Open Live Script

Train PPO Agent for Automatic Parking Valet

Обучите агента PPO автоматическому камердинеру парковки

Обучите агента обучения с подкреплением парковать автомобиль на открытом парковочном месте.

Скрипт Open Live Script

Документация

Обучение с подкреплением Используя глубокие нейронные сети

Темы

Рекомендуемые примеры

Обучите агента DDPG управлять летающим роботом

Обучите двуногого робота идти Используя агентов обучения с подкреплением

Обучите агента DDPG адаптивному круиз-контролю

Обучите агента DDPG управлению следования траектории

Обучите гуманоида Уокера

Обучите агента PPO автоматическому камердинеру парковки

Документация Deep Learning Toolbox

Поддержка