Обучение с подкреплением Используя глубокое обучение

Обучите агентов глубокой нейронной сети с помощью обучения с подкреплением

Можно создать политику и представления функции ценности для приложений обучения с подкреплением с помощью глубоких нейронных сетей. Можно затем обучить эти сети с помощью пакета Reinforcement Learning Toolbox™. Для получения дополнительной информации смотрите то, Что Обучение с подкреплением? (Reinforcement Learning Toolbox), Создайте политику и Представления Функции ценности (Reinforcement Learning Toolbox), и Обучите Агентов Обучения с подкреплением (Reinforcement Learning Toolbox).

Темы

Создайте среду Simulink и Обучите Агента

Обучите диспетчера, использующего обучение с подкреплением с объектом, смоделированным в Simulink® как учебная среда.

Создайте агента Используя Deep Network Designer и обучайтесь Используя наблюдения изображений

Создайте агента обучения с подкреплением с помощью приложения Deep Network Designer от Deep Learning Toolbox™.

Обучите агента DDPG к Swing и маятнику баланса с наблюдением изображений

Обучите агента обучения с подкреплением с помощью основанного на изображении сигнала наблюдения.

Обучайтесь агент DQN для хранения маршрута помогают Используя параллельные вычисления

Обучайтесь агент обучения с подкреплением для хранения маршрута помогают приложению.

Рекомендуемые примеры