Обучение с подкреплением Используя глубокое обучение

Обучите агентов глубокой нейронной сети с помощью обучения с подкреплением

Можно создать политику и представления функции ценности для приложений обучения с подкреплением с помощью глубоких нейронных сетей. Можно затем обучить эти сети с помощью пакета Reinforcement Learning Toolbox™. Для получения дополнительной информации смотрите то, Что Обучение с подкреплением? (Reinforcement Learning Toolbox), Создайте политику и Представления Функции ценности (Reinforcement Learning Toolbox), и Обучите Агентов Обучения с подкреплением (Reinforcement Learning Toolbox).

Темы

Создайте среду Simulink и Обучите Агента

Обучите диспетчера, использующего обучение с подкреплением с объектом, смоделированным в Simulink^® как учебная среда.

Создайте агента Используя Deep Network Designer и обучайтесь Используя наблюдения изображений

Создайте агента обучения с подкреплением с помощью приложения Deep Network Designer от Deep Learning Toolbox™.

Обучите агента DDPG к Swing и маятнику баланса с наблюдением изображений

Обучите агента обучения с подкреплением с помощью основанного на изображении сигнала наблюдения.

Обучайтесь агент DQN для хранения маршрута помогают Используя параллельные вычисления

Обучайтесь агент обучения с подкреплением для хранения маршрута помогают приложению.

Рекомендуемые примеры

Train DDPG Agent to Control Flying Robot

Обучите агента DDPG управлять летающим роботом

Обучите агента обучения с подкреплением управлять летающей моделью робота.

Скрипт Open Live Script

Train Biped Robot to Walk Using Reinforcement Learning Agents

Обучите двуногого робота идти Используя агентов обучения с подкреплением

Обучите агента обучения с подкреплением управлять двуногим, обойдя робота, смоделированного в Simscape™ Multibody™.

Скрипт Open Live Script

Train DDPG Agent for Adaptive Cruise Control

Обучите агента DDPG адаптивному круиз-контролю

Обучите агента обучения с подкреплением адаптивному приложению круиз-контроля.

Скрипт Open Live Script

Train DDPG Agent for Path-Following Control

Обучите агента DDPG управлению следования траектории

Обучите агента обучения с подкреплением маршруту после приложения.

Скрипт Open Live Script

Документация Deep Learning Toolbox

Поддержка

Памятка переводчика

1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.

2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.

3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.

4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.

5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.