Начало работы с инструментом обучения «Усиление»

Разработка и обучение политик с использованием обучения укреплению

Toolbox™ обучения усилению предоставляет приложение, функции и блок Simulink ® для обучения с использованием алгоритмов обучения усилению, включая DQN, PPO, SAC и DDPG. Эти политики можно использовать для реализации контроллеров и алгоритмов принятия решений для сложных приложений, таких как распределение ресурсов, робототехника и автономные системы.

Панель инструментов позволяет представлять политики и функции значений с помощью глубоких нейронных сетей или таблиц поиска и обучать их взаимодействию с средами, моделируемыми в MATLAB ® или Simulink. Можно оценить алгоритмы обучения одно- или многоагентному усилению, представленные на панели инструментов, или разработать собственные. Вы можете экспериментировать с параметрами гиперпараметров, контролировать ход обучения и моделировать обученных агентов в интерактивном режиме через приложение или программно. Для повышения производительности обучения моделирование может выполняться параллельно на нескольких процессорах, графических процессорах, компьютерных кластерах и облаке (с помощью Parallel Computing Toolbox™ и MATLAB Parallel Server™).

С помощью формата модели ONNX™ существующие политики можно импортировать из структур глубокого обучения, таких как TensorFlow™ Keras и PyTorch (с помощью Deep Learning Toolbox™). Можно создать оптимизированный код C, C++ и CUDA ® для развертывания обученных политик на микроконтроллерах и графических процессорах. Панель инструментов содержит примеры ссылок, которые помогут начать работу.

Обучающие программы

Обучающий агент по повышению квалификации в базовом сетевом мире

Обучение агентов Q-learning и SARSA для решения грид-мира в MATLAB.
Обучающий агент по усилению обучения в среде MDP

Подготовка обучающего агента по усилению в общей среде процесса принятия решений Маркова.
Создание среды Simulink и агента подготовки

Обучение контроллера с использованием обучения по армированию с помощью установки, смоделированной в Simulink в качестве учебной среды.
Проектирование и обучение агента с помощью конструктора по обучению усилению

Разработка и обучение агента DQN для системы тележек с помощью приложения «Дизайнер обучения армированию».

Сведения об обучении усилению

Что такое обучение укреплению?

Обучение усилению - это целевой вычислительный подход, при котором компьютер учится выполнять задачу, взаимодействуя с неопределенной динамической средой.
Обучение усилению для приложений систем управления

Можно обучить обучающего агента по усилению для управления неизвестным заводом.

Интерактивное обучение

Обучение усилению Onramp
Это бесплатное четырехчасовое учебное пособие содержит интерактивное введение в обучение усилению.

Документация по инструментам обучения для усиления

Поддержка

Памятка переводчика

1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.

2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.

3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.

4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.

5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.