Алгоритмы обучения с подкреплением на Python
Лонца Андреа
2020
В первой части рассматриваются различные элементы ОП, сфера его применения, инструменты, необходимые для работы в среде ОП. Вторая и третья части посвящены непосредственно алгоритмам.
В числе прочего автор показывает, как сочетать Q-обучение с нейронными сетями для решения сложных задач, описывает методы градиента стратегии, TRPO и PPO, позволяющие повысить производительность и устойчивость.
Язык: Русский 🇷🇺
💾 Скачать PDF
🛒 Купить печатную версию
#книга #Java #rus
>>Click here to continue<<
