动手学深度强化学习

作者:子鱼

你现在正在阅读的是本教程的0.1alpha版本,可能过于简明,未来的更新将会逐步添加内容并提升友好度,如果可能的话还会加入最新的研究进展。以CC BY-NC-SA 4.0协议共享。

本教程基于Pytorch实现,所有代码在Python 3.8.5 + Pytorch 1.8.1+cu111环境下运行通过。我们假设读者熟悉深度学习,Pytorch,并对于基本的强化学习思想有“名词党”式的了解。没有看过Barto和Sutton的经典《强化学习》砖头书的同学也不要害怕,本教程不会太注重数学细节,而注重算法的想法和程序实现。

欢迎对本译文提出宝贵意见,可邮件至subfishzhou@gmail.com