这是一个入门的深度强化学习库,是中科院深圳先进院的一位同学独立完成的,拥有全中文的文档:
- 轻量:仅含3个Python文件,仅需安装 PyTorch 和 GYM
- 稳定:尽可能减少超参数。绝不通过微调超参数得到虚高的性能
- 高效:循环内的代码注重效率,动态规划地编写计算流程
- 可读:我喜欢Python之父的Python之禅 import this,尽力保持代码优雅
- 易用:尽力降低代码耦合度,方便复制某段
目前,单智能体-无模型-深度-强化学习算法部分已经完成(多智能体、离散空间代码业已完成,有时间将整理上传):
- 离线策略,确定策略梯度:DDPG,TD3,InterAC。使用更稳定的训练流程
- 离线策略,随机策略梯度:SAC,InterSAC。含 automatic temperature tuning
- 在线策略,随机策略梯度:PPO,含 Generalized Advantage Estimator (GAE)
- 离散动作:DQN (后续会加入DQN的其他变种)
- A3C,A2C,TRPO 无论在何种条件下,都劣于以上算法,不加入