强化学习入门库

这是一个入门的深度强化学习库,是中科院深圳先进院的一位同学独立完成的,拥有全中文的文档:

  • 轻量:仅含3个Python文件,仅需安装 PyTorch 和 GYM
  • 稳定:尽可能减少超参数。绝不通过微调超参数得到虚高的性能
  • 高效:循环内的代码注重效率,动态规划地编写计算流程
  • 可读:我喜欢Python之父的Python之禅 import this,尽力保持代码优雅
  • 易用:尽力降低代码耦合度,方便复制某段

目前,单智能体-无模型-深度-强化学习算法部分已经完成(多智能体、离散空间代码业已完成,有时间将整理上传):

  • 离线策略,确定策略梯度:DDPG,TD3,InterAC。使用更稳定的训练流程
  • 离线策略,随机策略梯度:SAC,InterSAC。含 automatic temperature tuning
  • 在线策略,随机策略梯度:PPO,含 Generalized Advantage Estimator (GAE)
  • 离散动作:DQN (后续会加入DQN的其他变种)
  • A3C,A2C,TRPO 无论在何种条件下,都劣于以上算法,不加入

GitHub地址项目 GitHub 地址