强化学习入门库

这是一个入门的深度强化学习库,是中科院深圳先进院的一位同学独立完成的,拥有全中文的文档:

  • 轻量:仅含3个Python文件,仅需安装 PyTorch 和 GYM
  • 稳定:尽可能减少超参数。绝不通过微调超参数得到虚高的性能
  • 高效:循环内的代码注重效率,动态规划地编写计算流程
  • 可读:我喜欢Python之父的Python之禅 import this,尽力保持代码优雅
  • 易用:尽力降低代码耦合度,方便复制某段

目前,单智能体-无模型-深度-强化学习算法部分已经完成(多智能体、离散空间代码业已完成,有时间将整理上传):

  • 离线策略,确定策略梯度:DDPG,TD3[……]

    继续阅读

用 TF-AGENTS 进行强化学习

强化学习作为机器学习的一个重要的领域,在机器学习的发展史上具有举足轻重的地位。近年来,工程师与科学家将强化学习模型应用在了在游戏、自动驾驶、机器人以及优化领域等领域并取得了非常卓越的成果。强化学习是一种利用环境反馈的学习机制(类似于人类在错误中总结,在失败中成长),类似的机制还有诸如博弈论,控制论,遗传算法等。

日前,Google 发布了基于 TensorFlow 的强化学习框架: TF-AGENTS,作为一款优秀的强化学习框架 TF-AGENTS 可以让强化学习的工程师和科学家在设计、实现以及测试新的强化学习算法时更加的方便与快捷。同时,由于对代码结构的精心设计,在实际使用它时也有利于[……]

继续阅读

基于 OpenAI 的地下城文字游戏

AIDungeon2 是一个基于 Python 的机器学习的地下城文字游戏。AI Dungeon 基于 OpenAI 打造,采用了最先进的开放源码文本生成功能,辅以自选冒险类特性,向玩家呈现了一段段独特的文字。在 AI Dungeon 中,玩家可以进行各式行为,且无论你的举动多么奇怪都能得到回应。此项目介绍了如何使用机器学习构建一个游戏,代码简单清晰适合 AI 爱好者深入研究。对高校人工智能专业的项目实训,能起到很好的寓教于乐的效果。

GitHub地址项目 GitHub 地址[……]

继续阅读

2020 年人工智能开源生态圈

深度学习为核心的新一代人工智能技术发展到今天,已逐步形成一个庞大的生态结构,覆盖了:经典机器学习深度学习强化学习自然语言处理语音识别计算机视觉、分布式训练、自动建模、IDEs 系统、平台、评分推理系统等完整的细分领域 —— 正确合理的选择与开发内容相匹配的工具,常常会使科学研究工作事半功倍,同时,选择正确高效的工具也是技术应用类专业建设的重要环节。

跨象乘云™ 持续致力为高等院校打造深度学习与新一代人工智能科研教学一体化实验平台,在进一步将深度学习系统与容器化基础设施架构紧密集成的同时,对新一代人工智能开源生态系统提供全方位的支撑,加速高校科研效率及科研成果落地。详细项目列表[……]

继续阅读

OpenAI 采用 PyTorch 作为其深度学习框架标准

OpenAI 发布最新消息,正在 PyTorch标准化自家深度学习框架。与此同时,OpenAI 发布了一个 PyTorch 版本的开源教育资源,能够让人们更容易学习深度强化学习。不少人认为,OpneAI 的行为是正常选择的确,大量研究人员从 TensorFlow 转投 PyTorch 已成趋势。[……]

继续阅读

DeepMind 强化学习框架:覆盖28款游戏,24类算法

近日,DeepMind 开源了史上最全强化学习框架 OpenSpiel

在这个框架中,实现了 28 款可用于研究强化学习的棋牌类游戏和 24 个强化学习中常用的算法,DeepMind 的成名作 AlphaGo 的基础算法也在其列。

此外,还包括用于分析学习动态和其他常见评估指标的工具。更关键的是,OpenSpiel 适用人群也非常广泛。它的核心 API 和游戏用 C++ 实现,并提供了 Python API,可用于更高级别的机器学习,优化和强化学习。这些语言也可以很容易地组合在一起。而且,代码的一个子集也已经使用 Swift for Tensorflow 直接移植到了 Swift[……]

继续阅读

DeepMind 发布星际争霸强化学习课程

此前,跨象乘云介绍了:Pysc2 —— 基于 Python 的星际争霸 II 机器学习环境,这是 DeepMind 和暴雪合作开发星际争霸 II 到强化学习研究的一个丰富环境,为强化学习代理提供了与星际争霸 II 进行交互的界面,获得观察结果并发送动作。

很长时间以来,因为星际争霸这个游戏包含非常多的状态和动作空间,以及只有部分可观察和多玩家的特点,这个游戏一直被机器学习界认为是人工智能的下一个『大挑战』。

于是,一个由澳大利亚开发人员、机器学习工程师和研究人员组成的团队 —— StarAi 就基于星际争霸开发了一个机器学习课程!

课程特色

大多数强化学习课程都是采用高度数学化[……]

继续阅读

计算机视觉各研究方向汇总

所谓计算机视觉,即 compute vision ,就是通过用计算机来模拟人的视觉工作原理,来获取和完成一系列图像信息处理的机器。计算机视觉属于机器学习在视觉领域的应用,是一个多学科交叉的研究领域,涉及数学,物理,生物,计算机工程等多个学科,由此也可以想象到计算机视觉的研究范围非常广,也是图像,语音,自然语言处理领域中从业人数最多的。

1. 图像分类

1.1 基本概念

图像分类是计算机视觉中最基础的一个任务,也是几乎所有的基准模型进行比较的任务,从最开始比较简单的 10 分类的灰度图像手写数字识别 mnist ,到后来更大一点的 10 分类的 cifar10 和 100 分类的cifar[……]

继续阅读

OpenAI 重磅发布深度强化学习资源

在项目主页中,OpenAI 提供了非常完整的使用教程,包括 Spinning Up 的详细介绍、各种环境下的安装方法、收录的算法,以及实验实现的教程等。除此之外,OpenAI 也提供了丰厚的学习资料,包括:强化学习的入门基础、结合 Spinning Up 学习 RL 的课程、论文推荐、实验练习和基准结果参考等。给人的第一印象就是,要想在深度强化学习上从 Zero 到 Hero,天天逛这个网站就够了。[……]

继续阅读

DeepMind 开源强化学习库:松露

近日,DeepMind 开源了一个基于 TensorFlow 的强化学习库,名字叫 TRFL(译名:松露)。思路是模块化,强调灵活度:如果把造智能体想象成搭积木,许多关键的、常用的木块都在这里集合了:比如,DQN (深度 Q 网络) 、DDPG (深度确定策略梯度),以及 IMPALA (重要性加权演员学习者架构) ,都是 DeepMind 功勋卓著的组件。库里面的组件,虽然来源各不相同,但都经过严密测试,因而相对可靠;并且只要一个API,对开发者比较友好。即便是 DeepMind 团队自身做研究,也严重依赖这个库。

深度强化学习 (DRL) ,依赖价值网络或策略网络的不断更新。Deep[……]

继续阅读