2020 年数据集资源更新

新增数据集

用 TF-AGENTS 进行强化学习

强化学习作为机器学习的一个重要的领域,在机器学习的发展史上具有举足轻重的地位。近年来,工程师与科学家将强化学习模型应用在了在游戏、自动驾驶、机器人以及优化领域等领域并取得了非常卓越的成果。强化学习是一种利用环境反馈的学习机制(类似于人类在错误中总结,在失败中成长),类似的机制还有诸如博弈论,控制论,遗传算法等。

日前,Google 发布了基于 TensorFlow 的强化学习框架: TF-AGENTS,作为一款优秀的强化学习框架 TF-AGENTS 可以让强化学习的工程师和科学家在设计、实现以及测试新的强化学习算法时更加的方便与快捷。同时,由于对代码结构的精心设计,在实际使用它时也有利于[……]

继续阅读

最火 NLP 项目发布 1,008 种机器翻译模型,涵盖 140 种语言组合

现在,你可以用 GitHub 上最火的 NLP 项目做机器翻译了。

没错,就是 Hugging Face (抱抱脸)标星 26.9 k 的 Transformer 项目。在最新更新的版本里,抱抱脸发布了 1,008 种模型,正式涉足机器翻译领域。模型涵盖 140 种不同语言组合,中文翻英文,英文译法语,法语翻阿拉伯语 …… 还能一对多翻译。据抱抱脸介绍,这1000+模型,是研究人员使用无监督学习和 OPUS 数据集训练的。OPUS 项目来自赫尔辛基大学及其全球合作伙伴,旨在收集和开源各种语言数据集,尤其是低资源(小语种)语言数据集。

GitHub地址项目 GitHub 地址[……]

继续阅读

新一代『工业 AI』王冠

当前,以智能化为核心的产业变革正在兴起,人工智能技术与社会各领域的融合不断加剧,并成为助推工业智能化转型升级的关键燃料。

今年 4 月,工业互联网产业联盟(AII)发布的《工业智能白皮书》显示,截止到 2019 年底,在全球 20 多个经济体近三年发布的 100 份人工智能方面的战略规划或政策文件中,涉及与工业结合的超过一半以上。美、日、德、欧盟分别发布《国家人工智能研究和发展战略规划》,《新机器人战略》,《国家工业战略 2030》,《欧盟人工智能》等一系列政策战略,重点提及产品全生命周期优化、先进机器人、自动驾驶、大数据挖掘等在工业领域的应用。随着人们对于工业 AI 的研究不断深入,逐[……]

继续阅读

Jupyter 可视化 Debug 工具

Jupyter 也能做可视化 Debug 了,Jupyter 团队发布第一个 Debug 插件与内核。虽然这只是第一版,但目前已经可以设置常见的断点 Debug,查看各种变量、执行模块等信息。

Python 代码编辑器怎么选?PyCharm、VS Code、Jupyter Notebook 都各有特色,Jupyter 适合做数据分析这些需要可视化的操作,PyCharm 更适合做完整的 Python 项目。然而,因为交互式操作,很少会有开发者想到用 Jupyter 做 Debug。

尽管很多读者可能认为 Jupyter 用来做展示和小型试验就足够了,Debug 并没有太大的需[……]

继续阅读

工业数据采集产业研究报告

国务院《关于深化“互联网+先进制造业”发展工业互联网的指导意见》明确将构建网络、平台、安全三大功能体系作为其重点任务,并指出要“强化复杂生产过程中设备联网与数据采集能力,实现企业各层级数据资源的端到端集成”。其中工业互联网平台是工业互联网体系架构的核心,而工业数据采集则是工业互联网平台的基础。在工业和信息化部信息化和软件服务业司的指导下,工业互联网产业联盟组织编写了《工业数据采集产业研究报告》,希望加强研究与交流,与业界共同推动工业数据采集的发展。

原文链接[……]

继续阅读

位置识别 Street-level Sequences 数据集

位于瑞典的 Mapillary 宣布发布了一款新产品 MapillaryStreet-Level Sequences 数据集,这是一款公开可用的数据集,可以对 AI 模型进行基准测试和训练,以实现大规模、终身的位置识别。终身位置识别是在地理定位图像数据库中查找查询图像的最相似位置的任务。

本周发布的 Mapillary Street-LevelSequence 数据集是一个 160 万个地理图像序列的集合,这些序列与元数据绑定在一起,用于训练地点识别算法。Street-LevelSequence 数据集既有商业版本,也有研究版本,介绍了用于终身位置识别的 MapillaryStreet-[……]

继续阅读

助力 5G / 6G,深度学习创建『认知无线电』

几十年来,业余双向无线电运营者们为了能够跨大陆通信,会在一天中的正确时间来选择正确的无线电频率。之所以能够奢侈地做到这点,是因为用户和共享无线电波的设备相对较少。但是随着蜂窝无线电在电话和物联网设备中的普及,寻找无干扰的频率变得越来越困难。

因此,研究人员计划使用深度学习来创建认知无线电,通过立即调整其无线电频率,来获得最佳性能。

美国的东北大学无线物联网研究所的研究人员解释说(具体参见:相关论文),蜂窝物联网设备的种类和密度的不断增加给无线网络优化带来了新的挑战。

一个给定的无线电频率范围,可以由一百个设计用于在同一总体区域中工作的小型无线电设备共享,每个小型无线电设备具有[……]

继续阅读

Google AI 新闻开放课程

人工智能正在新闻编辑室里发挥着越来越重要的作用,但是不同新闻人对技术的了解却是良莠不齐。近日,Google 宣布与两大新闻组织:JournalismAI 与 VRT 新闻联合 Google 新闻计划合作制作了一门免费的 AI 新闻培训课程,并且正式发布了。

对于全球的新闻工作者和新闻机构来说,这是一个艰难的时刻,因为他们试图评估 COVID-19 对行业业务和编辑方面的影响。借助 JournalismAI,Google 表示,希望通过这些新技术发挥作用,帮助最小化成本并增加行业机会。[……]

继续阅读