用 TF-AGENTS 进行强化学习

强化学习作为机器学习的一个重要的领域,在机器学习的发展史上具有举足轻重的地位。近年来,工程师与科学家将强化学习模型应用在了在游戏、自动驾驶、机器人以及优化领域等领域并取得了非常卓越的成果。强化学习是一种利用环境反馈的学习机制(类似于人类在错误中总结,在失败中成长),类似的机制还有诸如博弈论,控制论,遗传算法等。

日前,Google 发布了基于 TensorFlow 的强化学习框架: TF-AGENTS,作为一款优秀的强化学习框架 TF-AGENTS 可以让强化学习的工程师和科学家在设计、实现以及测试新的强化学习算法时更加的方便与快捷。同时,由于对代码结构的精心设计,在实际使用它时也有利于[……]

继续阅读

最火 NLP 项目发布 1,008 种机器翻译模型,涵盖 140 种语言组合

现在,你可以用 GitHub 上最火的 NLP 项目做机器翻译了。

没错,就是 Hugging Face (抱抱脸)标星 26.9 k 的 Transformer 项目。在最新更新的版本里,抱抱脸发布了 1,008 种模型,正式涉足机器翻译领域。模型涵盖 140 种不同语言组合,中文翻英文,英文译法语,法语翻阿拉伯语 …… 还能一对多翻译。据抱抱脸介绍,这1000+模型,是研究人员使用无监督学习和 OPUS 数据集训练的。OPUS 项目来自赫尔辛基大学及其全球合作伙伴,旨在收集和开源各种语言数据集,尤其是低资源(小语种)语言数据集。

GitHub地址项目 GitHub 地址[……]

继续阅读

新一代『工业 AI』王冠

当前,以智能化为核心的产业变革正在兴起,人工智能技术与社会各领域的融合不断加剧,并成为助推工业智能化转型升级的关键燃料。

今年 4 月,工业互联网产业联盟(AII)发布的《工业智能白皮书》显示,截止到 2019 年底,在全球 20 多个经济体近三年发布的 100 份人工智能方面的战略规划或政策文件中,涉及与工业结合的超过一半以上。美、日、德、欧盟分别发布《国家人工智能研究和发展战略规划》,《新机器人战略》,《国家工业战略 2030》,《欧盟人工智能》等一系列政策战略,重点提及产品全生命周期优化、先进机器人、自动驾驶、大数据挖掘等在工业领域的应用。随着人们对于工业 AI 的研究不断深入,逐[……]

继续阅读

Jupyter 可视化 Debug 工具

Jupyter 也能做可视化 Debug 了,Jupyter 团队发布第一个 Debug 插件与内核。虽然这只是第一版,但目前已经可以设置常见的断点 Debug,查看各种变量、执行模块等信息。

Python 代码编辑器怎么选?PyCharm、VS Code、Jupyter Notebook 都各有特色,Jupyter 适合做数据分析这些需要可视化的操作,PyCharm 更适合做完整的 Python 项目。然而,因为交互式操作,很少会有开发者想到用 Jupyter 做 Debug。

尽管很多读者可能认为 Jupyter 用来做展示和小型试验就足够了,Debug 并没有太大的需[……]

继续阅读

工业数据采集产业研究报告

国务院《关于深化“互联网+先进制造业”发展工业互联网的指导意见》明确将构建网络、平台、安全三大功能体系作为其重点任务,并指出要“强化复杂生产过程中设备联网与数据采集能力,实现企业各层级数据资源的端到端集成”。其中工业互联网平台是工业互联网体系架构的核心,而工业数据采集则是工业互联网平台的基础。在工业和信息化部信息化和软件服务业司的指导下,工业互联网产业联盟组织编写了《工业数据采集产业研究报告》,希望加强研究与交流,与业界共同推动工业数据采集的发展。

原文链接[……]

继续阅读

位置识别 Street-level Sequences 数据集

位于瑞典的 Mapillary 宣布发布了一款新产品 MapillaryStreet-Level Sequences 数据集,这是一款公开可用的数据集,可以对 AI 模型进行基准测试和训练,以实现大规模、终身的位置识别。终身位置识别是在地理定位图像数据库中查找查询图像的最相似位置的任务。

本周发布的 Mapillary Street-LevelSequence 数据集是一个 160 万个地理图像序列的集合,这些序列与元数据绑定在一起,用于训练地点识别算法。Street-LevelSequence 数据集既有商业版本,也有研究版本,介绍了用于终身位置识别的 MapillaryStreet-[……]

继续阅读

助力 5G / 6G,深度学习创建『认知无线电』

几十年来,业余双向无线电运营者们为了能够跨大陆通信,会在一天中的正确时间来选择正确的无线电频率。之所以能够奢侈地做到这点,是因为用户和共享无线电波的设备相对较少。但是随着蜂窝无线电在电话和物联网设备中的普及,寻找无干扰的频率变得越来越困难。

因此,研究人员计划使用深度学习来创建认知无线电,通过立即调整其无线电频率,来获得最佳性能。

美国的东北大学无线物联网研究所的研究人员解释说(具体参见:相关论文),蜂窝物联网设备的种类和密度的不断增加给无线网络优化带来了新的挑战。

一个给定的无线电频率范围,可以由一百个设计用于在同一总体区域中工作的小型无线电设备共享,每个小型无线电设备具有[……]

继续阅读

《可解释机器学习》中文版重磅开源

最近,一位来自复旦大学的研究生朱明超,将一本少有的书《Interpretable Machine Learning》(可解释机器学习)翻译成了中文。这本书最初是由德国慕尼黑大学博士 Christoph Molnar 耗时两年完成的,长达 250 页,是仅有的一本系统介绍可解释性机器学习的书籍。包括 Google 在内,也在不断探索打开神经网络『黑盒子』的正确方式。

可解释人工智能』(XAI)是这本书的核心论题。作者认为,可解释性在机器学习甚至日常生活中都是相当重要的一个问题。建议机器学习从业者、数据科学家、统计学家和任何对使机器学习模型可解释的人阅读本书。《可解释的机器学习》该书总共包[……]

继续阅读

全面比较机器学习算法的八大维度

人类发明的机器学习ML)算法简直数不胜数。当然,大多数时候只有一小部分被用于研究和工业。然而,对于个人来说,理解并记住所有这些 ML 模型的细节仍然有点困难。有些人可能会有一个错误的印象,认为所有这些算法都是完全不相关的。更重要的是,当两种算法似乎都有效时,如何选择使用算法 A,还是 B?这篇文章的目的是为读者提供一个不同的角度来看待 ML 算法。有了这些角度,算法可以在同样的维度上进行比较,并且可以很容易地进行分析。本文在撰写时考虑了两个主要的 ML 任务 —— 回归和分类。

时间复杂度

在 RAM 模型 下,算法所花费的时间是由算法的基本运算来度量的。虽然用户和开发人员可能更关心算法[……]

继续阅读

知识图谱实体摘要:算法、评价和应用 PPT 下载

知识图谱实体汇总教程@WWW 2020,直接点击文末下载。

知识图谱封装了实体和关系。知识图谱的简洁表示格式和图的特性使得许多新的 Web 应用程序得以创建,并增强了现有的应用性能。然而,在一个知识图谱中,描述一个实体的几十个或几百个事实可能会超出一个典型用户界面的能力,并使用户超载过多的信息。这激发了对实体摘要的富有成果的研究——为实体自动生成紧凑的摘要,以高效和有效地满足用户的信息需求。例如,在其搜索结果页面右侧,谷歌通过选择和显示用户可能正在搜索的特定实体的一些事实,为其知识图中的实体提供“最佳摘要”。

近年来,研究人员通过提出从纯粹的排序和挖掘技术到机器和深度学习技术等各种[……]

继续阅读