Raven:全球首个真正分布式深度学习训练协议

对于深度学习研究者来说,计算能力非常关键,但 CPU 和 GPU 资源往往是有限的。Raven 协议正是解决这一问题的良方。Raven 协议可以利用空闲的计算资源来训练深度神经网络,而这些资源均来自个人用户设备的分享。分享空闲计算资源进行深度学习训练的概念可以为资源使用者节约大量的研究成本,而资源的贡献者则可以得到 Raven 币(RAV)作为补偿 / 回报。

在一个普通的、计算能力有限的计算机上训练一个 AI/ML 模型往往需要数周甚至数月的时间。对于更好的计算芯片(GPU)的需求是一个必须考虑的成本因素。密集和频繁地使用高速计算资源来操作计算数据、计算和更新深度神经网络中不同神经元的[……]

继续阅读

TensorFlow 推出模型优化工具包,可将模型压缩75%

近日,TensorFlow 推出了一款新的模型优化工具包。利用该该工具包中的技术可以将模型压缩 75%,最大可将速度提升到原来的 3 倍。新手和熟练的开发者都能利用这套工具包中的技术来优化待部署和执行的机器学习模型。预计该工具包中的技术将有助于优化所有 TensorFlow 模型以进行部署,但它对于那些为内存紧张、功率和存储受限的设备提供模型的 TensorFlow Lite 开发人员来说帮助最大。

添加的第一项支持技术是对 TensorFlow Lite 转换工具的训练后量化(post-training quantization)。对于相关的机器学习模型,利用该技术可以将模型压缩到原来[……]

继续阅读

信通院发布《人工智能安全白皮书(2018年)》

此前,中国信息通信研究院、中国人工智能产业发展联盟首次联合发布《人工智能发展白皮书 – 技术架构篇(2018年)》。

人工智能作为引领未来的战略性技术,日益成为驱动经济社会各领域从数字化、网络化向智能化加速跃升的重要引擎。近年来,数据量爆发式增长、计算能力显著性提升、深度学习算法突破性应用,极大地推动了人工智能发展。自动驾驶智能服务机器人、智能安防、智能投顾等人工智能新产品新业态层出不穷,深刻地改变着人类生产生活,并对人类文明发展和社会进步产生广泛而深远的影响。

然而,技术的进步往往是一把『双刃剑』,人工智能作为一种通用目的技术,为保障国家网络空间安全、提升人类经济社会风险防控能[……]

继续阅读

AMD ROCm GPU,TensorFlow Alternative Solution

Google 近日宣布:推出适用于 AMD ROCm GPU 的 TensorFlow v1.8,其中包括 Radeon Instinct MI25。对于 Google 正在进行的深度学习加速工作而言,这是一座重大的里程碑。ROCm 即 Radeon 开放生态系统 (Radeon Open Ecosystem),是在 Linux 上进行 GPU 计算的开源软件基础。AMD 的 TensorFlow 实现使用了 MIOpen,这是一个适用于深度学习的高度优化 GPU 例程库。AMD 提供了一个预构建的 whl 软件包,安装过程很简单,类似于安装 Linux 通用 TensorFlow。同时,已发[……]

继续阅读

TensorFlow 数据验证:能够大规模理解、验证和监控数据

日前,Google 推出了 TensorFlow 数据验证(TFDV),这是一个可以帮助您大规模地理解、验证和监控 ML 数据的开源库。 学术界和工业界都非常关注 ML 算法及其性能,一旦输入数据有误,所有这些为了优化而做的努力都将成为泡影。能够自动化和扩展数据分析,验证和监视任务就变得尤其重要。

TFDV 是 TFX Platform 平台的一部分,用于每天分析和验证若干 PB 的 Google 数据。 它在早期捕获数据错误方面具有良好的记录,因此有助于 TFX 客户维护其 ML 流程的健康状况。

在 TFDV 的基础上有一个功能强大的库,用于计算训练数据中的那些描述性统计数据。[……]

继续阅读

TensorFlow 基础实验指南

Google 在全球有很多 GDE (Google Developers Expert),他们都是 Google 认可的资深专家。GDE 一直致力于通过各种形式传播和推广新技术,并帮助开发者解决开发过程中遇到的问题。每一位 GDE 都对其所在的领域作出过特殊贡献。这篇精简的 TensorFlow 入门指导,作者李锡涵。基于 TensorFlow 的 Eager Execution(动态图)模式,力图让具备一定机器学习及 Python 基础的开发者们快速上手 TensorFlow。

 [……]

继续阅读

信通院发布 2018 年人工智能发展白皮书(技术架构篇)

中国信息通信研究院、中国人工智能产业发展联盟首次联合发布《人工智能发展白皮书 – 技术架构篇(2018年)》。本篇为:技术架构篇,从产业发展的角度,选择以深度学习算法驱动的人工智能技术为主线,分析作为人工智能发展『三驾马车』的

数据,计算力,算法

的技术现状、问题以及趋势,并对:

智能语音,自然语言处理,计算机视觉

等基础应用技术进行分析,并提出了目前存在的问题和技术的发展趋势。后续我院与中国人工智能产业发展联盟将继续发布人工智能应用、产业和政策方面研究成果。[……]

继续阅读

Facebook 推出大规模 OCR 系统:Rosetta

OCR(Optical Character Recognition),也称光学字符识别,是通过扫描等光学输入方式将各种票据、报刊、书籍、文稿及其它印刷品的文字转化为图像信息,再利用文字识别技术将图像信息转化为可以使用的计算机输入的一种技术。其实大家都在应用这项技术:快递单号的扫描识别、火车票的验证等等。最近,Facebook 研究人员提出了一个大规模图像文本提取和识别系统:Rosetta。这是一种有效的建模技术用于检测和识别图像中的文本。通过进行大量的评估实验,Facebook 解释了这种实用系统是如何用于构建 OCR 系统,以及如何在系统的开发期间部署特定的组分。KDD 2018 链接[……]

继续阅读

AI 科研神器!Google 数据集搜索引擎

在当今世界,数据成了诸多学科领域的科学家和数据记者的命脉。网络上有成千上万的数据存储库,提供了数百万个数据集,世界各地的地方和国家政府也会公布他们的数据。为了能够轻松访问这些数据,Google 启动了 Dataset Search 项目,让科学家、数据记者、数据爱好者或其他人能够快速找到他们想要的数据,或者仅仅为了满足他们的求知欲。

数据集搜索使用户能够查找网上数以千计的存储区中存储的数据集,从而让这些数据集可供大众使用,让人人受益。

数据集和相关数据往往分布在网上的多个数据存储区中。在大多数情况下,搜索引擎既无法提供这些数据库相关信息的链接,也不会将这些信息编入索引,这会[……]

继续阅读

成为数据科学家的 8 个步骤

为了引导您完成这个信息和建议的丛林,DataCamp 已经改进了『成为数据科学家的 8 个步骤』信息图:它现在提供了学习数据科学所需的八个步骤的最新视图。 根据背景和个人经验以及其他因素,这些八个步骤中的一些对于某些人来说将比对其他步骤更容易。然而,目标仍然是让每个对数据科学学习感兴趣的人或者已经成为数据科学家或数据科学团队成员的所有人的视觉指南,但是需要一些额外的资源来进一步完善。同时,中国人民大学的朝乐门教授做了中文版翻译。[……]

继续阅读