线性代数与张量开放课程

数学是机器学习的基础。斯坦福大学教授 Stephen Boyd 联合加州大学洛杉矶分校的 Lieven Vandenberghe 教授出版了一本基础数学书籍《Introduction to Applied Linear Algebra》,从向量到最小二乘法,分三部分进行讲解并配以辅助资料。此外,这本书也是斯坦福 EE103 课程、UCLA EE133A 课程的教材,由剑桥大学出版社出版(允许网络公开)。

该书还可用于自学,并辅以在线提供的资料,例如下面这份 470 页的 PPT.[……]

继续阅读

Tencent AI Lab 开源大规模 NLP 数据集

10 月19 日,Tencent AI Lab 宣布开源大规模、高质量的中文词向量数据。该数据集包含 800 多万中文词汇。Tencent AI Lab 表示,相比现有的公开数据,该数据在覆盖率、新鲜度及准确性上大幅提高,为对话回复质量预测和医疗实体识别等自然语言处理方向的业务应用带来显著的效能提升。

Tencent AI Lab 此次公开的中文词向量数据包含 800 多万中文词汇,其中每个词对应一个 200 维的向量。相比现有的中文词向量数据,Tencent AI Lab 的中文词向量着重提升了以下 3 个方面:

  • 覆盖率(Coverage):该词向量数据包含很多现有公开的词向[……]

    继续阅读

吴恩达《机器学习训练秘籍》完整中文版

人工智能,机器学习和深度学习正在改变众多行业。Andrew Ng 教授近期在写一本书,教你如何构建机器学习项目。近日,Andrew Ng 教授(吴恩达)正式发布了《Machine Learning Yearning》的完整中文版。本书的重点不在于教授传统的机器学习算法,而在于教你如何使机器学习算法发挥作用。一些 AI 的技术课程会给你一个工具,而这本书将教会你如何使用这些工具。如果你渴望成为 AI 的技术领导者,并想要学习如何为团队设定一个方向,本书将有所帮助。

GitHub地址项目 GitHub 地址[……]

继续阅读

人工智能、机器学习和认知计算

近日,IBM 发布了《人工智能、机器学习和认知计算入门指南

几千年来,人们就已经有了思考如何构建智能机器的想法。从那时开始,人工智能 (AI) 经历了起起落落,这证明了它的成功以及还未实现的潜能。如今,随时都能听到应用机器学习算法来解决新问题的新闻。从癌症检测和预测到图像理解和总结以及自然语言处理,AI 正在增强人们的能力和改变我们的世界。

现代 AI 的历史包含一部伟大的戏剧应具有的所有要素。上世纪 50 年代,随着对思维机器及阿兰·图灵和约翰·冯·诺依曼等著名人物的关注,AI 开始崭露头角。尽管随后经历了数十年的繁荣与萧条,并被寄予了难以实现的厚望,但 AI 和它的先驱们仍然[……]

继续阅读

DeepMind 开源图网络库

今年 6 月份,Deepmind 发表了一篇论文,将图与深度神经网络相结合,由此提出了一种新型图网络。由于图网络主要采用神经网络的方式对图进行操作,因此它又可以称为图神经网络。机器之心做了详细解读

图网络即可以在社交网络或其它基于图形数据上运行的一般深度学习架构,它是一种基于图结构的广义神经网络。图网络一般是将底层图形作为计算图,并通过在整张图上传递、转换和聚合节点特征信息,从而学习神经网络基元以生成单节点嵌入向量。生成的节点嵌入向量可作为任何可微预测层的输入,并用于节点分类或预测节点之间的连接,完整的模型可以通过端到端的方式训练。

目前图网络在监督学习、半监督学习和无监督学习等[……]

继续阅读

脑科学与类脑机器学习

近日 CCAI 2018 大会上,中科院神经科学所所长,中国科学院院士,美国国家科学院院士蒲慕明作题为《脑科学与类脑机器学习》的主题演讲。以下为演讲小结:

可借鉴的自然神经网络特性

1. 神经元的种类

兴奋性和抑制性神经元活动的平衡是正常网络功能所必要的。

  • 突触延迟(synaptic delay)在神经环路中起关键作用。
  • 抑制性中间神经元通常出现在兴奋性输入之后,可防止神经元过度兴奋,可消除脉冲序列(spiketrain)的尾巴以提高信息的时间精确度(temporal precision),可通过抑制旁侧的神经元的兴奋性以增加对比信息的空间精确度(spatialpre[……]

    继续阅读

DeepMind 开源强化学习库:松露

近日,DeepMind 开源了一个基于 TensorFlow 的强化学习库,名字叫 TRFL(译名:松露)。思路是模块化,强调灵活度:如果把造智能体想象成搭积木,许多关键的、常用的木块都在这里集合了:比如,DQN (深度 Q 网络) 、DDPG (深度确定策略梯度),以及 IMPALA (重要性加权演员学习者架构) ,都是 DeepMind 功勋卓著的组件。库里面的组件,虽然来源各不相同,但都经过严密测试,因而相对可靠;并且只要一个API,对开发者比较友好。即便是 DeepMind 团队自身做研究,也严重依赖这个库。

深度强化学习 (DRL) ,依赖价值网络或策略网络的不断更新。Deep[……]

继续阅读

AutoML 新书发布,告别调参?

近期,由 Frank Hutter, Lars Kotthoff, Joaquin Vanschoren 撰写的《AutoML:方法,系统,挑战》『AUTOML: METHODS, SYSTEMS, CHALLENGES (NEW BOOK)』,221页的草稿版本已经放出,详细讲解了所有 AutoML 系统背后的基础知识,以及对当前 AutoML 系统进行了深入描述,Auto-WEKA、Hyperopt-Sklearn、Auto-sklearn 等,最后介绍了 AutoML 的挑战。作者当前正在完成这本新书的编辑工作,它将由 NIPS 2018 出版发行。

如果你用过机器学习算法,那一定[……]

继续阅读

数据素养:新一代人工智能时代的重要技能

近日,Tableau 博客上发表了《Data literacy : A critical  skill for the 21st century》文章,表示数据素养已成为 21 世纪至关重要的技能,在新一轮由数据,算法,计算力推动的深度学习与新一代人工智能时代,数据素养的重要性尤为突出。以下为原文摘录:

在我们熟练掌握复杂的字母和文字之前,我们中的很多人就已经学会了计算,阅读和书写数字。我们身边每天都充斥着大量的事实和数据,但我们对这些数字背后的含义有多深的了解?

从数据中获取有意义的信息的能力,称为数据素养。

Gartner 预计到 2020 年,80% 的组织将开始推行内部数据素[……]

继续阅读

数据科学开发新标准:Jupyter Notebook

IPython 是一个 Python 库,最初旨在改进 Python 提供的默认交互式控制台并使其对科学家友好。 在2011年,IPython 首次发布10年后,IPython Notebook 被引入。 这个基于 Web 的 IPython 接口把代码,文本,数学表达式,内联图,交互式图形,小部件,图形界面以及其他丰富的媒体集成到一个独立的可共享的 Web 文档中。 该平台为交互式科学计算和数据分析,乃至当前火热的深度学习与新一代人工智能提供了理想的门户。 改名为 Jupyter Notebook 的 IPython 已经成为研究人员,工程师,数据科学家,教师和学生不可或缺的一部分。[……]

继续阅读