机器学习的数学基础(PDF书籍)

近期,由 Marc Peter Deisenroth,A Aldo Faisal 和 Cheng Soon Ong 撰写的《机器学习数学基础》(Mathematics for Machine Learning)381 页草稿版本已经放出,作者表示撰写这本书旨在激励人们学习数学概念。这本书并不打算涵盖前沿的机器学习技术,因为已经有很多书这样做了。相反,作者的目标是通过该书提供阅读其他书籍所需的数学基础。这本书分为两部分:数学基础知识和使用数学基础知识进行机器学习算法示例。值得初学者收藏和学习![……]

继续阅读

机器学习的数学基础

本文转载自:『SIGAI 图灵人工智能』微信公众号 ——

数学是机器学习的内功。作为机器学习的基石,数学知识无论如何是绕不开的,机器学习中大量的问题最终都可以归结为求解最优化问题,微积分、线性代数是最优化方法和理论的基础,很多机器学习算法的建模涉及到概率论,由此可见学好数学知识多么必要。不少准备或刚刚迈入机器学习的同学,在面临数学基础的学习时,会遇到两个问题:

  • 不知道机器学习和深度学习到底要用到哪些数学知识
  • 无法真正理解这些数学知识,并用于机器学习的推导证明

事实上,要理解和掌握绝大部分机器学习算法和理论,尤其是对做工程应用的人而言,真正所需要的数学知识不过尔尔,主[……]

继续阅读

Python 交互式的学习资源

Project Python 是一本免费的交互式书籍,它通过使用图形、动画和游戏来教你用 Python编写代码。后面你还将学到解决经典计算机科学问题的方法,软件设计的原则,以及如何分析算法性能。即使基础薄弱你也不会感到吃力。交互书籍覆盖的内容包括:

  • 功能,抽象和风格
  • 变量和表达式
  • 循环和条件
  • 调试
  • 参数,返回值和范围
  • 动画; 鼠标和键盘输入
  • 列表和 for 循环
  • 读写文本文件
  • 嵌套循环
  • 物理模拟
  • 类和对象
  • 递归
  • 排序
  • 分析算法
  • 分类算法分析
  • 堆栈,队列和词典
  • 链接列表
  • 图表

[……]

继续阅读

Text-to-SQL 数据集:Spider

近期,耶鲁大学创建了一个新型大规模复杂跨域语义解析和 Text-to-SQL 数据集 Spider。研究者用多个当前最优模型进行实验,最好的模型在数据库分割设置下仅能达到 14.3% 的精确匹配准确率。Spider 数据集对未来研究是一个巨大挑战。

新千禧年开始后,每天生产的数据量呈指数级增长,它们大部分存储在关系数据库中。近年来,访问这些数据成为大多数大公司的兴趣,这些公司可以使用结构化查询语言(SQL)查询数据。随着手机的发展,更多个人数据也被存储。因此,更多来自不同背景的人尝试查询和使用自己的数据。尽管目前数据科学非常流行,但是大部分人不具备足够的知识来写 SQL、查询数据。此外,[……]

继续阅读