吴恩达《Machine Learning》课程笔记

吴恩达在 Coursera 上开设的《Machine Learning》课程。这门课最大的特点就是基本没有复杂的数学理论和公式推导,非常适合入门!本课程将广泛介绍机器学习、数据挖掘和统计模式识别。相关主题包括:

  1. 监督式学习(参数和非参数算法、支持向量机、核函数和神经网络)。
  2. 无监督学习(集群、降维、推荐系统和深度学习)。
  3. 机器学习实例(偏见/方差理论;机器学习和 AI 领域的创新)。

课程将引用很多案例和应用,您还需要学习如何在不同领域应用学习算法,例如智能机器人(感知和控制)、文本理解(网络搜索和垃圾邮件过滤)、计算机视觉、医学信息学、音频、数据库挖掘等领域。

这门课基本涵盖了机器学习的主要知识点,例如:线性回归、逻辑回归、支持向量机、神经网络、K-Means、异常检测等等。而且课程中没有复杂的公式推导和理论分析。Ng 的目的是让机器学习初学者能够快速对整个机器学习知识点有比较整体的认识,便于快速入门。

这门课的笔记网上有很多,但今天推荐一份不错的全面的笔记。该笔记的特点是所有内容都是基于 Jupyter Notebook 写的,集图片、公式、代码、练习题于一体,非常方便实用!另外,这门课配套相应的练习题。Github 上已经有人把作业整理成为 Python 的形式了。有 .py 和 .ipynb 两种格式。

https://github.com/nsoojin/coursera-ml-py

https://github.com/kaleko/CourseraML 

GitHub地址项目 GitHub 地址

 

《人工智能现状与未来》PPT 下载

人工智能引领新的工业革命,需要正确理解其技术核心、学科定位、架构演进,当前深度学习和知识图谱成其左膀右臂,象征人类智谋的智能博弈在围棋后的下一个高地在哪里?走向人机融合的未来,人工智能将向什么方向演进发展,人类社会将面临哪些变革,需要我们从不同维度不断去研究思考。

挑战 1:如何创造出智能新产品?

  • 智能应用软件:语音识别、机器翻译、图像识别、智能交互、知识处理等
  • 智能基础软件:各种智能芯片、智能插件、零部件、传感器、网络智能设备
  • 智能自主产品:汽车、轨道交通、车联网、无人机、船、机床、机械等
  • 虚拟实现与增强现实:艺术、玩具和教育产品
  • 可穿戴产品:人工智能的手机、车载智能终端、智能手表、智能耳机、智能眼镜、健康检测与康复产品
  • 家居产品:建筑智能设备、家电、家具等产品的智能化

挑战 2:如何成功创造出新的智能应用系统?

  • 智能企业:对设计、生产、管理、物流和营销等业务链的智能优化,生产线智能调度与重构,生产设备网络化、生产数据集成化、生产过程透明化、生产现场无人化、运营管理智能化等系统•智能制造:智能自主的装备与系统、制造云服务、流程智能制造系统、离散智能制造系统、网络化协同制造系统、远程智能诊断、运维和服务新模式
  • 智能物流:智能化分拣、仓储、装卸、搬运,集成信息平台,产品质量及安全追溯,配货调度智能化
  • 智能金融:金融大数据智能、金融产品智能设计和服务创新、智能客服、金融风险智能预警与防控系统
  • 智能商务:市场分析与决策、产品与广告的创新设计、个性化定制服务、产品安全与信用保证等系统
  • 智能农业:智能化装备与农田作业智能系统,智能农业信息检测网络,农业大数据分析决策系统
  • 智能教育:个性化智能学习,交互式主动学习、智能校园、智能图书馆系统
  • 智能医疗:城市便捷精准的智能医疗体系、智能医院、智能医疗诊断、新药辅助研发、医药智能监管、流行病智能检测和防控、健康养老大数据智能分析与服务等系统

挑战 3:如何让社会智力增加智能?

  • 智慧法庭:建设智慧法庭数据与知识平台,推进审判体系和审判能力的智能增强•智能城市:推进对基础设施和土、水、气等环境的深度认知,对城市规划、建设、管理、运营的智能优化
  • 智能交通监控:研发车联自动驾驶与车路协同的技术体系、交通智能化疏导和运行协调系统,提高覆盖地、轨、空、海的综合交通智能监管和服务能力
  • 智能化检测预警与综合应对:围绕反恐、犯罪侦查、食品安全、信息安全、自然灾害防治等公共安全提高智能化检测预警与综合应对水平

《人工智能现状与未来》PPT 下载

清华大学、中国人工智能学会 -《2019人工智能发展报告》

11 月 30 日下午,2019 中国人工智能产业年会重磅发布《2019人工智能发展报告》(Report of Artificial Intelligence Development 2019)。唐杰教授代表报告编写相关单位就《2019 人工智能发展报告》主要内容进行了介绍。报告力图综合展现中国乃至全球人工智能重点领域发展现状与趋势,助力产业健康发展,服务国家战略决策。

报告涉及 AI 13 个子领域
报告涉及 AI 13 个子领域

内容涵盖了人工智能 13 个子领域,包括:机器学习、知识工程、计算机视觉、自然语言处理、语音识别、计算机图形学、多媒体技术、人机交互、机器人、数据库技术、可视化、数据挖掘、信息检索与推荐。

报告基本框架
报告基本框架

报告基本框架如上图所示,包括领域概念阐释、发展历史梳理、人才概括、关键论文解读以及相应领域的前沿进展。

《统计学习方法》第 2 版课件 + 算法实现代码

李航的《统计学习方法》(GitHub 地址)可以说是机器学习的入门宝典,许多机器学习培训班、互联网企业的面试、笔试题目,很多都参考这本书。该书从 2005 年开始写作一直到 2012 年完成,包含了众多主要的监督学习算法与模型。今年,《统计学习方法》第二版正式发布,通过 6 年时间的努力,在第一版的基础上又增加了无监督学习的主要算法与模型。

这里插入个图表,列举了各个章节所占篇幅,其中 SVM 是监督学习里面占用篇幅最大的,MCMC 是无监督里面篇幅占用最大的,另外 DT,HMM,CRF,SVD,PCA,LDA,PageRank 也占了相对较大的篇幅。
这里插入个图表,列举了各个章节所占篇幅,其中 SVM 是监督学习里面占用篇幅最大的,MCMC 是无监督里面篇幅占用最大的,另外 DT,HMM,CRF,SVD,PCA,LDA,PageRank 也占了相对较大的篇幅。

《统计学习方法》第二版的最新课件,是由清华大学深圳研究院的袁春教授制作的。

所有的课件都是 PPT 格式,总共包含 22 章。正好是《统计学习方法》第 2 版的完整内容。

其中,第 1 章至第 12 章主要是《统计学习方法》第一版的内容。主要介绍统计学习及监督学习概论、感知机、近邻法、朴素贝叶斯法、决策树、逻辑斯谛回归与最大熵模型、支持向量机、提升方法、EM 算法及其推广、隐马尔可夫模型、条件随机场、监督学习方法总结。

第 2 版增加的新内容包括:

  • 第 13 章 – 无监督学习概论
  • 第 14 章 – 聚类方法
  • 第 15 章 – 奇异值分解
  • 第 16 章 – 主成分分析
  • 第 17 章 – 潜在语义分析
  • 第 18 章 – 概率潜在语义分析
  • 第 19 章 – 马尔可夫链蒙特卡罗法
  • 第 20 章 – 潜在狄利克雷分配
  • 第 21 章 – PageRank 算法
  • 第 22 章 – 无监督学习方法总结
整个这本书里面各章节也不是完全独立的,这部分希望整理章节之间的联系以及适用的数据集。算法到底实现到什么程度,能跑什么数据集也是一方面。
整个这本书里面各章节也不是完全独立的,这部分希望整理章节之间的联系以及适用的数据集。算法到底实现到什么程度,能跑什么数据集也是一方面。

最后,Github 上有同学将第一版相关的机器学习算法用 Python 实现了一遍,致力于将李航博士《统计学习方法》一书中所有算法实现一遍。

GitHub地址项目 GitHub 地址