微软推出 Python 零基础教程

如果你想了解一门既实用又简单的语言,作为你程序人生的第一步,那么,Python 无疑是最适合你的。数据科学家和人工智能从业者们尤其喜欢 Python,因为它有丰富的、易于理解的语法和广泛的开源软件。然而,目前大部分的所谓入门教程,实际上对于真正零基础的人来说还是具有很高的门槛,同时,几百页的书和动不动上百个小时的学习视频对有的人来说,无疑是劝退。

微软意识到了这一点,也充分理解大多数人对于学习的耐心,于是就开发了一门 Python 的入门课程《Python for Beginners》(国内镜像),基于原生 VS Code,每节课只有 5-10 分钟,可以被认为是真正的入门及课程了。

近期,跨象乘云™ 也开始针对不具备计算机编程以及统计学经验的学生,进行各种机器学习算法实验的《智能数据挖掘》实战系列课程,旨在让更多的人参与的机器学习与人工智能的生态圈中。

用 Jupyter Notebook 制作新冠病毒疫情追踪器

『山川异域,风月同天』—— 新冠肺炎疫情牵动着举国上下的心,包括跨象乘云™ 在内,众多高科技企业除了向灾区捐赠物资,配合疫情防控工作,延期复工 / 远程办公的同时,也在积极探索如何利用大数据、新一代人工智能等新技术为『战疫』助力。

新冠肺炎已在全球范围内爆发。为了解全球疫情分布情况,日前,一位名叫 Michael Freeborn 的医生 / 程序员,利用 Python 的图形库 Plotly,制作了两种疫情的等值线地图(Choropleth Chart)和 GEO 分布散点图(”Scatter-Geo” Chart)。前者显示了一个国家 / 地区的疫情扩散情况:该国家 / 地区的在地图上的颜色越深,其确诊案例越多。其中的播放键可以为图表制作动画,同时还可以使用滑块手动更改日期。第二个散点图中的红点则表明其大小与某一特定地点的确诊病例数量成对数比例。这个图表的分辨率更高,数据呈现的是州/省一级的疫情情况。

同时,作者发布了该项目的代码。

GitHub地址项目 GitHub 地址

fast.ai 面向 Pytorch 的深度学习新书开源

fast.ai 的创始人、前 Kaggle 首席科学家 Jeremy Howard 教授在 Github 上开源了和 Sylvain Gugger 合著的新书《Deep Learning for Coders with fastai and PyTorch》的初稿。全书草稿已公布 22 章,通过这份它你将学到:

  • 如何在计算机视觉、自然语言处理、推荐系统、表格和时间序列数据分析中创建最先进的模型
  • 如何使用全新的 fastai v2 库和 PyTorch
  • 深度学习的基础:什么是神经网络,它们是如何训练的,以及它们如何进行预测
  • 为什么以及如何使用深度学习模型,以及如何使用这些知识来提高模型的准确性、速度和可靠性
  • 如何将你的模型转换为实际的 Web 应用程序,以及在模型出错时如何调试模型。
  • 最新的深度学习技术,尝试真正有意义的实践
  • 如何阅读深度学习研究论文
  • 如何实现深度学习算法从无到有

不过该课程并非面向零基础人士,虽说不要求你处理大量数据,也不需要你具备大学水平的数学能力,但是你至少需要有一年的编程经验。

GitHub地址项目 GitHub 地址

如何高效搜索 GitHub 开源项目

在互联网信息时代,知识搜索能力已成为个人成长的一个重要维度,搜索引擎本身是公开的,每个人都可以使用,然而真正了解如何高效应用搜索功能的却不多。跟大部分网站一样,GitHub 搜索入口很简单,都只有一个对话框。然而,正如只有你先提出了正确的问题,才能获得正确的答案。换句话说:你需要了解如何更好的输入你的搜索内容,才能更快的定位你需要寻找的资源。大部分人使用搜索引擎,都是简单的输入搜索内容。而搜索引擎的反馈也很纯粹 —— 你希望了解一切,我就告诉你我能搜索出来的一切,结果是你因为被海量信息淹没而什么都得不到。其实,无论是使用搜索引擎还是 GitHub,高效精准的获取搜索目标的秘密在于:使用『关键字』,或者称为搜索参数,作为搜索输入的一部分,让搜索引擎在返回搜索结果前先过滤掉你不需要的内容。常用的 GitHub 『关键字』 / 搜索参数如下 ——

  • in:name xxx:按照项目名搜索
  • in:readme xxx:按照 README 搜索
  • in:description xxx:按照 Description 搜索
  • stars:>xxx:Stars 数大于 xxx
  • forks:>xxx:Forks 数大于 xxx
  • language:xxx:编程语言是 xxx
  • pushed:>YYYY-MM-DD:最后更新时间大于 YYYY-MM-DD

GitHub地址项目 GitHub 地址

吴恩达人工智能系列课程资源

随着近些年来 AI 越来越火的大趋势下,吴恩达一直致力于普及、宣传、推广 AI 教育,包括最前沿、最火爆的 AI 基础课程、深度学习课程等等。本文为截至目前吴恩达 AI 系列课程资源数理,以便为新一代人工智能专业师生梳理一条客观可参考的新一代人工智能学习路径。

    • Machine Learning》:在 Coursera 上发布,涵盖了机器学习的主要知识点:线性回归、逻辑回归、支持向量机、神经网络、K-Means、异常检测等。课程中没有复杂的公式推导和理论分析,让机器学习初学者能够快速对整个机器学习知识点有比较整体的认识,便于快速入门。具备完整的中文笔记在线笔记,以及课后作业(Python / Jupyter)。
    • CS229:吴恩达在斯坦福教授的《机器学习》(CS 229)课程与 Coursera 上的《Machine Learning》类似,但比 Coursera 上的更全面和进阶,对机器学习和统计模式识别进行了广泛的介绍,非常适合在学完《Machine Learning》之后的提升。具备完整的在线笔记配套资源精炼知识点速查表完整速查表机器学习的数学基础,以及线性代数和概率论的翻译
    • Deep Learning Specialization》:吴恩达在 CourseraDeeplearing.ai 上同时发布,开设了由 5 门课组成的深度学习专项课程,掀起了一股人工智能深度学习热潮。该专项课程可以说是深度学习入门的最佳课程之一!不仅知识体系完善,涵盖神经网络基础、浅层神经网络、深层神经网络、神经网络优化、CNN、RNN 等知识;而且配备了相当专业的编程题。在国内的网易公开课上同步发布,具备完整的汉化视频,在线笔记-1 / –2知识卡片,以及完整的 GitHub 资源。
    • CS230:吴恩达在斯坦福大学又开设了高质量的深度学习课程。在这门课中,你将学习深度学习的基础,理解如何构建神经网络,并且学习如何领导一个成功的机器学习项目。课程配备的代码都可以使用 Python 和 TensorFlow 来实现。这门课采用翻转课堂的教学形式,你可以在家观看教学视频,完成深度编程作业和在线测试,然后来到课程做进一步讨论并完成最后的大项目。具备完整的在线视频国内平台项目示例代码课程知识点归纳总结,以及完整速查表 GitHub 资源
    • TensorFlow in Practice》:吴恩达在 Coursera 上线了新的《TensorFlow in Practice》专项课程。显然,这门专项课程更加注重实践,而且使用现在最火热的深度学习框架 TensorFlow。该专项课程总共包含四门课:《TensoFlow 和机器学习、深度学习的介绍》、《TenSorFlow 中的卷积神经网络》、《TenSorFlow 中的自然语言处理》、 《序列、时间序列和预测》。
    • TensorFlow: Data and Deployment》:吴恩达在 Coursera 又有 TensorFlow 专项课程了,这回的主要内容放在了 TensorFlow 移动和 Web 端机器学习,包括:TensorFlow.js、TensorFlow Lite 等 Web 或移动端的使用。主要介绍使用 Tensorflow.js、TensorFlow Lite、TensorFlow Hub 等工具进行数据分析的方法。
    • AI For Everyone》:这是一门非技术课程,更主要的是教大家如何将 AI 业务布局到公司,以及谈谈 AI 对社会的影响。你可以从这门课程中学到:常见人工智能术语的含义,包括神经网络、机器学习、深度学习和数据科学;人工智能做什么,不能做什么;如何在工作中寻找布局 AI 的机会;如何与 AI 团队合作并建立公司 AI 战略;怎么看待 AI 道德伦理。
    • Machine Learning Yearning》:历时半年的大作《Machine Learning Yearning》英文版和中文版《机器学习训练秘籍》已重磅问世了!这本书《Machine Learning Yearning》能够从以下几个方面给你带来收获:优先考虑 AI 项目最有前途的方向;调试机器学习项目中的错误;在复杂设置中构建 ML,例如训练/测试样本不匹配;构建一个 ML 项目,接近甚至达到人类水平;知道什么时候、如何使用端对端学习、迁移学习和多任务学习。具有在线阅读中文版,以及中文版 GitHub 等完整资源。

Python 3 经典课程《Think Python 2e》

Python 经典入门课程《Think Python – 像计算机科学家一样思考 Python》第二版中文译本已经正式发布,其中最重要的更新,是课程全面升级为面向 Python 3 编写。毕竟,Python 3 才是 Python 的未来。Python 之父 Guido van Rossum 早就坚决指出,不会再延长 Python 2 的支持协议。更具体一点说,就是到 2020 年时,Python 核心开发团队就会停止对 Python 2.7 的开发、维护工作。而且,他们也早就不再往 2.7 版中添加新特性了。虽然现在很多公司还在使用 2.7,从 Python 2 迁移到 Python 3 的过程也非常的艰难,但是可以肯定的是,Python 3 才是 Python 的未来!特别对于新增开设大数据与人工智能专业的学校而言,我们更需要 Python 3 版的《Think Python 2e》,作为专业学生的 Python 基础入门教材。

GitHub地址项目 GitHub 地址

机器学习从零到一教学视频

日前,Google 推出了一套《机器学习从零到一》系列视频,这个系列视频叫做『Machine Learning: From Zero to Hero with TensorFlow』—— 机器学习: 从零到一学习 TensorFlow),这一系列基于 2019 年谷歌 I/O 大会上的热门演讲。系列视频共分为四集 ——

  • 第一集:你将了解到机器学习是编程的一个新领域。用传统的编程语言(如 Java 或 C++)编写程序,需要使用明确的规则。而机器学习则可以通过训练数据来推理出这些规则。但机器学习究竟是什么样子的呢?在这里,我们会用一个简单的示例代码去构建一个机器学习模型,介绍一些基础概念,而你们会在之后的视频中应用这些概念去解决一个更有意思的问题:计算机视觉。
  • 第二集:通过教计算机如何看到并识别不同的物体,你可以学习到一些基本的计算机视觉概念。你还可以在此处自己编写示例。
  • 第三集:在本集,我们会讨论卷积神经网络,以及为什么它们在计算机视觉中得到了广泛应用。卷积是一个图像过滤器。它可以用来提取输入图像中具有共性的特征。在本视频中,你将跟随讲师从处理输入图像,尝试能否从中提取特征,来了解它的工作原理。
  • 第四集:你将学习如何构建一个剪刀石头布的分类器。在第一集中,我们用这个例子展现了如何用传统代码来检测和分类它们的难度。随着我们对机器学习的深入了解,我们已经学习了如何构建神经网络:从探测原始像素中的模式到对其进行分类,再到使用卷积检测特征。

《C++ Primer中文版(第5版)》学习笔记与习题

现在 Python 越来越流行,学习人工智能也大都以学习 Python 为主。然而,C++ 仍然是不可撼动的领导性编程语言,其重要性不言而喻。特别是在阅读和研究一些深度学习框架的底层时,必须要懂  C++。《C++ Primer 中文版(第 5 版)》是一本久负盛名的 C++ 经典教程,其作者是 C++ 大师 Stanley B. Lippman 和 Josée Lajoie。该书已经帮助全球无数程序员学会了 C++。

今天推荐一份《C++ Primer 中文版(第 5 版)》的优质资源,包含了全书的详细笔记和习题解析。

GitHub地址项目 GitHub 地址

旷视深度学习中文视频课程

本次介绍的,是由旷视研究院和北大数学科学学院机器学习实验室,联合出品的《深度学习实践》课程,教育资源包含讲课视频(中文)和 PPT(英文)。这套课程 2017 年秋天在北大为大二到大四的学生讲过,当时的课堂被录了下来,可以在 B 站观看,可作为《深度学习》课程的理论补充。旷视课程章节覆盖 ——

  1. 计算机视觉和深度学习介绍
  2. 深度学习中的数学
  3. 神经网络基础与架构设计
  4. 深度学习中的计算技术介绍
  5. 神经网络近似算法
  6. 现代目标检测
  7. 场景文字检测与识别
  8. 图像分割
  9. 循环神经网络
  10. 生成模型与生成对抗网络介绍
  11. 行人重识别
  12. 3D 重建
  13. 视觉对象追踪
  14. 计算机图形学中的神经网络