《机器学习》课程

在如今这个处处以数据驱动的世界中,机器学习,深度学习,人工智能正变得越来越大众化。在大数据的爆发性增长背景下,当今的机器学习技术已经被广泛地应用于不同领域,如搜索引擎、机器人、无人驾驶汽车等。机器通过分析大量数据来进行学习。比如说,不需要通过编程来识别猫或人脸,它们可以通过使用图片来进行训练,从而归纳和识别特定的目标。机器学习是一种重在寻找数据中的模式并使用这些模式来做出预测的研究和算法的门类。机器学习是人工智能领域的一部分,并且和知识发现与数据挖掘有所交集。

本课程,覆盖机器学习核心算法模型,为学生打下坚实的机器学习算法模型基础,通过超过 20 个实战项目,使学生从技术原理,到[……]

继续阅读

深度学习知识卡片:深度学习基本概念

此前,跨象乘云™ 发布《Python 知识卡片完整中文版》,覆盖:Bokeh,Jupyter Notebook,Keras,Matplotlib 绘图,Numpy 基础,Pandas 基础,Pandas 进阶,Python 基础,Scikit-Learn,SciPy,Seaborn,Spark RDD 基础,Spark SQL 基础,导入数据等核心技术领域。覆盖了 Python 在数据科学与大数据专业建设课程体系中的绝大部分领域,作为教育资源对学生学习 Python 数据分析,数据处理,科学运算,数据可视化,机器学习等具有极大的参考复习意义。

本期,跨象乘云™ 将继续连载《深度学习知识卡[……]

继续阅读

Kaggle 官网课程:从 Python 到机器学习

Kaggle 官网发布了一套完整的 Python 免费微课 ——课程特色:快速上手,在线练习,社区讨论。一共 12 门课,包括一节测试课。课程的设置是以实用为导向,按照数据项目所需要的核心技能来分小节,保证学完就能用,让学时间习性价比最大化。Python,机器学习入门,中极机器学习,数据可视化,Pandas,特征学习,深度学习,SQL 入门,SQL 进阶,地理空间分析,机器学习可解释性。[……]

继续阅读

Python 知识卡片完整中文版

此前,跨象乘云™ 发布了一系列 Python 数据科学核心库的多份知识卡片,包括 ——

此前的知识卡片主要是英文原版,再次跨象乘云™ 发布《Python 知识卡片完整中文版》,覆盖:Bokeh,Jupyter Notebook,Keras,M[……]

继续阅读

数据分析技能全流程知识细节

进入一个全新的领域之前,最好能够对这个领域的知识体系、技能模型有全面的了解,这样你能知道哪些是应该学习,哪些是暂时不用学的,知道什么样的路径适合自己的状况。

基于数据分析这个技能,DC 学院 —— 准备了一份『超级技能地图』,帮你快速认识数据分析的技能模块,以及不同的分支下,有哪些必备的技能,以及有哪些好用的资源。

这一张图,可以帮助你快速认识数据分析这个领域,即便你从未接触过相关的内容,也可以很清晰地建立数据分析知识框架。

这是数据分析小白必备的数据分析技能图,因为包含了 Python 数据分析全方位的技能体系,比如数据获取、SQL 数据库、Python、统计学、数据分析核[……]

继续阅读

数据科学、神经网络、机器学习完全图解

这是一份非常详实的备忘单,涉及具体内容包括:

  1. 神经网络基础知识
  2. 神经网络图谱
  3. 机器学习基础知识
  4. 著名 Python 库 Scikit-Learn
  5. Scikit-Learn 算法
  6. 机器学习算法选择指南
  7. TensorFlow
  8. Python 基础
  9. PySpark 基础
  10. Numpy 基础
  11. Bokeh
  12. Keras
  13. Pandas
  14. 使用 Pandas 进行Data Wrangling
  15. 使用 dplyr 和 tidyr 进行 Data Wrangling
  16. SciPi
  17. MatPlotLib
  18. 使用 gg[……]

    继续阅读

可视化神器 Altair 登场 – 1

如何将我们的数据以更好的形势呈现出来?擅长不同编程语言的程序员会选择各自技术范畴内成熟、好用的工具包,比如 R 语言的开发者最常使用的是 ggplot2,但它不支持 Python;以前 Python 语言的开发者使用最多的是 matplotlib,一个很强大的可视化库,不过它的局限也非常严重,制作交互式图表也是一件难事。今天要给大家推荐一个新的工具—— Altair,一个 Vega-Lite 的包装器,也许这些概念你都还不没了解过,接下来我们就在下面的文章为大家作介绍。

ggplot2 是 R 的作图工具包,可以使用非常简单的语句实现非常复杂漂亮的效果。然而不幸的是,ggplot2 并不[……]

继续阅读

Spark 2.4 重磅发布

Spark 2.4 重磅发布:优化深度学习框架集成,提供更灵活的流式接收器。Apache Spark 2.4.0 是 2.x 系列中的第五个版本。此版本增加了屏障执行模式,以便更好地与深度学习框架集成;引入 30 多个更高阶的内置函数,能够更轻松地处理复杂数据类型;优化 K8s 集成,同时提供 Scala 2.12 实验性支持。其他主要更新还包括内置 Avro 数据源、图像数据源,更加灵活的流式接收器,取消传输过程中 2GB 块大小的限制,Pandas UDF 改进。此外,此版本继续关注可用性、稳定性,并解决了大约 1,100 个 tickets。[……]

继续阅读

20G 绝地求生比赛数据集分析

项目主要分析绝地求生 72 万场比赛的数据,并结合数据给出吃鸡攻略,用数据吃鸡!

数据集说明

  • 数据来自 Kaggle
  • 数据主要分成两部分,一部分是玩家比赛的统计数据,在 aggregate.zip,一部分是玩家被击杀的数据,在 deaths.zip
  • 本次分析选取其中的两个数据集进行分析

运行环境:

  • python 3.6

需要安装的包

  • pandas、numpy、scipy
  • matplotlib、seaborn、boke

GitHub地址项目 GitHub 地址[……]

继续阅读

Python 知识卡片:Bokeh

继续之前的:

对于 Bokeh,应该与其他 Python 可视化库(如 Matplotlib 或 Seaborn)区别开来,因为它是一个交互式可视化库,非常适合希望快速轻松地创建交互式图表,仪表板和数据应用程序的任何人。Bokeh 也因在现代 Web 浏览器中实现大型数据集的高性能视觉呈[……]

继续阅读