基于 NumPy 的 30 多个机器学习算法开源代码

NumPy 手写所有主流 ML 模型,普林斯顿博士后 David Bourgin 最近开源了一个非常剽悍的项目。超过 3 万行代码、30 多个模型,这也许能打造「最强」的机器学习基石。NumPy 作为 Python 生态中最受欢迎的科学计算包,很多读者已经非常熟悉它了。它为 Python 提供高效率的多维数组计算,并提供了一系列高等数学函数,我们可以快速搭建模型的整个计算流程。

尽管目前使用 写模型已经不是主流,但这种方式依然不失为是理解底层架构和深度学习原理的好方法。最近,来自普林斯顿的一位博士后将 NumPy 实现的所有机器学习模型全部开源,并提供了相应的论文和一些实现的测试效果[……]

继续阅读

NumPy 中文官方教程

此前,跨象乘云 发布了《NumPy 教程:基础知识》与《Python 知识卡片:NumPy》两份教程。近日,NumPy 官方正式推出了 NumPy 中文版网站,涵盖 NumPy 的一切。在 Github 上一度蝉联最流行的机器学习和数据科学包 NumPy,已经有了非常之系统的中文文档。现在,如果有什么和 NumPy 的问题,只需要浏览这份官方中文文档就足够了。它足够的系统、全面且亲民。NumPy 是使用 Python 进行科学计算的基础软件包,是 Python 生态系统中数据分析、机器学习、科学计算的主力军,极大简化了向量与矩阵的操作处理。除了计算外,它还包括了:

Python 知识卡片:NumPy

继续之前的:

作为数据科学的基本包之一,NumPy 是你必须能够使用并确认你是否需要使用 Python 进行数据科学工程实践的软件包之一。它提供了 Python 列表的一个很好的选择,因为 NumPy 数组更紧凑,允许更快地读取和写入项目,并且更方便,更高效。此外,NumPy 也是其他重要软件包的基础,用于数据操作和机器学习,您可能已经知道,即 PandasScikit-LearnSciPy

  • Pandas 数据操作库建立在 NumPy 上,但它不是使用数组,而是使用另外[……]

    继续阅读

NumPy 教程:基础知识

此前,跨象乘云™ 介绍了几篇关于 Python 《数据科学管道与数据分析库:Pandas》的教程,NumPy(Numerical Python)是 Python 中的一个线性代数库。对每一个数据科学或机器学习 Python 包而言,这都是一个非常重要的库,SciPy(Scientific Python)、Mat-plotlib(plotting library)、Scikit-learn 等都在一定程度上依赖 NumPy。对数组执行数学运算和逻辑运算时,NumPy 是非常有用的。在用 Python 对 N 维数组和矩阵进行运算时,NumPy 提供了大量有用特征。

这篇教程介绍了数据科学初[……]

继续阅读

人工智能专业实验课程

当前,我国高等院校本科人工智能专业以培养人工智能应用型人才为主,在立足熟练应用先进的人工智能信息化工具的同时,为进一步向科研型人才深入探索与发展打下坚实的理论与技术基础。算法工程师,又称:人工智能工程师、机器学习/深度学习工程师;属于算法工程型人才,同时也是当前国内本科人工智能专业重点培养人才,在整个人工智能项目生命周期中充当关键的角色,是人工智能基础研究与产业应用之间的关键连接,采用最新的机器学习技术,使用适用于解决问题的数据集来获取解决特定的业务问题,并确保其能大规模部署上线服务。对口专业包括:人工智能、计算机科学,数据科学与大数据技术,数学,运筹学,物理,电气工程专业等。主要工作职责包括[……]

继续阅读

开源自动化机器学习框架,轻松搞定机器学习

自动化机器学习 (AutoML) 可以帮助机器学习管道中的某些关键组件实现自动化。其中机器学习管道包括数据理解、数据工程、特征工程、模型训练、超参数调整、模型监控等。

在这篇文章中,分享 8 个开源的 autoML 框架:

  • Auto-Sklearn
  • TPOT
  • Auto-ViML
  • H2O AutoML
  • Auto-Keras
  • MLBox
  • Hyperopt Sklearn
  • AutoGluon

1、Auto-Sklearn

Auto-sklearn 是基于 scikit-learn 软件包构建的开源 AutoML 库。它为给定的数据集找[……]

继续阅读

Pandas 中文官方教程

此前,跨象乘云 发布了《Python 知识卡片:Pandas》。Pandas 是一个强大的分析结构化数据的工具集;它的使用基础是 NumPy(提供高性能的矩阵运算);用于数据挖掘和数据分析,同时也提供数据清洗功能。学习 Pandas 最好的方法就是看 Pandas 官方教程,日前,国内学习小组发布了 Pandas 官方教程的中文版,包括:《十分钟搞定 pandas》,《Pandas 秘籍》,《学习 Pandas》。

Pandas 中文官方教程》PDF 下载。[……]

继续阅读

人工智能专业(080717T)学习路径及人才培养模型

作为首个直接以『人工智能』命名的专业,080717T 的专业目标,是培养适应国民经济与科技发展的需求,具备较好的科学素养、扎实的人工智能基本理论和专业知识、较强的工程实践能力,掌握智能信息化技术基础知识与方法,能够在人工智能及其相关应用领域从事新技术和新产品研发、系统设计、管理,以及解决复杂工程问题的高级工程技术人才。

人工智能专注于理解视觉,语音,语言,决策等复杂任务的核心能力,并设计机器和软件来模拟这些过程。人工智能具有悠久而丰富的历史,尽管许多工具和技术已经存在数十年(即多层感知器,卷积神经网络,强化学习),然而,高性能计算的最新进展,分布式方法的发展以及大数据产业的发展,[……]

继续阅读

《Python 数据分析》课程

Python是一种面向对象、直译式计算机程序设计语言,由 Guido van Rossum 于 1989 年底发明。由于他简单、易学、免费开源、可移植性、可扩展性等特点,Python 又被称之为胶水语言,是目前『云计算』 Openstack 的标准开发语言。同时,Python 拥有非常丰富的库,使其在数据分析领域也有广泛的应用。本课程涵括 Python 在大数据分析领域中的五大核心应用:

  1. 数据统计;(NumPy/Pandas 库)
  2. 数据采集;(Scrapy Web 爬虫采集)
  3. 数据处理;(清理、转换、合并、重塑)
  4. 数据分析;(数据聚合与时间序列)
  5. 数据可视化;[……]

    继续阅读

《机器学习》课程

在如今这个处处以数据驱动的世界中,机器学习,深度学习,人工智能正变得越来越大众化。在大数据的爆发性增长背景下,当今的机器学习技术已经被广泛地应用于不同领域,如搜索引擎、机器人、无人驾驶汽车等。机器通过分析大量数据来进行学习。比如说,不需要通过编程来识别猫或人脸,它们可以通过使用图片来进行训练,从而归纳和识别特定的目标。机器学习是一种重在寻找数据中的模式并使用这些模式来做出预测的研究和算法的门类。机器学习是人工智能领域的一部分,并且和知识发现与数据挖掘有所交集。

本课程,覆盖机器学习核心算法模型,为学生打下坚实的机器学习算法模型基础,通过超过 20 个实战项目,使学生从技术原理,到[……]

继续阅读