Scikit-Learn 中文实践教程

Scikit-learn 是基于 Python 的开源机器学习库,它基于 NumPy 和 SciPy 等科学计算库,并支持支持向量机、随即森林、梯度提升树、K 均值聚类等学习算法。Scikit-learn 目前主要由社区成员自发进行维护,且专注于构建机器学习领域内经广泛验证的成熟算法。—— 这里是一份高质量的中文翻译实践教程

Scikit-learn 项目最早为数据科学家 David Cournapeau 于 2007 年发起的 scikits.learn 项目,且 Scikit 的名字可视为 SciPy Toolkit,即 SciPy 的第三方扩展。Scikit-learn[……]

继续阅读

Python 知识卡片:Scikit-Learn

继续之前的:

大多数使用 Python 学习数据科学的科研工作人员与学生,肯定会听说 scikit-learn,这是一个开源的Python 库,它通过统一的界面实现了各种机器学习,预处理,交叉验证和可视化算法。如果你对这个领域还很陌生,你应该意识到机器学习以及 Python 库是属于每个有抱负的数据科学家必须知道的。

此前,跨象乘云™ 曾经介绍了完整的 scikit-learn 算法[……]

继续阅读

scikit-learn算法工程导图

ScikitsSciPy堆栈 的附加软件包,专门用于图像处理和机器学习等特定功能。 就机器学习而言,这些堆栈中最为突出的就是 scikit-learn。 该软件包构建在 SciPy 的顶部,并大量使用其数学运算。

scikit-learn 为常见的机器学习算法(包括:分类,回归,聚类,降维等)提供了一个简洁而一致的界面,使得将机器学习带入生产系统变得简单。基于NumPySciPyMatplotlib 构建,同时提供开源及商业使用许可证,可供所有人在任何环境下重复使用。该 Python 库结合了高质量的代码和良好的文档,易用性和高性能。事实上,scikit-learn 已经成[……]

继续阅读

开源自动化机器学习框架,轻松搞定机器学习

自动化机器学习 (AutoML) 可以帮助机器学习管道中的某些关键组件实现自动化。其中机器学习管道包括数据理解、数据工程、特征工程、模型训练、超参数调整、模型监控等。

在这篇文章中,分享 8 个开源的 autoML 框架:

  • Auto-Sklearn
  • TPOT
  • Auto-ViML
  • H2O AutoML
  • Auto-Keras
  • MLBox
  • Hyperopt Sklearn
  • AutoGluon

1、Auto-Sklearn

Auto-sklearn 是基于 scikit-learn 软件包构建的开源 AutoML 库。它为给定的数据集找[……]

继续阅读

各种机器学习算法最佳应用场景 – 2

此前,跨象乘云™ 曾介绍了基于 scikit-learn 的机器学习算法工程导图,并介绍了在选取合适的机器学习算法前,都需要完成的必要数据科学流程。再强调一遍:掌握机器学习算法的价值,不单纯研究算法背后的数学原理,而是熟练理解各种机器学习算法应用的业务场景,搞清楚机器学习算法究竟能解决什么实际的业务问题。毕竟大多数企业希望聘请的是能提升业务的工程师,而不是科研数学家。因此,我们今天进一步介绍几种常用的机器学习应用场景:

线性回归

这可能是机器学习中最简单的算法。例如,当你想要计算一些连续值,而不是将输出分类时,可以使用回归算法。因此,当你需要预测一个正在运行的过程未来的值时,你可以使用回归[……]

继续阅读

各种机器学习算法最佳应用场景 – 1

此前,跨象乘云™ 曾介绍了基于 scikit-learn 的机器学习算法工程导图这篇文章进一步详细解析了各种机器学习算法的最佳应用场景,以下内容由机器之心编译。

机器学习既是一门科学,也是一种艺术。各类机器学习算法,并没有一种普适的解决方案或方法。事实上,有几个因素会影响你对机器学习算法的选择。有些问题是非常特别的,需要用一种特定的解决方法。例如,如果你对推荐系统有所了解,你会发现它是一类很常用的机器学习算法,用来解决一类非常特殊的问题。而其它的一些问题则非常开放,可能需要一种试错方法(例如:强化学习)。监督学习、分类、回归等问题都是非常开放的,可以被用于异常检测或建立更加广泛的预测模[……]

继续阅读

2020 年人工智能开源生态圈

深度学习为核心的新一代人工智能技术发展到今天,已逐步形成一个庞大的生态结构,覆盖了:经典机器学习深度学习强化学习自然语言处理语音识别计算机视觉、分布式训练、自动建模、IDEs 系统、平台、评分推理系统等完整的细分领域 —— 正确合理的选择与开发内容相匹配的工具,常常会使科学研究工作事半功倍,同时,选择正确高效的工具也是技术应用类专业建设的重要环节。

跨象乘云™ 持续致力为高等院校打造深度学习与新一代人工智能科研教学一体化实验平台,在进一步将深度学习系统与容器化基础设施架构紧密集成的同时,对新一代人工智能开源生态系统提供全方位的支撑,加速高校科研效率及科研成果落地。详细项目列表[……]

继续阅读

人工智能专业(080717T)学习路径及人才培养模型

作为首个直接以『人工智能』命名的专业,080717T 的专业目标,是培养适应国民经济与科技发展的需求,具备较好的科学素养、扎实的人工智能基本理论和专业知识、较强的工程实践能力,掌握智能信息化技术基础知识与方法,能够在人工智能及其相关应用领域从事新技术和新产品研发、系统设计、管理,以及解决复杂工程问题的高级工程技术人才。

人工智能专注于理解视觉,语音,语言,决策等复杂任务的核心能力,并设计机器和软件来模拟这些过程。人工智能具有悠久而丰富的历史,尽管许多工具和技术已经存在数十年(即多层感知器,卷积神经网络,强化学习),然而,高性能计算的最新进展,分布式方法的发展以及大数据产业的发展,[……]

继续阅读

《机器学习》课程

在如今这个处处以数据驱动的世界中,机器学习,深度学习,人工智能正变得越来越大众化。在大数据的爆发性增长背景下,当今的机器学习技术已经被广泛地应用于不同领域,如搜索引擎、机器人、无人驾驶汽车等。机器通过分析大量数据来进行学习。比如说,不需要通过编程来识别猫或人脸,它们可以通过使用图片来进行训练,从而归纳和识别特定的目标。机器学习是一种重在寻找数据中的模式并使用这些模式来做出预测的研究和算法的门类。机器学习是人工智能领域的一部分,并且和知识发现与数据挖掘有所交集。

本课程,覆盖机器学习核心算法模型,为学生打下坚实的机器学习算法模型基础,通过超过 20 个实战项目,使学生从技术原理,到[……]

继续阅读

《自然语言处理》课程

本课程将介绍在现代架构上实现自然语言处理技术,主题包括:如何操控用于语言模型的文本,文本生成和主题建模,通过更高级概念的机器学习基础。本课程结束时,学生将掌握以下方面的实践知识:字符串预处理技术的应用,如何将机器学习算法应用于文本分类和其他语言任务。同时,配套BERT模型语句情感分类实战项目案例,基于业内最先进的自然语言处理模型:BERT。基于 IMDB 电影评论的点评文本,实现语句分类与情感分析,覆盖自然语言处理操作的必要步骤与高级特性,包括 —— BERT 模型架构,NLP 迁移学习,句型情感分类,NLP 模型训练,Word2vec,distilBERT 模型,scikit-learn 机[……]

继续阅读