TensorFlow VS. PyTorch

本文来源自斯坦福大学计算机科学博士生 Awni Hannun 发表的文章,对比当前两个深度学习主流框架:TensorFlowPytorch 之间的差异。整体而言:

PyTorch 更适合于在研究中快速进行原型设计、业余爱好者和小型项目;而 TensorFlow 则更适合大规模的调度,尤其当考虑到跨平台和嵌入式调度操作时。细分对比如下 ——

准备时间 –> PyTorch

PyTorch 实际上是 NumPy 的替代,它支持 GPU,有着更高级的功能,可以用来构建和训练深度神经网络。如果你熟悉 NumPy、Python 和常见的深度学习概念(卷积层、递归层、SGD 等),那么[……]

继续阅读

scikit-learn算法工程导图

scikit-learn 算法工程导图

ScikitsSciPy堆栈 的附加软件包,专门用于图像处理和机器学习等特定功能。 就机器学习而言,这些堆栈中最为突出的就是 scikit-learn。 该软件包构建在 SciPy 的顶部,并大量使用其数学运算。

scikit-learn 为常见的机器学习算法(包括:分类,回归,聚类,降维等)提供了一个简洁而一致的界面,使得将机器学习带入生产系统变得简单。基于NumPySciPyMatplotlib 构建,同时提供开源及商业使用许可证,可供所有人在任何环境下重复使用。该 Python 库结合了高质量的代码和良好的文档,易用性和高性能。事实上,scikit-learn 已经成[……]

继续阅读

Python数据科学核心库

数据科学解决方案公司 ActiveWizards,根据自身应用开发经验,总结了数据科学家和工程师 2017 年最常使用的 Python 库,以下是数据科学核心库部分:

NumPy

当使用 Python 开始处理科研任务时,不可避免地需要求助 Python 的 SciPy 堆栈,它是专门为 Python 中的科学计算而设计的软件集合。这个堆栈相当庞大,其中有十几个库,所以我们需要聚焦在最重要的核心包上。

NumPy(代表 Numerical Python)是构建科学计算堆栈的最基础的包。它为 Python 中的 N 维数组和矩阵的操作提供了大量有用的功能。该库还提供了 NumPy 数组[……]

继续阅读

最佳开源机器学习工具库:Kubeflow

随着 TensorFlow 的发布开源,面向开源软件的机器学习科研活动变得越来越活跃,已成为机器学习最佳选择。同时:

  • 机器学习与深度学习框架,已经成为软件工程师的标准配置;
  • 随着 arXiv 变得越来越流行,很多论文在国际会议同行评审前就已经被发布。
    因此,让企业能更快的验证最新科研算法;
  • 越来越多的研究员都在开始研究机器学习,学院内的机器学习科研领域逐渐变为红海;
  • 创建一个最佳算法,但如何部署实现却是秘密 —— 这种保守观念已经过时;

同时,Kubernetes 已经迅速成为在任何地方部署复杂工作负载的混合解决方案。从无状态服务开始,科研机构与企业已逐步开[……]

继续阅读