Anaconda 分发版是执行 Python 数据科学和机器学习最简单而且高效的平台,已经拥有超过 450 万用户。它包括数百种流行的 Python 数据科学软件包,以及用于Windows,Linux 和 MacOS 的 Conda 软件包和虚拟环境管理器。 其中,Conda 使安装,运行和升级复杂的数据科学和机器学习环境(如 scikit-learn,TensorFlow 和 SciPy)变得更加简单快捷;并且允许用户在多个 Python 版本之间并存以及自由切换的目标。 Anaconda 分发版同时也是数百万数据科学项目以及 AWS 的机器学习 AMI 的基础组件。
Anaconda 资源库中的 Python 和 R Conda 软件包在安全环境中进行编译,因此,科研机构与企业可以获得在本地系统上正常工作的优化二进制文件。结合 Conda 的虚拟环境和深度依赖管理,用户可以轻松地在 Windows,Linux 和 MacOS 系统中重现相同的数据科学结果。Anaconda 资源库中的1,000多个软件包对所有人都是免费的,同时,anaconda.org 上还提供 Conda 软件包建设者的 Conda Forge 社区。
一方面,Python 已逐步抛离 R 语言,成为数据科学的事实标准;另一方面,将 Python 数据科学生态圈整合的 Anaconda,也逐步成为了类似 Cloudera 对于 Hadoop 生态圈的角色。Anaconda 提供的数据科学生态圈组件特性包括:
- 超过 1,000个 Anaconda 策划和社区数据科学软件包;
- 支持各种 IDE 开发数据科学项目,包括:Jupyter,JupyterLab,Spyder 和 RStudio;
- 支持 Dask,numpy,pandas 和 Numba 分析数据的可伸缩性和性能;
- 支持 Bokeh,Datashader,Holoviews 或 Matplotlib 可视化数据;
- 支持 Scikit-learn,Tensorflow,h20 和 theano 创建机器学习和深度学习模型;