Anaconda 分发版是执行 Python 数据科学和机器学习最简单而且高效的平台,已经拥有超过 450 万用户。它包括数百种流行的 Python 数据科学软件包,以及用于Windows,Linux 和 MacOS 的 Conda 软件包和虚拟环境管理器。 其中,Conda 使安装,运行和升级复杂的数据科学和机器学习环境(如 scikit-learn,TensorFlow 和 SciPy)变得更加简单快捷;并且允许用户在多个 Python 版本之间并存以及自由切换的目标。 Anaconda 分发版同时也是数百万数据科学项目以及 AWS 的机器学习 AMI 的基础组件。
月度归档: 2018年1月
Python编程教育工具:Python Tutor
Python Tutor 是由 Philip Guo 开发的一个免费教育工具。可帮助学生攻克编程学习中的基础障碍,理解每一行源代码在程序执行时在计算机中的过程。通过这个工具,教师或学生可以直接在 Web 浏览器中编写 Python 代码,并一步一步可视化地执行程序。目前,已经有超过 180 个国家的 350 万人使用 Python Tutor 来查看 3,000 多万条代码。同时,很多高等院校也将其作为教科书,讲座和在线教程的补充。
项目GitHub地址[……]
2017年最佳机器学习开源项目(30项 – 下篇)
续上篇:
第21位:Face classification
基于 Keras CNN 模型与 OpenCV 的 fer2013 / imdb 数据集实时面部检测和表情/性别分类及训练模型。其中:
- IMDB性别分类测试准确率:96%。
- fer2013情感分类测试准确率:66%。
第22位:Speech to Text WaveNet
使用 DeepMind 的 WaveNet 和 TensorFlow 构成[……]
2017年最佳机器学习开源项目(30项 – 中篇)
续上篇:《2017年最佳机器学习开源项目(30项 – 上篇)》
第11位:Style2Paints
AI 漫画稿在线上色工具,通过人工智能,将线稿的风格转换为彩色漫画风格。该项目同时提供了在线体验网站根据不同的涂色风格,获得各种上色图片。特别值得关注的是该项目由苏州大学发布,是中国科研机构在本列表中排名最高的项目。
扩展阅读:Style2paints:专业的AI漫画线稿自动上色工具
第12位:Tensor2Tensor
由 Google Brain 发布的用于广义序列与序列模型的工具库,是一个用于在 TensorFlow 中训练深度学习模型的开源系统。[……]
2017年最佳机器学习开源项目(30项 – 上篇)
Mybridge AI 公司对比了 GitHub 上近 8,800 个开源机器学习项目,并挑选了其中最好的 30 个,在 Medium 上发布。这是一个具有很强竞争力的列表,其中包含 2017 年 1 月 – 12 月份开源的各类优秀机器学习库、数据集和应用;通过流行度、参与度和新鲜程度来对它们进行评级,它们的 GitHub 平均评星总数达到 3,558 个。一个参考值是 TensorFlow 作为全球最受欢迎的深度学习开发框架,目前在 GitHub 上的评星为已接近 85,000个。开源项目对于数据科学家而言非常有意义,可以通过阅读源代码,在前人的基础上构建更加强大的项目。现在,科研机构与企[……]
开源强化学习环境:Control Suite
DeepMind 最近开源的强化学习环境 Control Suite,相比 OpenAI Gym,它拥有更多的环境,更易于阅读的代码文档,同时更加专注于持续控制任务。Control Suite 基于 Python,由 MuJoCo 模拟物理引擎提供支持。
完整的 DeepMind Control Suite + MuJoCo 套件,既是一套面向科研强大的强化学习(Reinforcement Learning)智能体性能评估基准;同时,又是一套完整的机器人模拟全仿真教学 Python 库。
项目GitHub地址[……]
TensorFlow 1.5.0-rc0
最佳新一代人工智能科研开放数据集
Luke de Oliveira 与几位数据科学与机器学习专家在 Medium 上共同发布了一份,新一代人工智能时代最佳科研数据资源的列表,里面详尽的列举了在深度学习与新一代人工智能各个主要领域的科研数据,同时将数据集分为了经典,科研,有用,陈旧几个等级。在构建人工智能或机器学习系统比以往的时候更加容易的今天,借助良好的科研数据资源与云计算平台,任何人都能用笔记本电脑去训练出最前沿的机器学习模型。
受国内的开放数据环境所限,很多高等院校,科研机构尽管已经设置了大数据处理分析底层架构,然而在真正进行深度学习与新一代人工智能科研项目的过程中,却往往缺乏用于模型训练的专用数据集。虽然不算是人工[……]
开源语音识别工具包:wav2letter
Facebook AI 研究院开源了端到端语音识别系统 wav2letter,一套简单高效的自动语音识别系统(ASR)。如果你想要立刻进行语音转录,项目还提供了在 Librispeech 数据集上预训练的模型。
项目GitHub地址[……]
Docker如何提升数据科学与深度学习科研效率?
跨象乘云™融能平台,是基于容器架构的深度学习与新一代人工智能科研教学一体化实验平台,满足多个科研项目、云服务层、系统框架、以及科研与教学环境之间所需要的集群管理,调度与隔离需求。通过统一的可视化基础架构管理界面,提升数据科学与深度学习科研工作效率。
今天,以 Docker 为代表的容器技术逐步取代虚拟主机,成为云计算架构下的基本业务单位。几乎所有软件工程师都在使用容器来开发,测试,部署新的应用程序 —— 不单是因为容器具有更全面的开源生态系统;同时,卸载掉底层操作系统,大幅度降低容器镜像的体积,相对于虚拟主机而言,容器变得更适合在互联网实现发布。如 Docker Hub 等公共容器云服务[……]