AI 挑战赛 – 零样本学习实验赛

AI Challenger(AIC)全球 AI 挑战赛,根据平台公告的数据,在 2017 年,有来自 65 个国家的 8,892 支队伍参赛,属于目前国内较大的非商业化竞赛平台。2017 年主赛道与实验赛道命题分别包括:

  • 英中机器同声传译:挑战同声传译中的语料无标点、无断句、口语化、以及夹杂语气词等问题。语言翻译方向为英文到中文。
  • 英中机器文本翻译:用大规模的数据,提升英中文本机器翻译模型的能力。语言翻译方向为英文到中文。
  • 场景分类:寻找一个更棒的场景分类模型,解决图片的角度、尺度、和光照的多样性问题。
  • 人体骨骼关键点检测:挑战复杂生活场景中的人体检测,并预测多种复[……]

    继续阅读

Python 网站日志分析工具

日志分析在 Web 系统中故障排查、性能分析方面有着非常重要的作用。该项目的侧重点不是通常的 PV,UV 等展示,而是在指定时间段内提供细粒度(最小分钟级别)的异常定位和性能分析。这是一个基于 ——

  • Python 3.4+
  • pymongo 3.4.0+
  • MongoDB server

架构的日志分析系统。其特点在于:

  1. 支持统一的日志分析入口:可查看站点所有的服务器产生的日志的汇总分析;
  2. 支持根据时间段和服务器两个维度进行过滤;
  3. 支持对 request_uri,IP 和 response_code 进行分析,基于请求数、响应大小、响应时间三个大维度[……]

    继续阅读

Keras 官方中文版文档

Keras 是一个用 Python 编写的高级神经网络 API,它能够以 TensorFlow、CNTK、或者 Theano 作为后端运行。Keras 的开发重点是支持快速的实验。能够以最小的时延把你的想法转换为实验结果,是做好研究的关键。这一次发布的是 Keras 官方中文文档,它得到了严谨的校对而提升了整体质量。但该项目还在进行中,虽然目前已经上线了很多 API 文档和使用教程,但仍然有一部分内容没有完成。

如果你有如下需求,请选择 Keras:

  • 允许简单而快速的原型设计(用户友好,高度模块化,可扩展性)[……]

    继续阅读

可视编程神经进化算法开发工具:VINE

尽管最近受自动驾驶事件影响。Uber 开源了神经进化算法开发的交互式可视化工具 VINE,该工具可以轻松实现神经网络群体的各种特定指标以及适应度分数的可视化和随时间的变化,用户可对其进行实时评估。此外,VINE 还支持默认功能之外的高级选项和自定义可视化。

对于 Uber 来说,机器学习的发展可以大大增强运输的安全性和可靠性。Uber AI Labs 最近宣布的深度神经进化就是其中一个例子,其中涉及的进化算法可以帮助训练深度神经网络,以解决棘手的强化学习(RL)问题。最近,人们对深层神经进化的兴趣越来越浓厚,该领域研究人员对相应工具的需求也越来越大。而且在神经进化和神经网络优化方面,学习[……]

继续阅读

UC Berkeley 经典课程:计算机程序结构与解释

UC Berkeley 经典课程 —— CS 61A: Structure and Interpretation of Computer Programs (计算机程序的结构和解释)是计算机科学的入门课程。该课程主要教授关于编程的知识,而不是如何使用某种特定的编程语言。同时,考虑到一系列控制程序复杂性的技术,例如函数式编程,数据抽象和面向对象编程。掌握特定的编程语言是研究这些通用技术的非常有用的副作用。但是,一旦学生了解了编程的本质,会发现掌握一门新的编程语言只是几天的工作。

课程大纲覆盖范围包括:LISP 概览,计算过程,高阶过程,复合数据,Henderson-Escher的例子,符号[……]

继续阅读

牛津大学《中国人工智能发展报告》

日期,牛津大学发布了一份名为《解密中国人工智能梦想》(Deciphering China’s AI Dream)的报告。该报告论述了中国人工智能的发展环境、布局、能力及未来可能带来的影响。报告指出,中国的人工智能发展政策可能对国家安全、经济发展、社会治理等带来深远影响。[……]

继续阅读

开源学术论文书写工具:Texture

此前,跨象乘云™介绍了用于编写《深度学习》(花书 —— 中文版)的论文排版工具:LaTex。而今天介绍的 Texture 同样是一个用于生产科学论文或内容的工具,它使用 Dar 格式,因此也严格定义了 JATS Archiving and Interchange Tag Set(「green」v.1.1)XML 格式标准。相对而言,LaTex 对作者的编辑技术要求更高,对于不习惯使用 LaTex 的科研工作者,可以考虑使用 Texture 这个开源学术论文书写工具来编排自己的科研论文,Texture 提供在线演示或直接下载软件桌面版

GitHub地址项目GitHub地址[……]

继续阅读

教程:LSTM 模型预测电子货币价格

深度学习区块链结合在一起的实验案例,看起来是一个不错的主意。David Sheehan 使用一个长短时记忆(LSTM)模型 —— 深度学习中一个非常适合分析时间序列数据的特定模型(或者任何时间/空间/结构序列数据,例如电影、语句等);做了一个预测加密电子货币的价格趋势的实验案例。除了此前的比特币价格预测以外,该实验案例还包含了对以太坊协议货币的趋势预测。

如果你真的想了解其中的基础理论,那么我推荐你阅读这三篇文章:《理解 LSTM 网络》、《探究 LSTM》、原始白皮书。为了尽量吸引更多的非专业机器学习爱好者,实验中大幅度减少代码的篇幅。如果你想自己使用这些数据或者建立自己的模型,本[……]

继续阅读