新一代 MNIST 数据集 – QMNIST

在机器学习研究中,MNIST 手写数字图像数据集已经作为基准使用了二十余年。该数据集虽然经典,但也存在测试集过小等问题。近日,来自 Facebook 和纽约大学的研究者重建并扩展了该数据集,在测试集中新增了 50,000 个样本。MNIST 作者之一的 Yann LeCun 在推特中表示

如果多次使用原版的 MNIST 测试集,你的模型可能在测试集上已经过拟合了。是时候在新增的样本上试一下了。

MNIST 是一个由 Yann Lecun 等人创建的手写数字图像数据集,是研究者研究机器学习、模式识别等任务的高质量数据库。它包含训练集和测试集,训练集包含 60,000 个样本,测试集[……]

继续阅读

智能商务实战案例库

随着『新零售』概念与电子商务的兴起,零售活动现今已不局限于线下场景。目前,传统零售业正在向『新零售』的架构进行转型,而其中必不可缺的则是人工智能,机器学习,视觉识别等前沿技术与黑科技。跨象乘云™ 为高校大数据与人工智能实验室,大数据与人工智能实验平台建设,提供海量实战项目案例库,360° 全方位覆盖数据科学、机器学习、深度学习与新一代人工智能技术在金融行业的各方面应用 ——

  • 商品识别与搜索:通过图像识别技术,提升智能导购,库存核算,商品搜索等零售业务系统效能。
  • 智能推送:结合协同过滤、关联规则、知识内容等推荐系统技术,实现个性化商品推送,提升销量。
  • 行为轨迹预测:利用海量[……]

    继续阅读

2020 年数据集资源更新

新增数据集

《深度学习》课程

本课程,是更全面介绍深度学习各类神经网络:CNN、RNN、LSTM 及框架:TensorFlow,Keras,Caffe 等的进阶课程。学生在本课程中将进一步学习深度学习的技术、术语和数学原理,理解基础神经网络架构、前馈网络、卷积网络和循环网络结构,认识如何恰当地构建和训练这些模型,了解并解释深度学习的实际应用,并使用“预训练”模型达到最佳结果。同时,配合神经网络训练可视化引擎,以及项目实现代码,让学生更为直观的了解深度学习技术在经典数据集 MNIST,CIFAR-10 上的工作过程。学生在完成本课程后,将能独立完成时装服饰图片分类,电影评论文字分类,房地产价格回归预测,使用循环神经网络实现文[……]

继续阅读

超越 ReLU 的激活函数:GeLU

NLP 领域里,GeLU 已经成为了众多业内最佳模型的选择。

作为决定神经网络是否传递信息的「开关」,激活函数对于神经网络而言至关重要。不过今天被人们普遍采用的 ReLU 真的是最高效的方法吗?最近在社交网络上,人们找到了一个看来更强大的激活函数:GeLU,这种方法早在 2016 年即被人提出,然而其论文迄今为止在 Google Scholar 上的被引用次数却只有 34 次。其实,GeLU 已经被很多目前最为领先的模型所采用。据不完全统计,BERT、RoBERTa、ALBERT 等目前业内顶尖的 NLP 模型都使用了这种激活函数。另外,在 OpenAI  声名远播的无监督预训练模型[……]

继续阅读

新一代人工智能科研数据集

近日,skymind.ai 发布了一份非常全面的开源数据集。内容包括生物识别、自然图像以及深度学习图像等数据集,现将最近新增数据集整理如下 ——

  • 开源生物识别数据。
    http://openbiometrics.org/
  • Google Audioset:扩展了 632 个音频分类样本,并从 YouTube 视频中提取了 2,084,320 个人类标记的 10 秒声音片段。
    地址:https://research.google.com/audioset/
  • Uber 2B trip data:首次展示 2 百万公里的出行数据。
    地址:https://movement.ub[……]

    继续阅读

算法模型科研加速库

深度学习(DL)在很多技术领域中都已获得广泛应用,包括机器翻译、语音识别、语法分析、图像信息描述和物体识别等。然而,大部分当前科研领域的深度学习系统大多为特定的任务进行了专门的设置,只适用于特定的问题和架构;对于一份新的数据,每个科研项目从一开始便需要大量的人力资源,进行特征工程,并耗费了大量的GPU硬件资源和时间,才最终获得一个表现优良的深度学习模型。

深度学习最佳算法模型科研加速库软件(简称:KXCY-AI-D2T),构建于 TensorFlow 框架之上,定义了深度学习系统所需的各个组件:数据集、模型架构、优化器、学习速率衰减方案、超参数等等。所有这些组件之间的标准对接形式,并且集[……]

继续阅读

计算机视觉各研究方向汇总

所谓计算机视觉,即 compute vision ,就是通过用计算机来模拟人的视觉工作原理,来获取和完成一系列图像信息处理的机器。计算机视觉属于机器学习在视觉领域的应用,是一个多学科交叉的研究领域,涉及数学,物理,生物,计算机工程等多个学科,由此也可以想象到计算机视觉的研究范围非常广,也是图像,语音,自然语言处理领域中从业人数最多的。

1. 图像分类

1.1 基本概念

图像分类是计算机视觉中最基础的一个任务,也是几乎所有的基准模型进行比较的任务,从最开始比较简单的 10 分类的灰度图像手写数字识别 mnist ,到后来更大一点的 10 分类的 cifar10 和 100 分类的cifar[……]

继续阅读

TensorFlow 简介与概览 – Part 6/8

自动编码器

自动编码器是其中一种更简单的 “无监督学习” 形式,其采用编码器 — 解码器架构,并学习生成输入数据的精确副本。由于编码表征比输入数据小得多,此网络被迫学习如何生成最有意义的表征。

其 Ground truth 数据来自输入数据,因此无需人工操作。换言之,此网络可自我监督。其应用包括无监督嵌入、图像降噪等。但最重要的是,其 “表征学习” 的基本思想是下个部分的生成模型与所有深度学习的核心。在这个 TensorFlow Keras 教程 中,您可以探索自动编码器在以下两方面的功能:

  1. 对输入数据进行降噪
  2. 在 MNIST 数据集中生成嵌入

[……]

继续阅读

TensorFlow 简介与概览 – Part 3/8

卷积神经网络 (CNN)

CNN(又名 ConvNet)是一种前馈神经网络,其使用空间不变性技巧来有效学习图像中最常见的局部模式。举例而言,若图像左上方与右下方的猫耳拥有相同的特征,我们便可将其称为空间不变性。CNN 可跨空间共享权重,从而更高效地检测出猫耳及其他模式。

CNN 不是只使用密集连接层,而是使用卷积层(卷积编码器)。这些网络可用于图像分类、对象检测、视频动作识别,以及任何在结构上具备一些空间不变性的数据(例如语音音频)。

了解用于对 MNIST 数据集中的手写数字进行分类的 CNN 示例。我们利用影像变形技术创造梦幻般的精彩扭曲效果,并通过数据集之外生成的高[……]

继续阅读