Tensor2Tensor(简称 T2T )是一个深度学习模型和数据集的库,旨在使深入学习更容易获取并加速机器学习研究。 由 Google Brain 团队和用户社区内的研究人员和工程师积极使用和维护。 可以通过加入 T2T 的 Google 群组,了解并讨论 T2T 的最新发展动态。
此前,Google 发表了以一个模型库满足所有深度学习目标的 《Attention Is All You Need》和《One Model To Learn Them All》论文,并且很快发布了利用 Tensor2Tensor 加速深度学习科研进程的项目 Blog,及项目 GitHub,很快便成为 2017 年 GitHub 上机器学习最受欢迎的项目之一。通过将数据集与深度学习最佳实践算法的紧密匹配,加速 TensorFlow 在图像识别,语言模型,情感分析,语音识别,主题提取,以及翻译领域上的科研效率。另一方面,不同领域之间的最佳机器算法模型,甚至可以实现跨领域的应用验证,从而进一步促进科研成果的产生。
在深度学习科研过程中,训练并验证一个模型往往需要花费大量的时间,并耗费高昂的硬件投资成本;得到一个算法模型的最佳实践,背后可能经历了上千百个小时的训练。正因如此,机器学习算法模型已经在 Algorithmia 上进行公开交易。此次,T2T 无疑为深度学习与新一代人工智能的科研工作者提供了一笔宝贵的资产,
最后,Google 还提供了 iPython Notebook,解释了 T2T 原理,并通过 Google 提供的免费虚拟机在本地浏览器中运行,无需安装。 或者,在只需在本地电脑键入以下代码,便能完成从:安装 T2T ,下载 MNIST 数据集,训练一个模型,并对其进行评估的全部操作 ——
--generate_data \
--data_dir=~/t2t_data \
--output_dir=~/t2t_train/mnist \
--problems=image_mnist \
--model=shake_shake \
--hparams_set=shake_shake_quick \
--train_steps=1000 \
--eval_steps=100