算法模型科研加速库

深度学习(DL)在很多技术领域中都已获得广泛应用,包括机器翻译、语音识别、语法分析、图像信息描述和物体识别等。然而,大部分当前科研领域的深度学习系统大多为特定的任务进行了专门的设置,只适用于特定的问题和架构;对于一份新的数据,每个科研项目从一开始便需要大量的人力资源,进行特征工程,并耗费了大量的GPU硬件资源和时间,才最终获得一个表现优良的深度学习模型。

深度学习最佳算法模型科研加速库软件(简称:KXCY-AI-D2T),构建于 TensorFlow 框架之上,定义了深度学习系统所需的各个组件:数据集、模型架构、优化器、学习速率衰减方案、超参数等等。所有这些组件之间的标准对接形式,并且集成了当前机器学习的最佳算法模型。科研人员可以选择任何一组数据集、模型、优化器,然后设定超参数,开始训练,并查看它的性能。

通过架构的模块化,在输入和输出数据之间的每一块都是张量到张量的函数,无须改动整个模型,仅需保留嵌入部分、损失函数和其他所有部分,用自己的函数替换模型体的一部分,该函数将张量作为输入,并返回一个张量。基于统一科研流程接口的加速库,意味训练无需局限在一个特定的模型或数据集上。科研人员可以在不同领域的多任务上训练一个单一模型,甚至还可以同时在所有的数据集上训练一个单一模型。

针对经典深度学习与新一代人工智能科研数据集 ——

深度学习最佳算法模型科研加速库软件(以下简称:KXCY-AI-D2T)软件,是一套十分强大的深度学习系统,在多个任务上的表现都非常抢眼 —— 尤其在机器翻译问题上,单模型的表现就可以超过之前方法的继承模型。通过将特定领域数据集与『预训练』深度学习最佳实践算法的紧密匹配,加速科研项目效率。同时,支持自定义模型扩展来满足科研项目特定的需求。这一套系统的模型结构、训练和优化技巧等,可以被利用到公司的产品线上,直接转化为生产力。同时,软件支持多 GPU 机器进行同步分布式训练( 1 主节点,多从节点),和进行异步分布式训练(相互独立的节点通过参数服务器同步)。采用统一注册机制实现轻松添加新的组件的功能,并可以轻松的在它们之间进行切换使用。