架构及硬件选型一直是深度学习与新一代人工智能科研工作面临的第一个难题,本白皮书的目标正是一份作为选择能够为给定应用程序和平台实现正确速度/内存/精度平衡的检测架构的指南。为此,该团队研究了在现代卷积目标检测系统中交换速度和内存使用的准确性的各种方法。近年来已经提出了许多成功的系统,但是由于不同的基本特征提取器(例如,VGG,残留网络),不同的默认图像分辨率以及不同的硬件和软件平台,所以基于相同基础目标(“苹果”对“苹果”)的比较是很困难的。该团队提出了更快的 R-CNN,R-FCN,和 SSD 系统的统一实施,将其视为体系结构,并描绘出通过使用替代特征提取器创建的速度/精度折衷曲线,以及各种其他重要参数(如每个元架构中的图像大小)的变化。在速度和内存至关重要的这个频谱的一个极端,我们提出了一种实现实时速度并可以部署在移动设备上的探测器。在准确性至关重要的另一端,我们提供了一个检测器,可以实现在 COCO 检测任务上测量的最先进的性能。
由于论文较大,且连接速度较慢,跨象乘云™提供该论文的本地 PDF 下载。