截至 2020 年 3 月 30 日,在全世界范围内已有 775,306 人感染新冠肺炎,37,083 人死亡。对此疾病检测的低效和缺乏成为控制其传播的主要障碍。目前的检测主要基于逆转录聚合酶链反应(RT-PCR),需要 4 到 6 个小时才能获得结果。与新冠肺炎可怕的传播速度相比,这远不够快。除了效率低下之外,RT-PCR 检测试剂盒也非常短缺。
这促使研究团队去研究替代的检测方式。这些方式可能更快,比 RT-PCR 便宜,更容易获得,但与 RT-PCR 一样准确。在众多可能性中,研究团队对 CT 图像尤其感兴趣。有几篇著作研究了 CT 图像在筛选和检测新冠肺炎时的效果,结果鼓舞人心。然而,出于对隐私的保护,这些研究中所使用的 CT 图像并不会公之于众,这极大地阻碍了基于 CT 图像的精准检测新冠肺炎先进人工智能方法的研发。
为了解决这个问题,研究团队构建了一个 COVID-CT 数据集,其中包含 275 个新冠肺炎检测呈阳性的 CT 图像,并向公众开放,以助于基于 CT 图像的新冠肺炎检测的研发。
研究团队从 760 个关于新冠肺炎的 medRxiv 和 bioRxiv 预印本中提取了 CT 图像,并通过阅读这些图像的标题人工筛选出具有新冠肺炎临床病症的图像。基于 183 个新冠肺炎 CT 图像和 146 个非新冠肺炎 CT 图像,研究团队训练了一个深度学习模型,以预测一个 CT 图像是否呈新冠肺炎阳性。
在 35 个新冠肺炎 CT 图像和 34 个非新冠肺炎 CT 图像上进行了测试,研究团队的模型 F1 值为 0.85。结果表明,CT 扫描有望用于筛选和检测新冠肺炎,然而还需要更先进的方法来进一步提高准确性。