『山川异域,风月同天』—— 新冠肺炎疫情牵动着举国上下的心,包括跨象乘云™ 在内,众多高科技企业除了向灾区捐赠物资,配合疫情防控工作,延期复工 / 远程办公的同时,也在积极探索如何利用大数据、新一代人工智能等新技术为『战疫』助力。
此前,跨象乘云™ 发布了多份新型冠状病毒肺炎(COVID-19)相关的数据集。随着关于新型冠状病毒病毒疫情的不断发展,有关疫情的各类信息和数据也在不断更新。结合日前『图灵公众号』(微信公众号:TOPIA)整理的新冠数据集,在这里作一个阶段性汇总。
- 微软、白宫发布的 COVID-19 开放研究数据集(COVID-19 Open Research Dataset Challenge (CORD-19)):为了应对 COVID-19 大流行,白宫和一个主要研究小组联盟准备了 COVID-19 公开研究数据集(CORD-19)。CORD-19 是一个拥有超过 44,000 篇学术文章的资源,包括 29,000 篇关于 COVID-19、SARS-CoV-2 和相关冠状病毒的全文。这个免费的数据集提供给全球研究界,以应用自然语言处理和其他人工智能技术的最新进展,产生新的见解,支持正在进行的对抗这种传染病的斗争。由于新冠状病毒文献的快速增加,使得医学研究社区难以跟上,因此这些方法的紧迫性日益增加。总数据量超过 4 GB。
- 武汉新冠肺炎时间线(wuhan2020-timeline):时间线梳理以官媒信息为经,以民营媒体、自媒体为纬,以事系日,着力关注疫情扩散与舆论场域,力图呈现武汉新冠肺炎始末。(Academic2019-nCoV项目自 1 月 28 日每天发布关于海外疫情的详尽信息,与本项目互补。)
- 新型冠状病毒肺炎特征分析数据:中国疾病预防控制中心发布迄今最大规模的新冠肺炎流行病学特征分析,其原始数据(COVID-19 特征总表)来自截至 2020 年 2 月 11 日中国内地报告的超过 7 万病例。
- 胸部放射影像数据集:CheXpert:该数据集包含来自 65,240 个病人的 224,316 张胸部放射影像,这些影像中标注了 14 种常见的胸部放射影像观察结果。作者设计了一个标注工具,它能够从放射报告文本中提取观察结果并使用不确定性标签捕捉报告中存在的不确定性。
- 韩国 COVID-19 新冠肺炎胸片图像数据集(COVID-19 image data collection):2019 年的新型冠状病毒(COVID-19)呈现出几个独特的特征。虽然诊断是通过聚合酶链反应(PCR)确诊的,但感染肺炎的患者可能出现在胸部 X 线和计算机断层扫描(CT)图像上,其模式仅为人眼 Ng 的中度特征,2020年。COVID-19 的传播率取决于我们以低假阴性率可靠地识别受感染患者的能力。此外,低误报率是必要的,以避免进一步增加医疗系统的负担,不必要地让病人接受隔离,如果不需要隔离的话。除了适当的感染控制外,很明显,及时发现疾病将使受 COVID-19 影响的患者能够实施所需的所有支持性护理。我们的目标是利用这些图像来开发基于人工智能的方法来预测和理解感染。我们的团队将使用开源的 Chester AI Radiology Assistant 平台来发布这些模型,该平台的设计是通过在本地执行计算来满足全球需求。
- 韩国新型冠状病毒肺炎病例数据集(Data Science for COVID-19 (DS4C)):该数据集此前曾在跨象乘云™ 发布,目前已更新 ——COVID-19 在韩国已经感染了 8,000 多人。韩国疾病预防控制中心(KCDC)迅速、透明地公布了 COVID-19 的信息。基于 KCDC 和地方政府的报告材料,我们构建了一个结构化的数据集。此外,我们还使用各种数据挖掘或可视化技术分析和可视化数据。
- 新冠病毒时序数据集(Novel Corona virus – COVID19):这种新型冠状病毒已经在世界范围内产生了影响。它影响了来自不同国家的人。该数据集提供了一个时间序列数据,跟踪受该病毒影响的人数、该病毒造成的死亡人数以及已报告的康复人数。更新源自跨象乘云™ 此前发布的:2019 Novel Coronavirus COVID-19 (2019-nCoV) Data Repository by Johns Hopkins CSSE。
- 英国的冠状病毒追踪器(COVID-19: track coronavirus cases):仪表板显示英国报告的冠状病毒病例,包括新病例,英格兰上级地方当局的病例以及死亡人数。可下载数据包括:日常指标、每日确诊病例数、NHS 英格兰地区病例表、UTLA 病例表。
- 各国名人感染名单(Celebrities with Corona)。
- 跟踪 COVID-19(Coronavirus COVID-19 Global Cases by the Center for Systems Science and Engineering (CSSE) at Johns Hopkins University (JHU)):跟踪 COVID-19 在交互式仪表板上实时传播,并提供可供下载的数据。
- Coronanalytics:冠状病毒每日分析 —— 这个简单的网站,可以看到大家都在谈论的曲线。媒体只提供今天的数字,所有的图表显示的是累计总数,而不是每天的案件。通过观察每天病例的增长或减缓,更容易看出趋势并了解指数增长是否正在发生。这个网站使用了来自2019 Novel Coronavirus COVID-19 (2019-nCoV) Data Repository by Johns Hopkins CSSE 的数据,这些数据随后被处理以显示每天的新病例,而不是累积总数。他们在协调世界时晚上 11:59 更新它,所以它不一定有今天的数据,有时今天的数据会显示为零(遗憾的是,这并不一定意味着这个国家没有病例!)
- 新冠肺炎开放知识图谱数据集:由 OpenKG 联合国内多家科研机构合作发布。跨象乘云™ 此前一直在密集跟踪并更新(1, 2, 3)。
- 新型冠状病毒时间表(Tracking coronavirus: Map, data and timeline):全球冠状病毒(2019-nCoV,正式称为SARS-CoV-2或COVID-19)的地图,数据和时间表。
- 新型冠状病毒研究资源(COVID-19 Open Research Dataset (CORD-19)):COVID-19 大流行,艾伦人工智能研究所已与领先的研究小组准备和分发 COVID-19 开放研究数据集(CORD-19),免费资源超过 44,000 学术文章,包括超过 29,000 全文,COVID-19 和冠状病毒的病毒家族使用的全球研究社区。该数据集旨在动员研究人员应用自然语言处理的最新进展,以产生新的见解,支持与这种传染病的斗争。随着新的研究成果发表在同行评审的出版物和 bioRxiv、medRxiv 等档案服务上,语料库将每周更新一次。
- 新型冠状病毒 News Hub(CORONAVIRUS: THE HUB):来自世界上最可信赖的来源的 COVID-19 新闻,分析和最佳实践的集合。
- 新型冠状病毒经济影响指数(COVID 19 – economic effects):新型冠状病毒对 GDP 的影响。
- 新型冠状病毒仪表板(nCoV2019.live):实时冠状病毒仪表板跟踪器。查看数据,地图,社交媒体趋势,并了解预防措施。
- 2019 新型冠状病毒数据(2019 Wuhan Coronavirus data (COVID-19 / 2019-nCoV)):该公共存储库会随着时间的推移从网络上的各种公共来源存档数据。
- 新型冠状病毒追踪器(Coronavirus Tracker):最快的实时服务,可跟踪武汉病毒,它提供实时数据以及 COVID-19 冠状病毒的全球冠状病毒新闻报道更新。
- 日冕地图:日冕病毒大流行在空间和时间上的映射。