新冠肺炎开放知识图谱数据集 – Ver 1.1

『山川异域,风月同天』—— 新冠肺炎疫情牵动着举国上下的心,包括跨象乘云™ 在内,众多高科技企业除了向灾区捐赠物资,配合疫情防控工作,延期复工 / 远程办公的同时,也在积极探索如何利用大数据、新一代人工智能等新技术为『战疫』助力。

此前,跨象乘云™ 发布了《新型冠状病毒肺炎特征分析数据》。另外,OpenKG 联合国内多家科研机构,发布了新冠肺炎开放知识图谱数据集。今天,该数据集进行了 V1.1 版本的更新 ——

  • 新冠百科图谱(更新)——  相较于第一版,第二版修改了数据爬取范围,通过重新抓取百科数据,提升了整个图谱数据规模。实体数扩展至 54,318,三元组数扩展至 270,807,关系数和属性数分别扩展至 22 和 50 个。对百科实体进行了类别推断,根据不同类别的实体特点,拓展了 schema 的属性部分。通过三元组和文本分析挖掘和构建了新的实体关系网络。
  • 新冠科研图谱(更新)—— 科研图谱新增病毒药物、病毒亲缘关系、新冠病毒基础信息三个数据库和数据集,并更新病毒分类图谱。
  • 新冠健康图谱(新增)—— 新冠健康图谱由清华大学和北京妙医佳健康科技联合构建,包含跟新冠肺炎相关的各类疾病、药物、症状、检查、全国各地接收新冠肺炎定点医院等信息。
  • 新冠物资图谱(新增)—— 新冠物资图谱包含防控新型冠状病毒所需要的各类物资,主要包括医用防护装备、日常防护用品、医用诊疗设备以及治疗用药。其中,医用防护装备包含了医用手套、口罩、隔离服等;日常防护用品包含洗手液、消毒用品等;医用诊疗设备包含常规检查设备和氧疗设备;治疗用药包含了《新型冠状病毒感染的肺炎诊疗方案》多个版本中的中、西药品。
  • 新冠流行病学图谱(新增)——  新冠肺炎流行病学知识图谱包含了流行病学知识图谱 Schema 和基于此 Schema 定义的新冠肺炎资源实例(待更新)。其中流行病学知识图谱 Schema 重点刻画流行病学的基本概念、流行病学调查等内容,未包含『流行病学研究方法』、『预防与控制策略』、『临床治疗与预后』等内容,需要在后续版本中与其他新冠肺炎知识图谱集成或连接。新冠肺炎资源实例包含了发生在 2019 年 ~ 2020 年 2 月期间,COVID-19 疫情中确诊患者的流行病学调查数据,这些数据来自中各省市卫健委公布的个案流调信息。新冠流行病学图谱可以助力对流行病调查、溯源、密切接触者追踪,为医护人员和疾病防控人员提供技术支持,加速流行病调查研究。
  • 新冠热点事件图谱(更新)—— 加入新的 150 份政府各部委的政策通告文件的事件抽取结果。添加 schema 中的政策事件的相关概念和属性。加入初期的事件类型标签。后期会进一步完善事件关键词抽取的结果。
  • 新冠临床图谱(更新)—— 根据最新的新冠肺炎诊疗方案第六版文件进行图谱模式更新及数据补充
    完善 schema中药及药品部分的属性和关系,中药新增属性药理作用、性味、性状、中药基原、适用症,药品新增子概念化学药、中成药,新增属性禁忌、适用症。
  • 新冠英雄图谱(更新)—— 构建新的实体关系网络,如人物间的队友、同事关系等。根据目前的疫情发展情况实时更新热点人物,拓展图谱规模。