《2020 年中国 AI 基础数据服务行业研究报告》是艾瑞咨询发布的行业研究报告。报告对 2020 年中国 AI 数据服务行业商业市场发展态势和原因进行分析阐述,产出了目前市场中的独家市场数据,旨在向市场提供更多的参考依据。[……]
标签: Dataset
UC 圣地亚哥大学开源新冠肺炎 CT 数据集
截至 2020 年 3 月 30 日,在全世界范围内已有 775,306 人感染新冠肺炎,37,083 人死亡。对此疾病检测的低效和缺乏成为控制其传播的主要障碍。目前的检测主要基于逆转录聚合酶链反应(RT-PCR),需要 4 到 6 个小时才能获得结果。与新冠肺炎可怕的传播速度相比,这远不够快。除了效率低下之外,RT-PCR 检测试剂盒也非常短缺。
这促使研究团队去研究替代的检测方式。这些方式可能更快,比 RT-PCR 便宜,更容易获得,但与 RT-PCR 一样准确。在众多可能性中,研究团队对 CT 图像尤其感兴趣。有几篇著作研究了 CT 图像在筛选和检测新冠肺炎时的效果,结果鼓舞人心。[……]
DeepLesion:最大开源临床医疗图像数据集
NIH 临床中心最新公布了一个迄今规模最大的多类别、病灶级别标注临床医疗 CT 图像开放数据集 DeepLesion,研究人员在此基础上训练深度神经网络,创建了一个具有统一框架的大规模通用病灶检测器,能够更准确、更自动地衡量患者体内所有病灶的大小,实现全身范围的癌症初步评估。数据集包含:
- 4,427 名独立的匿名患者
- 10,594 次 CT 扫描(平均每位患者有 3 次随访)
- 32,735 个带标记的病灶实例
- 一共 928,020 张 CT 横切图像(512×512 分辨率)
[……]
新型冠状病毒肺炎 (COVID-19) 数据集汇总
『山川异域,风月同天』—— 新冠肺炎疫情牵动着举国上下的心,包括跨象乘云™ 在内,众多高科技企业除了向灾区捐赠物资,配合疫情防控工作,延期复工 / 远程办公的同时,也在积极探索如何利用大数据、新一代人工智能等新技术为『战疫』助力。
此前,跨象乘云™ 发布了多份新型冠状病毒肺炎(COVID-19)相关的数据集。随着关于新型冠状病毒病毒疫情的不断发展,有关疫情的各类信息和数据也在不断更新。结合日前『图灵公众号』(微信公众号:TOPIA)整理的新冠数据集,在这里作一个阶段性汇总。
- 微软、白宫发布的 COVID-19 开放研究数据集(COVID-19 Open Research Dat[……]
新冠肺炎开放知识图谱数据集更新
『山川异域,风月同天』—— 新冠肺炎疫情牵动着举国上下的心,包括跨象乘云™ 在内,众多高科技企业除了向灾区捐赠物资,配合疫情防控工作,延期复工 / 远程办公的同时,也在积极探索如何利用大数据、新一代人工智能等新技术为『战疫』助力。
此前,跨象乘云™ 发布了《新型冠状病毒肺炎特征分析数据》。另外,OpenKG 联合国内多家科研机构,发布了《新冠肺炎开放知识图谱数据集》以及《新冠肺炎开放知识图谱数据集 – Ver 1.1》。近日,OpenKG 继续更新发布多个新冠知识图谱数据集,其中包括哈尔滨工业大学构建的新冠概念图谱,武汉科技大学与东南大学联合构建的新冠防控图谱。同时,更新了由 IBM 中[……]
2020 年人脸识别数据集汇总
面向深度学习的人脸识别,是指能够识别或验证图像或视频中的主体的身份的技术。现今,现在相比于指纹或虹膜识别等传统上被认为更加稳健的生物识别方法,人们往往更偏爱人脸识别。让人脸识别比其它生物识别方法更受欢迎的一大不同之处是人脸识别本质上是非侵入性的。《人脸识别》课程将通过大量有趣的实验案例,让学生充分了解人脸识别的各项关键技术,包括:人脸定位,人脸关键点识别,人脸识别等。这里提供2020 年 16 套人脸识别数据集汇总,可用于人工智能实验室建设科研分析与教学应用。
1. The Japanese Female Facial Expression (JAFFE) Database
该数据[……]
新型冠状病毒肺炎开源项目
『山川异域,风月同天』—— 新冠肺炎疫情牵动着举国上下的心,包括跨象乘云™ 在内,众多高科技企业除了向灾区捐赠物资,配合疫情防控工作,延期复工 / 远程办公的同时,也在积极探索如何利用大数据、新一代人工智能等新技术为『战疫』助力。
其中,针对 2020 年初在武汉爆发的新型冠状病毒疫情,新型冠状病毒防疫信息收集平台项目,旨在收集各医院、酒店、工厂、物流、捐赠、捐款、预防、治疗、动态等信息,统一收集,统一发布,以便各方之间进行信息互通,有效调配社会资源。
另外,除了 2019-nCoV 的现状和如何防护是我们关注的重点,这个疫情的起源也是一个关注点,2019-nCoV 时间线项目,记[……]
韩国新型冠状病毒肺炎病例数据集
『山川异域,风月同天』—— 新冠肺炎疫情牵动着举国上下的心,包括跨象乘云™ 在内,众多高科技企业除了向灾区捐赠物资,配合疫情防控工作,延期复工 / 远程办公的同时,也在积极探索如何利用大数据、新一代人工智能等新技术为『战疫』助力。
此前,跨象乘云™ 引述了《新型冠状病毒肺炎特征分析数据》,及全球范围内《新型冠状病毒肺炎统计数据集》。近日,韩国疾控中心(KCDC,Korea Centers for Disease Control & Prevention)在 Kaggle 上更新了一个 COVID-2019 的全国病例数据集,共计 5,766 个病例。该数据集详细记录了韩国目前已经[……]
语音增强项目:Speech-enhancement
在语音识别与自然语言处理实验室建设过程中,语音数据是非常重要的科研资源之一。同时,语音数据面临的最大挑战在于在录制语音的过程中,周边环境噪音带来的对数据质量的影响。正因如此,Speech-enhancement 语音增强项目旨在建立一个语音增强系统来衰减环境噪声。
为了创建用于训练的数据集,收集了来自不同来源的英语语音的干净声音和环境噪音 —— 干净的声音主要来自 LibriSpeech:基于公共领域有声读物的 ASR 语料库。另外,使用了SiSec 的一些数据 —— 由总共 100 首不同风格的全音轨歌曲组成,包括混合物和四个原始音源及音干。环境噪声是从 ESC-50 数据集(完整版[……]
新型冠状病毒肺炎统计数据集
『山川异域,风月同天』—— 新冠肺炎疫情牵动着举国上下的心,包括跨象乘云™ 在内,众多高科技企业除了向灾区捐赠物资,配合疫情防控工作,延期复工 / 远程办公的同时,也在积极探索如何利用大数据、新一代人工智能等新技术为『战疫』助力。
此前,跨象乘云™ 引述了《新型冠状病毒肺炎特征分析数据》,来自发表于《中华流行病学杂志》相关论文,截至 2020 年 2 月 11 日中国内地报告的超过 7 万病例分析。近日,世界卫生组织发布了关于 2019 年新型冠状病毒感染病例数、死亡人数和恢复情况的信息,这是一个时间序列数据,因此任何一天的病例数都是累积数 —— 数据详细描述请访问 Kaggle 页面。[……]