最全 SpaceX 火箭数据开源

r/SpaceX 是 SpaceX 粉丝自发组织的社区,日常搜集整理 SpaceX 的火箭发射信息。

近日,SpaceX 粉丝把火箭有关信息贴到 GitHub,他们整理的 API,基本包含了 SPaceX 成立迄今的所有火箭数据。API 包含:SpaceX 的龙飞船、Starship、发射历史数据、核心舱、起落架、载荷信息等等,应有尽有。REST API 包含三大部分,clients、app (应用) 和原始数据。其中,API Clients 是对现有关于 SpaceX 的 API 合集,降低了以往信息查找、汇总的难度。

GitHub地址项目 GitHub 地址[……]

继续阅读

2020 年数据集资源更新

新增数据集

位置识别 Street-level Sequences 数据集

位于瑞典的 Mapillary 宣布发布了一款新产品 MapillaryStreet-Level Sequences 数据集,这是一款公开可用的数据集,可以对 AI 模型进行基准测试和训练,以实现大规模、终身的位置识别。终身位置识别是在地理定位图像数据库中查找查询图像的最相似位置的任务。

本周发布的 Mapillary Street-LevelSequence 数据集是一个 160 万个地理图像序列的集合,这些序列与元数据绑定在一起,用于训练地点识别算法。Street-LevelSequence 数据集既有商业版本,也有研究版本,介绍了用于终身位置识别的 MapillaryStreet-[……]

继续阅读

Google 18 万小时的海域录音助力保护座头鲸

近几年,人工智能已经走进了各个领域,以帮助人类更好的进行研究。近日,《纽约时报》报道称,机器学习为海洋『巨头』座头鲸的科学研究提供了很大帮助。AI 可以通过长达 18 万小时的太平洋海下录音,检测出座头鲸歌声出现的时间和地点。美国国家海洋与大气管理局生态学家联系 Google 寻求帮助,希望在所有其他海洋噪音(例如海豚的叫声或轮船发动机的声音)中找到座头鲸的歌声。Google 工程师利用带注释数据集(其中鲸鱼歌声和其他噪音已被识别出来)在十小时内训练出一个神经网络来探测鲸鱼的歌声,这个网络基于一个用于识别 Youtube 视频中声音的模型

事实上,AI 对于海洋研究用处很大,因[……]

继续阅读

CVPR 2020 Google 图像匹配挑战赛数据集

谷歌在 CVPR 2020 发起的图像匹配挑战赛,该比赛提供的数据集超过 2.5 万幅图像,包含精确的姿态和方向标注。这次比赛的任务更加偏向于三维重建中的图像匹配,从上图例中也可以看出,该数据集包含大量的大型建筑物在各种光线和不同视角拍摄的图像。比赛允许参与者参照传统局部特征的方法,先提取局部特征关键点再进行特征描述和图像匹配的策略;也欢迎不需要提取局部特征,一步到位计算出两幅图像对应姿态和方向的方法。

数据集总计109G,训练、验证、测试数据集均完整,供做图像匹配、局部特征提取方向的高校科研人员与人工智能、计算机视觉专业学生参考。你可以在这里下载。[……]

继续阅读

DFG 交通标志数据集

DFG 交通标志数据集,包括 200 个交通标志类别捕获在斯洛文尼亚公路跨越约 7,000 高分辨率图像。图像是由斯洛文尼亚 DFG 咨询公司提供和注释的。RGB 图像是通过安装在一辆汽车上的摄像头获得的,这辆汽车行驶在斯洛文尼亚六个不同的自治市。这些图像数据是在农村和城市地区获得的。从收集的大量数据中,只选择了包含至少一个交通标志的图像。此外,选择是这样进行的,通常有一个显着的场景变化之间的任何一对选定的连续图像。

该评价数据集称为 DFG 交通标志数据集是通过只关注具有足够数量样本的平面交通标志来创建的。每个类别至少有 20 个实例。边界框大小至少为 30 像素的样本被严格标注,而边[……]

继续阅读

奥迪大型自动驾驶数据集:A2D2

今天奥迪公司的研究人员在发布的论文 A2D2: Audi Autonomous Driving Dataset 中,公布了其大型自动驾驶数据集:A2D2,同时还配备了相关教程,并提供开放下载。数据集目标为推进计算机视觉、机器学习、自动驾驶的商用和学术研究。数据类型包含:RGB 图像,也包括对应的 3D 点云数据,记录的数据是时间同步的。标注类型包括:目标 3D 包围框,语义分割,实例分割以及从汽车总线提取的数据。数据规模:标注的非序列数据,41,227 帧,都含有语义分割标注和点云标签。其中含有前置摄像头视野内目标 3D 包围框标注 12,497 帧。另外,该库还包括 392,556 连续帧的[……]

继续阅读

2020 年中国 AI 基础数据服务行业研究报告

2020 年中国 AI 基础数据服务行业研究报告》是艾瑞咨询发布的行业研究报告。报告对 2020 年中国 AI 数据服务行业商业市场发展态势和原因进行分析阐述,产出了目前市场中的独家市场数据,旨在向市场提供更多的参考依据。[……]

继续阅读

UC 圣地亚哥大学开源新冠肺炎 CT 数据集

截至 2020 年 3 月 30 日,在全世界范围内已有 775,306 人感染新冠肺炎,37,083 人死亡。对此疾病检测的低效和缺乏成为控制其传播的主要障碍。目前的检测主要基于逆转录聚合酶链反应(RT-PCR),需要 4 到 6 个小时才能获得结果。与新冠肺炎可怕的传播速度相比,这远不够快。除了效率低下之外,RT-PCR 检测试剂盒也非常短缺。

这促使研究团队去研究替代的检测方式。这些方式可能更快,比 RT-PCR 便宜,更容易获得,但与 RT-PCR 一样准确。在众多可能性中,研究团队对 CT 图像尤其感兴趣。有几篇著作研究了 CT 图像在筛选和检测新冠肺炎时的效果,结果鼓舞人心。[……]

继续阅读

DeepLesion:最大开源临床医疗图像数据集

NIH 临床中心最新公布了一个迄今规模最大的多类别、病灶级别标注临床医疗 CT 图像开放数据集 DeepLesion,研究人员在此基础上训练深度神经网络,创建了一个具有统一框架的大规模通用病灶检测器,能够更准确、更自动地衡量患者体内所有病灶的大小,实现全身范围的癌症初步评估。数据集包含:

  • 4,427 名独立的匿名患者
  • 10,594 次 CT 扫描(平均每位患者有 3 次随访)
  • 32,735 个带标记的病灶实例
  • 一共 928,020 张 CT 横切图像(512×512 分辨率)

[……]

继续阅读