Kaggle 上线 arXiv 完整数据集

众所周知,arXiv 是我们搜索、浏览和下载学术论文的重要工具。近 30 年来,arXiv 为公众和研究社区提供了开放获取学术论文的服务。这些论文涉及物理学的庞大分支和计算机科学的众多子学科,如数学、统计学、电气工程、定量生物学和经济学等等。

arXiv 上研究论文数量之多有利也有弊。一方面,对于在自身研究领域迅速成长的研究生,以及致力于用科研为公众提供服务的研究者而言,这一丰富的信息库可以提供极有效的助力。另一方面,arXiv 有时在搜索时也有不便。

与此同时,Kaggle 通常是数据科学家和机器学习工程师寻求有趣数据集、公开笔记和赛题的重要平台。研究者可以利用 Kaggle 上[……]

继续阅读

一行代码比较 arXiv 论文版本差别

在计算机领域中,目前的预打印版网站 arxiv 可谓是撑起了前沿技术的一片天地,每天都有相当数量的论文上传。但是对于一篇文章,作者可能会上传 V1 / V2 / V3 等版本,对于我来说,我一般看最后的版本就行,但是有些同学想要看看这些版本直接到底有什么不同,这可怎么办,总不至于要花几个晚上时间研究不同的版本?

最近 Github 上的一个比较预印本论文版本差别的工具也许能帮到你,关键是只需一行代码就能实现。最近 Github 上的一个比较预印本论文版本差别的工具也许能帮到你,关键是只需一行代码就能实现。

GitHub地址项目 GitHub 地址[……]

继续阅读

最全 SpaceX 火箭数据开源

r/SpaceX 是 SpaceX 粉丝自发组织的社区,日常搜集整理 SpaceX 的火箭发射信息。

近日,SpaceX 粉丝把火箭有关信息贴到 GitHub,他们整理的 API,基本包含了 SPaceX 成立迄今的所有火箭数据。API 包含:SpaceX 的龙飞船、Starship、发射历史数据、核心舱、起落架、载荷信息等等,应有尽有。REST API 包含三大部分,clients、app (应用) 和原始数据。其中,API Clients 是对现有关于 SpaceX 的 API 合集,降低了以往信息查找、汇总的难度。

GitHub地址项目 GitHub 地址[……]

继续阅读

2020 年数据集资源更新

新增数据集

位置识别 Street-level Sequences 数据集

位于瑞典的 Mapillary 宣布发布了一款新产品 MapillaryStreet-Level Sequences 数据集,这是一款公开可用的数据集,可以对 AI 模型进行基准测试和训练,以实现大规模、终身的位置识别。终身位置识别是在地理定位图像数据库中查找查询图像的最相似位置的任务。

本周发布的 Mapillary Street-LevelSequence 数据集是一个 160 万个地理图像序列的集合,这些序列与元数据绑定在一起,用于训练地点识别算法。Street-LevelSequence 数据集既有商业版本,也有研究版本,介绍了用于终身位置识别的 MapillaryStreet-[……]

继续阅读

DFG 交通标志数据集

DFG 交通标志数据集,包括 200 个交通标志类别捕获在斯洛文尼亚公路跨越约 7,000 高分辨率图像。图像是由斯洛文尼亚 DFG 咨询公司提供和注释的。RGB 图像是通过安装在一辆汽车上的摄像头获得的,这辆汽车行驶在斯洛文尼亚六个不同的自治市。这些图像数据是在农村和城市地区获得的。从收集的大量数据中,只选择了包含至少一个交通标志的图像。此外,选择是这样进行的,通常有一个显着的场景变化之间的任何一对选定的连续图像。

该评价数据集称为 DFG 交通标志数据集是通过只关注具有足够数量样本的平面交通标志来创建的。每个类别至少有 20 个实例。边界框大小至少为 30 像素的样本被严格标注,而边[……]

继续阅读

奥迪大型自动驾驶数据集:A2D2

今天奥迪公司的研究人员在发布的论文 A2D2: Audi Autonomous Driving Dataset 中,公布了其大型自动驾驶数据集:A2D2,同时还配备了相关教程,并提供开放下载。数据集目标为推进计算机视觉、机器学习、自动驾驶的商用和学术研究。数据类型包含:RGB 图像,也包括对应的 3D 点云数据,记录的数据是时间同步的。标注类型包括:目标 3D 包围框,语义分割,实例分割以及从汽车总线提取的数据。数据规模:标注的非序列数据,41,227 帧,都含有语义分割标注和点云标签。其中含有前置摄像头视野内目标 3D 包围框标注 12,497 帧。另外,该库还包括 392,556 连续帧的[……]

继续阅读

GitHub 开源轻量级人脸检测项目

1. libfacedetection

模型结构也比较简单,就是一个轻量级的 SSD 架构,共四个定位层,而且借鉴了 RetinFace 的关键点方法,可以同时回归 5 个关键点。模型体积只有 232 万,体积仅有 3.34 M。

2. Ultra-Light-Fast-Generic-Face-Detector-1MB

该模型是针对边缘计算设备设计的人脸检测模型。并提供了精简网络和 RFB 网络两种,在 320×240 的输入分辨率下 90~109 FPS 左右。

3. A-Light-and-Fast-Face-Detector-for-Edge-Devices

从名字可以看出来[……]

继续阅读

CVPR 2020 论文及开源项目汇总

日前,CVPR 2020 中选论文正式放榜,跨象乘云™ 为您带来了相关论文及对应开源项目的代码汇总项目 —— CVPR 2020 论文开源项目合集。该项目完整覆盖了新一代人工智能科研在:图像分类、目标检测、3D 目标检测、目标跟踪、语义分割、实例分割、视频目标分割、NAS、GAN、Re-ID、3D 点云、人脸检测、活体检测、人脸表情识别、人体姿态估计、场景文本检测、场景文本识别、模型剪枝、行为识别、人群计数、深度估计、视觉问答、视觉语言导航、视频压缩、行为轨迹预测、数据集等方面的多领域应用。

GitHub地址项目 GitHub 地址[……]

继续阅读

新型冠状病毒肺炎开源项目

『山川异域,风月同天』—— 新冠肺炎疫情牵动着举国上下的心,包括跨象乘云™ 在内,众多高科技企业除了向灾区捐赠物资,配合疫情防控工作,延期复工 / 远程办公的同时,也在积极探索如何利用大数据、新一代人工智能等新技术为『战疫』助力。

其中,针对 2020 年初在武汉爆发的新型冠状病毒疫情,新型冠状病毒防疫信息收集平台项目,旨在收集各医院、酒店、工厂、物流、捐赠、捐款、预防、治疗、动态等信息,统一收集,统一发布,以便各方之间进行信息互通,有效调配社会资源。

另外,除了 2019-nCoV 的现状和如何防护是我们关注的重点,这个疫情的起源也是一个关注点,2019-nCoV 时间线项目,记[……]

继续阅读