局部渐进稀疏技术自动驾驶新数据集

NuScenes 最新研究发布了一个大型自动驾驶数据集,该数据集是首个包括 5 个雷达,1 个激光雷达,6 个摄像头,IMU 和 GPS 在内的完整传感器套件的数据集。 NuTonomy场景(NuScenes)比 KITTI 数据集多出 7 倍和 100 倍的图像,涵盖 23 个类别,包括不同类型的车辆,行人,移动设备及其他对象。

研究人员还发明了一种新的 3D 方法来整合各种物体检测的类别和任务,包括对物体大小,分类,方向,本地化,速度和属性的检测和估计。针对激光雷达和图像检测方法的数据集分析和基线测试证明,尽管仅基于激光雷达和仅基于图像的物体检测都能达到物体识别的要求,但仅激光雷达的网络性能更为优越。

NuScenes 能够加速自动驾驶方面的研究和技术,从而推进物体识别技术,并使相关技术更加实用化。我们希望研究人员鼓励对于 NuScenes 的进一步探索,以使其能够运用所有传感器数据并利用语义地图来获得更好的性能。因为每个传感器模态都提供用于训练 3D 对象检测的补充特征。

NVIDIA 次世代 AI 芯片 Jetson Xavier

NVIDIA Jetson Xavier Developer Kit
NVIDIA Jetson Xavier Developer Kit

WRC 2018 世界机器人大会上,NVIDIA 展出了专为机器人设计的芯片 Jetson Xavier。同时,NVIDIA 高级软件经理李铭博士也向网易智能等媒体详细介绍了这款芯片的特点,阐述了 Jetson Xavier 如何推动机器人软硬件技术的发展。NVIDIA Jetson Xavier 是 Jetson 平台的最新成员。 它是用于自动机器的 AI 计算机,可在 30 万以下的嵌入式模块中提供 GPU 工作站的性能。 凭借 10 万,15 万和 30 万的多种工作模式,Jetson Xavier 的能效比其前身 Jetson TX2 高出 10 倍以上,性能超过 20 倍。

一直以来,NVIDIA 的产品线都是建立在 GPGPU 这一架构之上。从 NVIDIA 的角度来看,当前人工智能已经发展到了一个转折点。拿图像识别这一应用领域来说,AI 已经从最开始解决『是谁不是谁』的问题,到后来可以寻找某一特定目标,再到如今可以在图像识别过程中附加各种逻辑和决策,越来越复杂抽象,这主要得益于各种计算网络的出现和发展。

Jetson Xavier 是 NVIDIA 单独做过的最长的一个处理器项目,NVIDIA 耗费了五年的时间(三年设计、两年筑造)来打造它,共有超过 8,000 人参与了设计与开发,也是 NVIDIA 首款专门为机器人设计的产品。

Jetson Xavier 拥有 6 种高性能处理器,包括 NVIDIA 自研的 Carmel 架构 8 核 64 位 CPU、Volta 架构 512 CUDA 处理器 GPU、2 个 NVDLA 深度学习加速器、1 个图像处理器、1 个视觉处理器和 1 个视频处理器。这些处理器使其能够同时、且实时地处理数十种算法,以用于传感器处理、测距、定位和绘图、视觉和感知以及路径规划。

Jetson Xavier 专为机器人,无人机和其他自动机器而设计,这些机器需要在边缘进行最大程度的计算,以运行现代 AI 工作负载并解决制造,物流,零售,服务,农业等方面的问题。 Jetson Xavier 也适用于智能城市应用和便携式医疗设备。

跨象乘云™ 《机器人与移动智能开发实战》课程,面向新一代人工智能边缘计算应用场景,基于 NVIDIA Jetson TX 开发平台,借助高性能、低能耗的 GPU,学生将学习到如何将深度学习模型嵌入到移动设备;在嵌入式『板载终端设备』上处理复杂数据;并铸就更大型更复杂的深度神经网络。从机器人和无人机,到企业协作设备和智能摄像机无一不可进行快速及准确的推理。内容覆盖基于各种新一代人工智能算法,实现 Jetson 芯片机器人用于传感器处理、测距、定位和绘图、视觉和感知以及路径规划等操作。

伯克利发布目前最大规模开放驾驶视频数据集:BDD100K

近日,UC Berkeley 发布了迄今为止规模最大、最多样化的开放驾驶视频数据集 —— BDD100K。该数据集共包含 10 万个视频,BAIR 研究者在视频上采样关键帧,并为这些关键帧提供注释。此外,BAIR 还将在 CVPR 2018 自动驾驶 Workshop 上基于其数据举办三项挑战赛。

自动驾驶将改变每个社区的生活。然而,最近的事件表明,在自动驾驶系统部署到现实世界中后,人造感知系统如何避免错误(甚至看似明显的错误)还不得而知。BAIR 的计算机视觉研究者有兴趣探索自动驾驶感知算法的前沿,以使其更加安全。为了设计和测试潜在的算法,研究者想利用真实驾驶平台收集数据中的所有信息。这种数据有四个主要特点:大规模、多样化、在街上采集、具有时间信息。数据多样性对于测试感知算法的鲁棒性尤为重要。但是,当前的开放数据集只能覆盖上述属性的一部分。因此,在 Nexar 的帮助下,BAIR 将发布 BDD100K 数据库,这是迄今为止用于计算机视觉研究的最大、最多样化的开放驾驶视频数据集。该项目由伯克利 DeepDrive 产业联盟组织和赞助,该联盟研究计算机视觉和机器学习在汽车应用上的最新技术。

GitHub地址项目 GitHub 地址

MIT+NVIDIA无人驾驶课程

自动驾驶汽车毫无疑问已成为深度学习与新一代人工智能最为广泛的应用之一 —— 另外还有医疗镜像分析,智慧城市,并行异构计算等。MIT 6.S094 深度学习与自动驾驶开放课程,通过构建自驾车的应用主题,介绍深度学习的实践。 尽管课程本身面向初学者开设,专为那些对机器学习不熟悉的人而设计,但它也可以使该领域的高级研究人员寻找深度学习方法及其应用的实用概述。开放课程除了提供 2017 – 2018 年课程完整的讲义与视频以外,还包含了 DeepTrafficDeepTeslaSegFuse 几个动手操作项目。你甚至可以在课程指导及模拟环境上自己动手制造一辆特斯拉自动驾驶汽车,并体验一下特斯拉驾驶室内的观感。

MIT 6.S094 课程联合了包括 Google,英伟达,丰田,亚马逊等多家新一代人工智能先锋企业合作。同时,如果你还希望对成熟的产品进行应用型学习。英伟达 NVIDIA DRIVE Platform 自动驾驶硬件平台的线上操作实验,可以让你体验如何在开放式 AI 汽车计算机平台上进行实践操作。你可以先下载实验指导手册进行快速预览。