YOLOv4 重磅发布,5 大改进,20+ 技巧实验

今年 2 月 22 日,知名的 DarkNet 和 YOLO 系列作者 Joseph Redmon 宣布退出 CV 界面,这也就意味着 YOLOv3 不会再有官方更新了。但是,CV 领域进步的浪潮仍在滚滚向前,仍然有人在继续优化 YOLOv3。今日,著名的 AlexeyAB 版本发布了 YOLOv4[……]

继续阅读

人像卡通化 (Photo to Cartoon) 开源项目

这个项目名叫「人像卡通化 (Photo to Cartoon)」,已经在 GitHub 上开源。但对于不想动手下载各种软件、数据集、训练模型的普通用户,该公司开放了一个名为「AI 卡通秀」的小程序,可以生成各种风格的卡通照片、GIF 表情包,完全可以满足社交需求。

GitHub地址项目 GitHub 地址[……]

继续阅读

CVPR 2020 Google 图像匹配挑战赛数据集

谷歌在 CVPR 2020 发起的图像匹配挑战赛,该比赛提供的数据集超过 2.5 万幅图像,包含精确的姿态和方向标注。这次比赛的任务更加偏向于三维重建中的图像匹配,从上图例中也可以看出,该数据集包含大量的大型建筑物在各种光线和不同视角拍摄的图像。比赛允许参与者参照传统局部特征的方法,先提取局部特征关[……]

继续阅读

DFG 交通标志数据集

DFG 交通标志数据集,包括 200 个交通标志类别捕获在斯洛文尼亚公路跨越约 7,000 高分辨率图像。图像是由斯洛文尼亚 DFG 咨询公司提供和注释的。RGB 图像是通过安装在一辆汽车上的摄像头获得的,这辆汽车行驶在斯洛文尼亚六个不同的自治市。这些图像数据是在农村和城市地区获得的。从收集的大量数[……]

继续阅读

奥迪大型自动驾驶数据集:A2D2

今天奥迪公司的研究人员在发布的论文 A2D2: Audi Autonomous Driving Dataset 中,公布了其大型自动驾驶数据集:A2D2,同时还配备了相关教程,并提供开放下载。数据集目标为推进计算机视觉、机器学习、自动驾驶的商用和学术研究。数据类型包含:RGB 图像,也包括对应的 3[……]

继续阅读

实时『人手-物体』姿态估计算法 HOPE-Net

CVPR 2020 的论文《HOPE-Net: A Graph-based Model for Hand-Object Pose Estimation》,基于自适应图卷积技术,作者提出了一种称之为 HOPE-Net 的『人手 – 物体』姿势估计模型,在这个问题上不仅计算结果精度更高、速度也更快,GP[……]

继续阅读

DeepLesion:最大开源临床医疗图像数据集

NIH 临床中心最新公布了一个迄今规模最大的多类别、病灶级别标注临床医疗 CT 图像开放数据集 DeepLesion,研究人员在此基础上训练深度神经网络,创建了一个具有统一框架的大规模通用病灶检测器,能够更准确、更自动地衡量患者体内所有病灶的大小,实现全身范围的癌症初步评估。数据集包含:

超轻量级中文 OCR

光学字符识别(OCR)技术已经得到了广泛应用。比如发票上用来识别关键字样,搜题 App 用来识别书本上的试题等。近期,这个叫做 chineseocr_lite 的 OCR 项目开源了,这是一个超轻量级中文 OCR 实现中文自然场景文字检测及识别。该项目支持竖排文字识别,支持 ncnn 推理,psen[……]

继续阅读

Google 开源实时 3D 目标检测模型

Google AI 今天发布的 MediaPipe Objectron,一个可以实时 3D 目标检测的 pipeline。此前,跨象乘云™ 介绍过:MediaPipe 是一个开源的多媒体机器学习模型应用跨平台框架,用于构建 pipeline 来处理不同模式的感知数据。更为难得的,是基于MediaPi[……]

继续阅读