DeepLesion:最大开源临床医疗图像数据集

NIH 临床中心最新公布了一个迄今规模最大的多类别、病灶级别标注临床医疗 CT 图像开放数据集 DeepLesion,研究人员在此基础上训练深度神经网络,创建了一个具有统一框架的大规模通用病灶检测器,能够更准确、更自动地衡量患者体内所有病灶的大小,实现全身范围的癌症初步评估。数据集包含:

  • 4,427 名独立的匿名患者
  • 10,594 次 CT 扫描(平均每位患者有 3 次随访)
  • 32,735 个带标记的病灶实例
  • 一共 928,020 张 CT 横切图像(512×512 分辨率)

[……]

继续阅读

超轻量级中文 OCR

光学字符识别(OCR)技术已经得到了广泛应用。比如发票上用来识别关键字样,搜题 App 用来识别书本上的试题等。近期,这个叫做 chineseocr_lite 的 OCR 项目开源了,这是一个超轻量级中文 OCR 实现中文自然场景文字检测及识别。该项目支持竖排文字识别,支持 ncnn 推理,psenet (8.5M) + crnn (6.3M) + anglenet (1.5M) 总模型仅 17M。

GitHub地址项目 GitHub 地址[……]

继续阅读

Google 开源实时 3D 目标检测模型

Google AI 今天发布的 MediaPipe Objectron,一个可以实时 3D 目标检测的 pipeline。此前,跨象乘云™ 介绍过:MediaPipe 是一个开源的多媒体机器学习模型应用跨平台框架,用于构建 pipeline 来处理不同模式的感知数据。更为难得的,是基于MediaPipe 的 Objectron 直接支持在移动设备上实时计算面向对象的 3D 边界框。

GitHub地址项目 GitHub 地址[……]

继续阅读

2020 年人脸识别数据集汇总

面向深度学习的人脸识别,是指能够识别或验证图像或视频中的主体的身份的技术。现今,现在相比于指纹或虹膜识别等传统上被认为更加稳健的生物识别方法,人们往往更偏爱人脸识别。让人脸识别比其它生物识别方法更受欢迎的一大不同之处是人脸识别本质上是非侵入性的。《人脸识别》课程将通过大量有趣的实验案例,让学生充分了解人脸识别的各项关键技术,包括:人脸定位,人脸关键点识别,人脸识别等。这里提供2020 年 16 套人脸识别数据集汇总,可用于人工智能实验室建设科研分析与教学应用。

1. The Japanese Female Facial Expression (JAFFE) Database

该数据[……]

继续阅读

Excel 演示计算机视觉模型

日前,亚马逊工程师利用简单的 Excel 公式,实现了各种计算机视觉CV)运算操作,还清楚地解释了核心概念和算法。通过它就能快速实现计算机视觉中的一些算法示例:人脸识别、霍夫变换都不在话下。更重要的是,还不需要任何脚本或者第三方插件。—— 与此前跨象乘云™ 介绍的《EXCEL 演示深度神经网络》一样,对于人工智能专业的师生而言,将能很好的通过熟悉的工具了解计算机视觉背后抽象的逻辑和复杂的原理。

同时,由于 Excel 性能所限,整个项目运行起来比较慢 —— 作者将整个项目分割成一些列的 Excel 文件,利用这些 Excel 文件可以分别实现:项目简介,边缘识别,原理解释,人脸[……]

继续阅读

2020 年人工智能开源生态圈

深度学习为核心的新一代人工智能技术发展到今天,已逐步形成一个庞大的生态结构,覆盖了:经典机器学习深度学习强化学习自然语言处理语音识别计算机视觉、分布式训练、自动建模、IDEs 系统、平台、评分推理系统等完整的细分领域 —— 正确合理的选择与开发内容相匹配的工具,常常会使科学研究工作事半功倍,同时,选择正确高效的工具也是技术应用类专业建设的重要环节。

跨象乘云™ 持续致力为高等院校打造深度学习与新一代人工智能科研教学一体化实验平台,在进一步将深度学习系统与容器化基础设施架构紧密集成的同时,对新一代人工智能开源生态系统提供全方位的支撑,加速高校科研效率及科研成果落地。详细项目列表[……]

继续阅读

三维计算机视觉库:PyTorch3D 开源

3D 计算机视觉是一个重要的课题,如何选择合适的框架进行计算,使得处理效果更好、更高效?近日,FaceBook 博客更新了一篇新的文章,介绍了团队开发的针对 3D 计算机视觉的框架 —— PyTorch3D。这是一个基于 PyTorch 的库,在 3D 建模,渲染等多方面处理操作上有更好的表现。

GitHub地址项目 GitHub 地址[……]

继续阅读

《机器学习实用指南》第二版发布

Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow》(《机器学习实用指南》),这本书最大的特色从理论上讲就是言简意赅,全书基本上没有太多复杂的数学公式推导。这一点正是国内很多高校教材所欠缺的。这本超赞的机器学习实用指南终于正式出版了第二版:《Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems 2nd Edit[……]

继续阅读

计算机视觉各研究方向汇总

所谓计算机视觉,即 compute vision ,就是通过用计算机来模拟人的视觉工作原理,来获取和完成一系列图像信息处理的机器。计算机视觉属于机器学习在视觉领域的应用,是一个多学科交叉的研究领域,涉及数学,物理,生物,计算机工程等多个学科,由此也可以想象到计算机视觉的研究范围非常广,也是图像,语音,自然语言处理领域中从业人数最多的。

1. 图像分类

1.1 基本概念

图像分类是计算机视觉中最基础的一个任务,也是几乎所有的基准模型进行比较的任务,从最开始比较简单的 10 分类的灰度图像手写数字识别 mnist ,到后来更大一点的 10 分类的 cifar10 和 100 分类的cifar[……]

继续阅读