在深度学习项目中,寻找数据花费了相当多的时间。但在很多实际的项目中,我们难以找到充足的数据来完成任务。为了要保证完美地完成项目,有两件事情需要做好:
- 寻找更多的数据;
- 数据增强。
此前,跨象乘云™ 介绍了《图像数据增强库 – Albumentations》,这次向大家推荐另外一个图像数据增强库 —— imgaug。Imgaug 是一个封装好的用来进行图像 Augmentation 的 Python 库,这个库功能全面,且有丰富的文档支持,能满足我们大多数的数据增强的需求。支持关键点(key point)和 bounding box 一起变换。它可以将你的输入图片转换成很多新的、更大数据量的轻微变动的图片,这对于数量比较小的数据集来说简直是福音!常见的变换比如 滤波,扰动,平移,翻转,缩放,裁剪,锐化,噪声,灰度,亮度,对比度等等。

这里有一篇比较完整的入门教程。