可信任深度学习代码之单元测试

深度学习是一门很难评估代码正确性的学科。随机初始化、庞大的数据集和权重的有限可解释性意味着,要找到模型为什么不能训练的确切问题,大多数时候都需要反复试验。在传统的软件开发中,自动化单元测试是确定代码是否完成预期任务的面包和黄油。它帮助开发人员信任他们的代码,并在引入更改时更加自信。一个破坏性的更改将会被单元测试检测到。

从 GitHub 上许多研究库的情况来看,深度学习的实践者们还不喜欢这种方法。从业者不知道他们的代码是否正常工作,他们能接受吗?通常,由于上述三个原因,学习系统的每个组件的预期行为并不容易定义。然而,我相信实践者和研究人员应该重新考虑他们对单元测试的厌恶,因为它可以帮助研[……]

继续阅读

CenterNet 原理与代码解析

CenterNet 源码解析_GiantPandaCV》是首发于 GiantPandaCV 公众号的电子书教程,由 pprp 总结并整理 CenterNet 相关解析,这本电子书是基于非官方的 CenterNet 实现,这个版本的实现入门难度小一些。基于官方版本进行修改,要比官方代码更适合阅读和理解,Data Loader、hourglass、训练流程等原版中比较复杂的部分都进行了重写,最终要比官方的速度更快。

GitHub地址项目 GitHub 地址[……]

继续阅读

2020 年新一代人工智能 GPU 选型

Lambda 日前发布测评报告 —— 深度学习模型越来越强大的同时,也占用了更多的内存空间,但是许多GPU却并没有足够的显存(Video RAM)来训练它们。那么如果你准备进入深度学习,什么样的 GPU 才是最合适的呢?下面列出了一些适合进行深度学习模型训练的 GPU,并将它们进行了横向比较,一起来看看吧!

截至 2020 年 2 月,以下 GPU 可以训练所有当今语言和图像模型:

  • RTX 8000:48GB VRAM,约 5500 美元
  • RTX 6000:24GB VRAM,约 4000 美元
  • Titan RTX:24GB VRAM,约 2500 美元

以下[……]

继续阅读

轻量级机器学习模型训练评估指标可视化工具

Model Log 是一款基于 Python3 的轻量级机器学习(Machine Learning)、深度学习(Deep Learning)模型训练评估指标可视化工具,与 TensorFlow、Pytorch、PaddlePaddle结合使用,可以记录模型训练过程当中的超参数、Loss、Accuracy、Precision、F1值等,并以曲线图的形式进行展现对比,轻松三步即可实现。可以通过调节超参数的方式多次训练模型,并使用 Model Log 工具进行记录,可以很直观的进行模型对比,堪称调参神器。以下是使用工具后模型训练时 Loss 的变化曲线图。

GitHub地址项目 GitHub 地址[……]

继续阅读

深度学习论文研读路线攻略

如果你是深度学习领域的新手,你可能会问的第一个问题是:我应该从哪篇论文开始阅读?这里是深度学习论文的阅读路线图,路线图的构建遵循以下四个指导原则 ——

  • 从头到尾
  • 从古老到先进
  • 从一般到特定的领域
  • 专注于最先进的

其中,深度学习应用最热门的 CV 领域。顶会方面大家都知道 CV 三大顶会的 ICCV、CVPR 和 ECCV。其中,ICCV 的全称叫 International Comference on Computer Vision,是公认的 CV 三大顶会里面等级最高的会议。CVPR 的全称叫做 Internaltional Conference on Co[……]

继续阅读

位置识别 Street-level Sequences 数据集

位于瑞典的 Mapillary 宣布发布了一款新产品 MapillaryStreet-Level Sequences 数据集,这是一款公开可用的数据集,可以对 AI 模型进行基准测试和训练,以实现大规模、终身的位置识别。终身位置识别是在地理定位图像数据库中查找查询图像的最相似位置的任务。

本周发布的 Mapillary Street-LevelSequence 数据集是一个 160 万个地理图像序列的集合,这些序列与元数据绑定在一起,用于训练地点识别算法。Street-LevelSequence 数据集既有商业版本,也有研究版本,介绍了用于终身位置识别的 MapillaryStreet-[……]

继续阅读

助力 5G / 6G,深度学习创建『认知无线电』

几十年来,业余双向无线电运营者们为了能够跨大陆通信,会在一天中的正确时间来选择正确的无线电频率。之所以能够奢侈地做到这点,是因为用户和共享无线电波的设备相对较少。但是随着蜂窝无线电在电话和物联网设备中的普及,寻找无干扰的频率变得越来越困难。

因此,研究人员计划使用深度学习来创建认知无线电,通过立即调整其无线电频率,来获得最佳性能。

美国的东北大学无线物联网研究所的研究人员解释说(具体参见:相关论文),蜂窝物联网设备的种类和密度的不断增加给无线网络优化带来了新的挑战。

一个给定的无线电频率范围,可以由一百个设计用于在同一总体区域中工作的小型无线电设备共享,每个小型无线电设备具有[……]

继续阅读

《可解释机器学习》中文版重磅开源

最近,一位来自复旦大学的研究生朱明超,将一本少有的书《Interpretable Machine Learning》(可解释机器学习)翻译成了中文。这本书最初是由德国慕尼黑大学博士 Christoph Molnar 耗时两年完成的,长达 250 页,是仅有的一本系统介绍可解释性机器学习的书籍。包括 Google 在内,也在不断探索打开神经网络『黑盒子』的正确方式。

可解释人工智能』(XAI)是这本书的核心论题。作者认为,可解释性在机器学习甚至日常生活中都是相当重要的一个问题。建议机器学习从业者、数据科学家、统计学家和任何对使机器学习模型可解释的人阅读本书。《可解释的机器学习》该书总共包[……]

继续阅读

人像卡通化 (Photo to Cartoon) 开源项目

这个项目名叫「人像卡通化 (Photo to Cartoon)」,已经在 GitHub 上开源。但对于不想动手下载各种软件、数据集、训练模型的普通用户,该公司开放了一个名为「AI 卡通秀」的小程序,可以生成各种风格的卡通照片、GIF 表情包,完全可以满足社交需求。

GitHub地址项目 GitHub 地址[……]

继续阅读