GANSynth:使用 GAN 制作音乐

众所周知,GAN 是一种生成高质量图像的 SOTA 方法。因而,研究人员也一直在努力将其应用于更加序列化的数据,例如音频和音乐。在这个领域,自回归 (AR) 模型通过一次预测一个样本占据了主导地位(如 WaveNets 和 Transformers)。虽然 AR 模型的这一特性促成了它们的成功,但这[……]

继续阅读

NeuralHash:对抗性隐形签名水印

Neuralhash 是通过对图像进行微扰,以视觉方式编码作者的独特签名的一个开源项目框架。项目的安全水印方案代表了在保护内容所有权和防止 Internet 上的盗版方面的重大进步。项目主要做法,是可以在解码器网络(将输入图像映射到 32 位签名)上使用对抗性示例技术来生成将其解码为所需签名的扰动。[……]

继续阅读

计算机视觉各研究方向汇总

所谓计算机视觉,即 compute vision ,就是通过用计算机来模拟人的视觉工作原理,来获取和完成一系列图像信息处理的机器。计算机视觉属于机器学习在视觉领域的应用,是一个多学科交叉的研究领域,涉及数学,物理,生物,计算机工程等多个学科,由此也可以想象到计算机视觉的研究范围非常广,也是图像,语音[……]

继续阅读