LSTM 网络可视化

Visualizing LSTM Networks
LSTM 网络可视化

目前,在卷积神经网络领域中有许多可视化方面的研究,但是对于 LSTM 却没有足够的类似工具。LSTM (长短期记忆单元)网络的可视化能带来很有意思的结果,由于其包含时间相关性,我们除了可以在可视化图像的空间维度上探索数据之间的关联,还可以在时间维度上探索关联的稳健性。

对于长序列建模而言,长短期记忆(LSTM)网络是当前最先进的工具。然而,理解 LSTM 所学到的知识并研究它们犯某些特定错误的原因是有些困难的。在卷积神经网络领域中有许多这方面的文章和论文,但是对于 LSTM 我们却没有足够的工具可以对它们进行可视化和调试。

Piotr Tempczyk 在这篇文章中,试图部分填补这个空白 —— 从澳大利亚手语(Auslan)符号分类模型中对 LSTM 网络的激活行为进行可视化,通过在 LSTM 层的激活单元上训练一个降噪自编码器来实现。通过使用密集的自编码器,我们将 LSTM 激活值的 100 维向量投影到 2 维和 3 维。多亏了这一点,我们在一定程度上能够可视化地探索激活空间。我们对这个低维空间进行分析,并试图探索这种降维操作如何有助于找到数据集中样本之间的关系。最有意思的,是教程中同时提供了数据集与对应的操作代码 ——另外, 机器之心在这篇文章里做了第一部分的中文翻译(Piotr Tempczyk 仍在更新中 …)。

扩展阅读:从任务到可视化,如何理解LSTM网络中的神经元

GitHub地址项目 GitHub 地址