近日,bwin必赢张健老师课题组的一篇关于压缩感知的研究成果“Deep Memory-Augmented Proximal Unrolling Network for Compressive Sensing”被国际顶级期刊IJCV录用(论文地址:https://link.springer.com/article/10.1007/s11263-023-01765-2)。张健老师课题组主页:https://villa.jianzhang.tech/。
IJCV的全称是 International Journal of Computer Vision(计算机视觉国际期刊),是中国计算机学会推荐的A类学术期刊,其最新JCR影响因子为13.369。IJCV是 Springer 出版公司的最顶级期刊之一,主要收录有关计算机视觉的数学、物理、计算等多方面,包含图像渲染、计算机图形学、机器人技术等多种应用的优秀研究成果。
压缩感知(CS)是一种信号采集并重构的方法,其旨在从少量线性观测值中重建原始图像信号,以突破奈奎斯特采样极限、极大地降低获取信号的成本。CS应用广泛,其中包括了单像素相机、医疗成像(如CT和MRI)、无限遥感技术以及视频快照等。
压缩感知问题被引起了广泛的关注,目前随着深度学习的出现,也出现了很多基于神经网络的方法,其中可以分为两类,一种是“黑盒”网络,直接通过网络从观测值中学习重建原始图像;另一种是深度展开网络,将优化方法与网络进行结合,从而展开整个迭代过程,进行端到端学习。由于深度展开网络保持实时推理,具有很好的可解释性,目前成为了CS问题的主流方法。
由人类大脑实现记忆的方式得到启发,本文将深度展开网络中每次迭代过程(stage)看作一个神经元,从而信息传递方式可被分为stage内部和stage之间,因此为了增强网络信息传输,本文对这两种方式分别进行精细化设计,如图1所示。
图1. 网络整体框架
在stage内部,本文中提出了自调制模块 (SMB), 如图2所示。SMB可以自适应地生成仿射变换参数,从而进行元素级特征调制。SMB 在没有增加模型参数的情况下,增大了感受野,使得网络在stage内部高效地提取到更丰富的特征信息。
图2. 自调制模块结构框图
为了增加stage之间的信息传输,本文提出了两种记忆传输机制:高通的短期记忆机制 (HSM), 跨 stage的长期记忆机制 (CLM), 如图1所示。HSM 在每个stage中引入前一个stage中的多通道信息,强调解决相邻stage间信息损失的问题;CLM 利用LSTM本身具备的长期依赖特性,使得stage间信息具备长距离传输能力。
结合以上设计,本文提出了记忆增强的深度展开网络(MAPUN),并且已在多个数据集上验证了MAPUN的性能最优。
图3. 实验结果
本篇工作的第一作者为bwin必赢张健老师课题组的博士四年级学生宋皆充同学,第二作者为张健老师课题组硕士二年级学生陈斌同学,通讯作者为张健助理教授。以上研究工作在算力方面得到了深圳鹏城实验室的“鹏城云脑”支持。