IEEE Transactions on Image Processing(简称TIP)是图像处理领域国际公认的顶级期刊,也是中国计算机学会推荐的A类学术期刊,其最新影响因子为11.041。
目前,以图像重建为代表的底层视觉任务因其实用性,受到学术界和工业界的广泛关注。近日,我院张健助理教授课题组的论文“Content-aware Scalable Deep Compressed Sensing”被TIP接收(课题组主页地址:https://villa.jianzhang.tech/)。该论文在图像压缩感知和重建领域展开研究,取得了重要进展(论文地址:https://ieeexplore.ieee.org/document/9854112/、https://arxiv.org/abs/2207.09313)。
图像压缩感知(Compressed Sensing,CS)旨在从少量线性观测值中重建原始图像信号,以突破奈奎斯特采样极限、极大地降低获取信号的成本,其应用包括且不限于单像素相机、医疗成像(如CT和MRI)以及视频快照和光谱压缩成像等。目前CS存在的两个挑战性问题分别是:(1)如何设计高效的采样矩阵和采样方式,以尽可能多地保留图像信息;(2)如何设计高效的重建算法,以快速、精确地复原图像信号。
对于图像CS的采样矩阵与采样方式设计问题,张健助理教授课题组研究发现,大多数传统方法对高分辨率图像进行以块为单位的、不重叠的均匀采样,且传统采样矩阵的自适应能力弱、存储效率低下。如图1所示,课题组认为,图像内不同块的信息量存在差异。根据图像块的纹理、细节丰富程度,使用深度神经网络来自适应地分配采样率能够提升系统对图像整体的信息保留效率;如图2所示,课题组认为,不同采样率所对应的CS采样矩阵可以通过截取一个可学习完备母矩阵的前若干行来生成,以提升采样矩阵的自适应性、存储效率和系统的灵活性。
图1:使用内容自适应的CS采样方式对“Lena”图像不同块的采样率分配结果
图2:使用统一的可学习完备母矩阵生成不同采样率所对应的采样矩阵
对于图像CS的重建算法设计问题,张健助理教授课题组研究发现,传统基于迭代优化的重建算法时间复杂度高;传统基于深度网络的方法直接学习端到端的黑盒重建映射,缺乏可解释性。如图3所示,课题组提出对传统的近端梯度法深度展开,将每一轮优化迭代过程映射为一个可学习的网络模块,以结合传统优化算法和深度网络的优势。
图3:基于近端梯度法的深度展开网络
得益于各模块间良好的兼容性,如图4所示,张健助理教授课题组提出了一个内容自适应的可伸缩图像CS网络框架,以对所有网络组件进行联合训练。该方法在多个图像基准数据集上均获得了领先的性能。
图4:内容自适应的可伸缩压缩感知网络框架示意图
该工作由张健助理教授课题组独立完成,论文通讯作者为张健助理教授,bwin必赢为第一作者单位,课题组陈斌同学为第一作者。该项研究得到了国家自然科学基金的支持,在算力方面得到了鹏城实验室的“鹏城云脑”支持。
(供稿:张健助理教授课题组)