Indexed by:
Abstract:
图像是人类最直接和频繁使用的信息载体之一。原始图像具有巨大的数据量,其传输和存储过程中需要消耗大量的资源,因此高效的图像压缩算法逐渐成为学术界和工业的研究热点。近年来,深度神经网络广泛成功应用于人脸检测、目标识别、图像超分辨各种图像处理问题中,并引起了图像编码领域的广泛关注。本文对基于广义分裂归一化、超先验和上下文建模的端到端深度神经网络图像压缩进行了研究 ,主要研究内容分为如下两部分:
1.实现了基于广义分裂归一化(GDN)变换的端对端深度神经网络图像编码器,并对影响该编码器性能的关键因素,如 GDN变换参数、深度神经网络模型,深度神经网络模型和码率之间的关系进行了研究。首先,对比分析了不同范数下的GDN变换对编码器性能的影响;其次,比较了不同深度神经网络结构对编码性能的影响;最后,比较了基于码率约束的多个网络模型和不带码率约束的单个模型之间的编码性能差异。研究结果表明,基于1范数的GDN编码器和基于2范数的GDN编码器具有相似的编码性能,但1范数的计算复杂度更低;通过额外引入两层卷积层所构成的新的编码网络结构,相比于原始网络结构有0.4~0.6dB的性能提升;单个的网络模型相比于多个网络模型,虽然编码性能有0.5dB峰值信噪比(PSNR)下降,但其模型简单,实用性强。
2.实现了单独依赖超先验信息、单独依赖上下文信息、同时依赖上下文和超先验信息的三种编码器,并对其关键技术进行了研究。首先,针对现有的单独依赖超先验编码器缺少码字均值估计和对标准差输出直接用Relu截断的问题,我们在原网络基础上引入了均值估计,并将标准差输出层替换为指数函数;其次,对比了超先验信息和上下文信息对码字分布的均值和标准差的预测性能;最后针对现有的基于上下文及超先验信息编码器在不同码率下需要重新训练模型的问题,我们选择在单一模型下产生不同的码率,并重新设计了码字概率表。研究结果表明,通过在超先验编码器中引入均值估计和替换标准差输出层,其性能比仅估计标准差的超先验编码器有0.2~0.4dB峰值信噪比提升。相比于超先验信息,上下文信息具有更强的均值预测能力,使得上下文信息能够对编码器有更大提升,平均有0.5dB峰值信噪比提升。简单的单一模型相比多个模型具有相当的编码性能。
Keyword:
Reprint Author's Address:
Email:
Basic Info :
Degree: 工学硕士
Mentor: 侯兴松
Student No.:
Year: 2019
Language: Other
Cited Count:
WoS CC Cited Count: 0
SCOPUS Cited Count:
ESI Highly Cited Papers on the List: 0 Unfold All
WanFang Cited Count:
Chinese Cited Count:
30 Days PV: 26
Affiliated Colleges: