近日,中國科學院合肥物質院智能所仿生智能技術研究中心黃炫和韋虎課題組與中國科學技術大學、中國礦業(yè)大學與清華大學部分課題組合作完成的文章“Efficient Multi-scale Network with Learnable Discrete Wavelet Transform for Blind Motion Deblurring”被計算機視覺和模式識別領域的頂級會議Conference on Computer Vision and Pattern Recognition(CVPR)接收發(fā)表。
圖像運動模糊的消除技術致力于修復因未知模糊核影響而產生運動模糊的退化圖像,旨在恢復其清晰度,重現(xiàn)圖像的原始細節(jié)和價值。這一技術不僅對于提升圖像質量具有重要意義,同時也對語義分割、目標檢測和目標追蹤等關鍵的圖像處理應用有著顯著的促進作用,增強了這些應用的準確性和穩(wěn)定性。在傳統(tǒng)的單圖像去模糊方法中,通常采用由粗到細的處理策略。但在深度學習的應用場景下,現(xiàn)行的多尺度算法面臨著挑戰(zhàn):它們不僅依賴于復雜的結構來整合低分辨率的RGB圖像和深度特征,還需要人工生成那些置信度不高的低分辨率圖像對。
在該項工作中,科研團隊提出了一種基于單輸入多輸出(SIMO)的多尺度運動去模糊網絡,簡化了現(xiàn)有基于由粗到細方案算法的復雜性。同時,為了減輕使用多尺度架構帶來的細節(jié)信息修復缺陷,團隊將真實世界的模糊軌跡特征與可學習的小波變換模塊相結合,重點關注從模糊圖像到清晰圖像之間逐步復原的方向連續(xù)性和頻率特性。團隊創(chuàng)新了一種具有可學習離散小波變換的多尺度網絡(MLWNet),它在多個真實世界的模糊數據集上,無論在主觀和客觀質量方面,還是計算效率方面,都表現(xiàn)出了最先進的性能。
智能所碩士研究生邱天衡為共同第一作者,黃炫副研究員為共同通訊作者,該項工作得到了國家自然科學基金與國家高技術研究發(fā)展計劃的支持。
CVPR 是計算機視覺方向的三大頂級會議之一。根據谷歌學術公布的2022年最新學術期刊和會議影響力排名,CVPR在所有學術刊物中位居第4,僅次于Nature、NEJM和Science。
文章鏈接:https://arxiv.org/abs/2401.00027v2
MLWNet與其他sota模型在RealBlur-J測試集上的對比結果示意圖
MLWNet模型架構圖
MLWNet與其他sota模型在RSBlur測試集上的可視化結果對比圖