近日,2025年IEEE國際計算機視覺與模式識別會議(CVPR)在美國舉行。會上揭曉了超可見光譜感知挑戰(zhàn)賽結果,同濟大學計算機科學與技術學院教授趙生捷團隊在全球300余支隊伍中脫穎而出,在多模態(tài)視覺方向的3項核心挑戰(zhàn)中以絕對優(yōu)勢獲第一,實現(xiàn)“大滿貫”。此外,團隊的科研成果獲大會官方特邀進行主會場匯報。
本次CVPR“熱紅外圖像超分辨率挑戰(zhàn)賽”分為兩大技術賽道。
賽道1聚焦低分辨率紅外圖像的8倍超分辨率重建,參賽隊伍需應對紅外信號固有噪聲干擾、細節(jié)紋理丟失與結構信息模糊等核心挑戰(zhàn)。趙生捷團隊提出了基于Swin Transformer的多階段圖像超分辨率模型,通過多層次、多粒度特征提取和跨尺度特征重建突破了技術瓶頸,最終以28.52PSNR(峰值信噪比)與0.847SSIM(結構相似性指數(shù))的優(yōu)異指標斬獲賽道冠軍。
賽道2的參賽選手則需要以高分辨率可見光圖像為引導,完成低分辨率熱圖像的8倍與16倍超分辨率重建。針對傳統(tǒng)算法在熱圖像高頻細節(jié)恢復中存在的紋理模糊、邊緣失真等痛點,趙生捷團隊提出了“數(shù)據(jù)混合預訓練+多尺度監(jiān)督”的技術框架,最終實現(xiàn)了SSIM的最優(yōu)性能,斬獲了該賽道冠軍。
在CVPR“多模態(tài)航空視角圖像分類挑戰(zhàn)賽”的合成孔徑雷達圖像分類賽道中,參賽者需要基于低分辨率SAR圖像完成目標識別任務,并允許借助光學圖像(EO)與SAR的配對數(shù)據(jù)開展跨模態(tài)訓練。針對SAR圖像固有的低分辨率、斑點噪聲干擾,以及傳統(tǒng)方法難以有效融合多模態(tài)信息的痛點,趙生捷團隊提出“跨傳感魯棒識別網(wǎng)絡”,通過構建跨模態(tài)領域自適應框架實現(xiàn)技術突破,最終榮膺該賽事冠軍。
據(jù)了解,CVPR是全球計算機視覺、模式識別及人工智能領域最具權威性的頂級學術會議之一,由電氣與電子工程師協(xié)會(IEEE)主辦,被學術界與產(chǎn)業(yè)界共同視為衡量研究水平的“黃金標準”,甚至被稱為計算機視覺領域的“學術奧林匹克”。
本文鏈接:三項第一!同濟團隊在國際比賽中獲“大滿貫”http://m.sq15.cn/show-11-22737-0.html
聲明:本網(wǎng)站為非營利性網(wǎng)站,本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。