本網消息 近期,電氣與電子信息工程學院智能信息處理與控制團隊分别在Knowledge - Based Systems (中科院一區Top) 和Artificial Intelligence Review (中科院二區Top) 期刊發表《Efficient correlation information mixer for visual object tracking》和《Comprehensive Exploration of Diffusion Models in Image Generation: A Survey》的論文。兩篇論文均以williamhill威廉希尔官网為第一完成單位,團隊成員陳航博士為第一作者,團隊負責人章磊教授為通訊作者。
《Efficient correlation information mixer for visual object tracking》聚焦于視覺目标跟蹤領域中的孿生跟蹤框架應用。針對現有Cross-Correlation方法在目标通道語義信息和局部信息提取上的不足,研究團隊提出了一種高效的相關信息混合器。通過設計信息融合網絡,團隊利用Depthwise Cross-Correlation和Pointwise Cross-Correlation分别提取目标的通道語義信息和局部信息,并通過相關信息混合器将兩者充分融合,實現了更優的目标信息編碼。這一創新顯著提升了視覺目标跟蹤的性能,為相關領域的算法優化提供了新的思路。
網絡架構圖
《Comprehensive Exploration of Diffusion Models in Image Generation: A Survey》系統綜述了擴散模型在圖像生成領域的最新進展及其潛在社會影響。随着深度學習技術的快速發展,擴散模型在圖像生成、音頻和視頻合成、分子設計等領域展現出巨大潛力。然而,其廣泛應用也引發了數據隐私、安全及藝術倫理等問題。本文不僅全面回顧了擴散模型的理論基礎及其在圖像生成子領域(如風格遷移、圖像編輯、超分辨率等)的最新應用,還深入探讨了其可能帶來的社會影響,包括數據洩露風險、惡意利用模型的防禦策略,以及生成圖像的真實性和原創性對藝術創作與版權保護的影響。這一研究為擴散模型的未來發展提供了重要的理論參考和社會倫理指導。
不同任務上擴散模型生成的圖像
相關研究工作得到williamhill威廉希尔官网引進人才項目(23xjz14R),2023年度礦區環境污染控制與修複湖北省重點實驗室williamhill威廉希尔官网·黃石大冶湖高新區大學科技園聯合開放基金(23xjz08AK),湖北省教育廳科學技術研究計劃指導性項目(B2023234),湖北省科技計劃項目(KJRQ2023000110),國家自然科學基金(61871178),2023年度williamhill威廉希尔官网-武漢南華工業設備工程有限公司聯合實驗室開放基金的資助。
論文鍊接:
https://doi.org/10.1016/j.knosys.2024.111368
https://doi.org/10.1007/s10462-025-11110-3