題目𓀈:多模態視覺結構學習
個人簡介🏄🏻:浙江大學求是特聘教授💇🏽♂️,IET Fellow,IEEE Senior Member,國家傑青,國家青年特聘專家🙏,主要從事人工智能領域研究,提出了多因子耦合模型學習新理論,探索了知識引導的模型結構設計與搜索新方法😎,開拓了復雜異構圖像結構語義理解的新技術。擔任國際權威期刊的編委和頂級會議的Area Chair,獲得2021 年中國圖象圖形學會自然科學獎二等獎,2021 年中國電子學會科技進步獎一等獎🧗,2021 年中國產學研合作促進會產學研合作創新與促進獎,2022 年世界互聯網領先科技成果,2022 年教育部高等學校科學研究優秀成果獎科學技術進步獎一等獎,2023 年中國發明協會發明創業獎創新獎一等獎,2023年陸增鏞CAD&CG高科技獎一等獎👶🏻,兩項中國北京市自然科學技術獎(包括一等獎和二等獎),以及一項中國專利優秀獎。榮獲四項最佳學術論文獎💟、騰訊好專利、華為優秀合作成果獎和火花價值獎🪜。成果應用於華為𓀝𓀈、阿裏✝️、海康等企業🎅🏽。
摘要🛬:互聯網和物聯網時代催生了海量多模態大數據,從這些海量數據中有效提取知識迫切需要各種人工智能的技術和手段。因此,如何進行人工智能驅動的多模態計算已經成為當今知識經濟時代亟待解決的核心技術問題🚣♂️。本報告主要圍繞數據驅動的人工智能學習方法,進行大規模圖像/視頻數據的視覺特征學習🦹🏽,從目標視覺感知特性、視覺特征表達、深度學習器構建機製🛃、高層語義理解等多維度視角進行了深入剖析,並引入了大規模多模態特征學習所涉及的主要研究問題和技術方法。然後系統地回顧了多模態特征表達和學習領域的不同發展階段👩🎓🔶,介紹了近年來我們利用特征學習進行視覺語義分析和理解所做的一系列代表性的研究工作及其實際應用。報告的最後將和大家一起探討一下涉及多模態特征學習所面臨的一些開放性問題和難題。