近日, 中科院合肥研究智能所先進制造研究中心王紅強研究員團隊與中啟人工智能聯(lián)合實驗室提出利用有效視野域理論強化表征AI學(xué)習(xí)模型,并證實該模型能夠顯著提高目標檢測性能。該工作已被人工智能領(lǐng)域著名期刊NEUROCOMPUTING接收發(fā)表。
深度學(xué)習(xí)是當前人工智能的核心,在基于DCNN的深度學(xué)習(xí)模型中,網(wǎng)絡(luò)視野域發(fā)揮重要作用,但一直以來鮮有對其深入研究應(yīng)用。團隊研究人員提出一種有效感受野(eRF)強化思路,并設(shè)計了有效視野域強化表征學(xué)習(xí)模塊, 通過應(yīng)用于現(xiàn)有的目標檢測器,證實該模型顯著提高了目標檢測性能,尤其是在小目標識別方面。
對于傳統(tǒng)的目標檢測器而言,在訓(xùn)練過程中存在難以收斂和訓(xùn)練不充分不平衡等問題,科研人員注意到,在人類視覺系統(tǒng)中,物體只有落在視野范圍內(nèi)才可見,且當眼睛注意到某物時,視野中會出現(xiàn)同心對抗現(xiàn)象:激發(fā)中心區(qū)域但抑制外圍區(qū)域。鑒于此,科研人員提出模仿人眼有效感受野區(qū)域來增強表征學(xué)習(xí)。研究過程中,研究人員發(fā)現(xiàn)目標檢測器的骨干網(wǎng)絡(luò)卷積層深度是有效感受野重要影響因素之一。通過卷積層的深度擬合目標的有效感受野半徑,并將中心點落在有效感受野區(qū)域內(nèi)的錨框中,所提出的模型提高了目標檢測細微特征的強化學(xué)習(xí)能力。
該工作先期已申請國家發(fā)明專利,并發(fā)表了一系列學(xué)術(shù)論文,包括指導(dǎo)博士生在Neurocomputing、Computers and Electronics in Agriculture等期刊發(fā)表多個論文。尤其是,團隊構(gòu)建的Pest24大規(guī)模小樣本深度學(xué)習(xí)Benchmark,填補了當前大規(guī)模農(nóng)業(yè)害蟲小目標機器學(xué)習(xí)數(shù)據(jù)集缺失空白,被同行認為有很大潛力成為深度學(xué)習(xí)的標準數(shù)據(jù)。下一步團隊將繼續(xù)深入開展eRF理論與模型方法研究,并在醫(yī)療健康、安防、農(nóng)業(yè)蟲害監(jiān)測等領(lǐng)域進行產(chǎn)業(yè)化應(yīng)用。
上述研究工作得到了國家自然科學(xué)基金項目和安徽省重點研究與開發(fā)計劃的支持。
文章鏈接:https://elsevier.proofcentral.com/en-us/landing-page.html?token=c328b06ea2ece0bbaa023d437993de
網(wǎng)絡(luò)有效視野域變化數(shù)值模擬圖