近期,中國科學(xué)院合肥物質(zhì)院安光所團(tuán)隊在生態(tài)聲音景觀研究領(lǐng)域取得重要進(jìn)展,相關(guān)成果以《利用生成對抗網(wǎng)絡(luò)進(jìn)行生物聲學(xué)識別、降噪和聲源分離》(Animal acoustic identification, denoising and source separation using generative adversarial networks)為題,發(fā)表在生態(tài)學(xué)權(quán)威期刊 Methods in Ecology and Evolution上。
在自然生態(tài)系統(tǒng)中,鳥類、昆蟲等動物的鳴叫聲,以及風(fēng)聲、雨聲和人類活動聲音共同構(gòu)成了完整的生態(tài)聲音景觀。由于不同物種鳴叫頻率不同,研究人員可通過聲音頻譜圖,從生態(tài)聲音景觀中解析出物種多樣性信息。近年來,判別式機器學(xué)習(xí)方法被廣泛應(yīng)用于聲音景觀解析,以監(jiān)測生態(tài)系統(tǒng)物種多樣性及其時空變化。然而,對于物種豐富、聲源復(fù)雜的生態(tài)系統(tǒng),難以從聲音景觀中準(zhǔn)確鑒別物種和估算物種多樣性,這給基于生態(tài)聲音景觀的生態(tài)監(jiān)測帶來了挑戰(zhàn)。
針對這一問題,研究團(tuán)隊提出了基于生成對抗網(wǎng)絡(luò)(Generative Adversarial Network, GAN)的新方法,通過學(xué)習(xí)真實聲音頻譜圖的潛在分布,重構(gòu)聲音景觀成分,最終混合聲源合成逼近真實的聲音景觀。與傳統(tǒng)的“解析”方法不同,論文發(fā)展的“生成”法能夠捕捉聲學(xué)空間中的內(nèi)在結(jié)構(gòu)和特征,可從復(fù)雜聲音景觀中準(zhǔn)確提取物種多樣性信息,為基于聲音景觀的生物多樣性監(jiān)測和生態(tài)系統(tǒng)健康評估提供了新途徑。
中國科學(xué)技術(shù)大學(xué)博士生王梅為論文第一作者,安光所劉方鄰研究員為通訊作者。
論文鏈接:https://doi.org/10.1111/2041-210X.70148

圖1 生成對抗網(wǎng)絡(luò)模型架構(gòu)示意圖

圖2 生成對抗網(wǎng)絡(luò)模型在群落水平上生成圖像的視覺比較
