近日,中國科學院合肥物質科學研究院健康所李海研究員團隊基于健康人群樣本,系統評估了言語聲學特征在家用移動設備上的一致性,為推動遠程語音評估的應用提供了重要的數據支持。相關研究成果發表在人類行為研究領域國際頂級期刊?Behavior Research Methods 上。
遠程言語認知評估是一種新興技術,可以通過互聯網在居家環境或移動設備上分析語音以評估參與者的認知水平。此種方法便捷、簡單、準確,有望應用于老年人認知評估或青少年心理健康測量等方面。為了得到可靠的評估結果,需要確保評估方法在不同設備或不同測量中具有較高的一致性(也稱為可重復性)。目前尚缺乏針對遠程場景中關于評估技術的跨設備和重復測量一致性的深入探討。
為填補這一研究空白,研究團隊選取了家庭環境中常見的四種消費級設備(包括錄音筆、筆記本電腦、平板電腦和智能手機等),對言語聲學特征的跨設備和重復測量一致性進行了詳細分析。研究結果顯示,頻率相關特征(如基礎頻率和倒譜峰突出)在設備間和重復測量中具有較高的可靠性,因此更適合應用于遠程評估場景。相較之下,音節分割類的復雜特征(如音節速率和規律性)的可靠性相對較低。
研究進一步強調,需要制定標準化的數據采集、分析方法來提高遠程言語認知評估的可靠性,同時建議通過改進算法,提高消費級設備在測量復雜聲學特征時的抗噪能力。這些發現為優化遠程語音評估技術、促進其在各種評估場景中(如:老年人認知評估、青少年心理健康測量等)的應用提供了重要指導。
該論文的第一作者為健康所2022級碩士研究生胡子安和2020級博士研究生張政霖,通訊作者是李海研究員和楊立狀副研究員。本研究得到了國家自然科學基金、安徽省自然科學基金和安徽省重點研發項目的支持。
文章鏈接:https://link.springer.com/article/10.3758/s13428-024-02584-0
遠程評估場景中聲學特征的跨設備一致性水平