近日,中國科學院合肥物質院健康所李雪玲研究員在燒傷皮膚基因表達時序分析方面取得新進展,開發了一種基于高分辨率細胞類型反卷積組模式分析燒傷后皮膚基因表達隨時間變化過程的方法。相關研究結果發表在美國燒傷協會會刊 Journal of burn care & research: official publication of the American Burn Association。
分析燒傷皮膚基因表達隨時間變化過程對于適時治療(therapeutic timing)至關重要。過去三十多年中,針對組織bulk轉錄組的基因表達譜分析為最常用的數據分析手段,但是該技術不能區分因為細胞類型數量和細胞類型特異性的基因表達變化等混淆因素的影響,僅能夠判定所有細胞類型的平均基因表達變化。然而,皮膚組織的基因表達變化原因,既由細胞基因表達變化即細胞狀態變化,也由細胞類型分數和數目變化所引起的綜合結果。精確區分細胞分數和基因表達變化,挖掘燒傷后細胞和基因靶標,對促進臨床傷口愈合具有重要意義。
基因表達譜呈現出較強的細胞類型特異性,是構建細胞類型分子標簽的理論基礎,然而高分辨率細胞類型反卷積要求bulk樣本數目高于細胞類型數目。早在2012年,李雪玲研究員在University of Texas Medical Branch at Galveston工作期間,深入參與了美國燒傷協會Genomics項目, 分析燒傷后血液、皮膚、肝和心臟基因表達變化。在此基礎上,李雪玲研究員帶領團隊,開發了一種使用CIBERSORTx高分辨率細胞類型反卷積組模式方法,分析pooled 皮膚bulk轉錄組數據,該方法能夠鑒別引起bulk基因擾動的細胞分數和基因表達變化來源。研究人員首先整合血液和皮膚單細胞數據,構建了皮膚8細胞和7細胞類型參考標簽-Sig_Na,在獨立純化細胞微陣列數據集上與報道的Derm2皮膚類型參考標簽進行反卷積準確度比較,證明了Sig_Na的優越性,并進一步在純化細胞類型的跨平臺RNA-seq bulk測序數據上證明了其準確度。同時,發明一種通過添加白噪音的bulk樣本擴增技術,克服了高分辨率細胞類型反卷積中bulk樣本數目不足而導致模型無法應用缺憾,擴展了模型的適用范圍。最后,基于Sig_Na對7種細胞類型:皮膚角質細胞、皮膚成纖維細胞、黑色素細胞、嗜中性粒細胞、巨噬細胞、T細胞、內皮細胞進行組模式高分辨率細胞類型反卷積。接下來,利用純化角質細胞類型的RNA-Seq時間表達變化數據作為獨立驗證集(3個時間點),驗證了高分辨率細胞類型反卷積準確性。并就皮膚脂肪細胞高分辨率反卷積進行了初步嘗試,利用白色脂肪細胞和褐色脂肪細胞特異性基因表達標志物,在bulk轉錄組上驗證了燒傷皮膚中存在白色脂肪褐色化過程。最后,指出高分辨率細胞類型反卷積的深度學習模型和燒傷數據采集等未來發展方向。
李雪玲研究員為本文的通訊作者。該研究工作受到國家自然科學基金、安徽省醫學重點專項等多個項目資助。
圖1 該研究示意圖
圖2 皮膚bulk轉錄組高分辨率細胞類型反卷積構建protocol