瞿昆團隊系統評估16種空間轉錄組和單細胞轉錄組數據整合演算法在預測基因或細胞類型空間分佈方面的性能

由於不同演算法的工作原理和適用範圍存在顯著差異,使得研究者很難選擇最佳演算法用來預測細胞類型和基因表達的空間分佈。

細胞在組織器官內所處的空間位置對於它發揮特異性功能至關重要。近年來,研究者開發了多種空間轉錄組技術可以在保留細胞精確空間定位的同時,檢測細胞內全轉錄組的表達,以此來研究在發育或疾病發生發展過程中起關鍵性作用的細胞亞群及其分子機制。然而,現有的空間轉錄組學技術存在兩個不足:1. 基於測序的空間轉錄組技術無法實現真正意義上的單細胞解析度;2. 基於成像空間轉錄組的技術能檢測到的基因通量有限。為了突破技術的局限性,生物資訊學家設計了多種演算法整合空間轉錄組與單細胞轉錄組數據,預測細胞類型的空間分佈和/或單個細胞的完整轉錄組資訊。這些演算法大大加深了我們對空間轉錄組學數據及相關生物學和病理過程的理解。然而,由於不同演算法的工作原理和適用範圍存在顯著差異,使得研究者很難選擇最佳演算法用來預測細胞類型和基因表達的空間分佈。

2022年5月16日,中國科學技術大學生命科學與醫學部瞿昆教授課題組在Nature Methods上發表了文章Benchmarking spatial and single-cell transcriptomics integration methods for transcript distribution prediction and cell type deconvolution通過設計一整套分析流程,系統性評估了16種空間轉錄組和單細胞轉錄組數據整合演算法在預測基因或細胞類型空間分佈方面的性能。

49601652831689163

瞿昆教授課題組長期致力於開發生物大數據分析演算法和軟體。在此項研究中,課題組收集了45對同一組織來源的空間轉錄組與單細胞轉錄組數據集,和32個模擬數據集,並設計了多種指標,從準確性、魯棒性、計算資源耗時等多維度系統性評估了16種整合演算法的性能。

53201652831689384

圖2:整合分析流程

結果顯示,Cell2location、SpatialDWLS和RCTD演算法能更加準確的預測細胞類型的空間分佈;Tangram、gimVI和SpaGE演算法是預測基因表達空間分佈的最佳演算法。Tangram、Seurat和LIGER計算效率相對較高,適合處理大規模數據集。該研究工作總結了每種演算法的屬性、性能和適用性,總結了高效演算法的優勢,為研究人員進一步提升演算法性能提供了參考;並在github上提供了整合空間轉錄組和單細胞轉錄組數據的分析流程,以幫助研究人員為處理自己的數據選擇最佳的分析工具。

中科大生命科學與醫學部瞿昆教授為本文的通訊作者,課題組特任副研究員黎斌(現北京生命科學研究所究員)、博士生張文和特任副研究員郭闖為本文的共同第一作者。中科大薛天教授、陳發來教授和程臨釗教授課題組為該工作的順利開展提供了巨大支援。

原文連結:

https://doi.org/10.1038/s41592-022-01480-9

製版人:十一    

      中國網是國務院新聞辦公室領導,中國外文出版發行事業局管理的國家重點新聞網站。本網通過10個語種11個文版,24小時對外發佈資訊,是中國進行國際傳播、資訊交流的重要窗口。

      凡本網註明“來源:中國網”的所有作品,均為中國網際網路新聞中心合法擁有版權或有權使用的作品,未經本網授權不得轉載、摘編或利用其他方式使用上述作品。

電話:0086-10-88828000

傳真:0086-10-88828231

媒體合作:0086-10-88828175

品牌活動合作:0086-10-88828063

廣告合作:0086-10-88825964