俄羅斯聖光機大學(ITMO)生物資訊學研究人員開發了一種演算法,可幫助評估基因對人體過程(包括疾病發展)的影響。這項研究發表在《BMC生物資訊學》上。

脫髮、肥胖或視力低下可能與特定基因有關,識別出相關基因組,有利於研究和治療。此外,為確定基因和病情之間是否存在聯繫,了解基因之間的相互作用也非常重要。

ITMO助理教授愛列克謝·謝爾蓋西切夫解釋説:“總的來説,每個人有超過2萬個基因。通過將患者病情相關基因與健康人的基因進行比較,我們可以看到二者之間活性和表現形式的差異。基於此資訊,可以創建一個共同的圖示,顯示所有基因之間的相互聯繫,並且每個基因都被分配一個權重因子。通常,科學家們只繼續研究最活躍的基因,對其進行特殊的子圖繪製,但是將這些基因從‘普通背景’中分離出來,就失去了評估每個基因與其他基因的關聯性進而進行診斷的機會。”

在新研究中,研究人員不僅專注于權重因子最高的那個基因系統,還提出了一種新方法,可利用整個基因組上的數據生成數十萬個子圖。該演算法基於馬爾可夫鏈蒙特卡羅方法,可計算每個樣本與所討論病情之間的聯繫概率,並就每個基因之間的相互作用分析樣本的組成。

研究人員從一組基因中刪除一個基因,如果活躍基因的數量增加,則表示正確並保存結果。否則就重新開始。通過一系列步驟,權重因子開始快速增長。這樣一來,該演算法就可以生成大量圖形。

有了這樣一個樣本組,研究人員就可發現比其他基因更頻繁出現的基因。如果一個基因出現在90%的此類子圖中,那麼就可90%地確定該基因與相關疾病的關係。

該項目研究人員指出,這一演算法未來可表示為帶有滑動條的程式,允許用戶出於各種目的以各種置信度生成結果。例如,置信度水準越低,顯示的基因就越多,反之亦然。如果僅需要確定信任的基因,可以將置信度水準設置為約99%。