英國《自然》《自然·通訊》《自然·醫學》雜誌近日同時發表來自多家研究機構的一系列報告,集中描述了對一個匯集了逾14萬人樣本的數據庫——基因組聚集數據庫(gnomAD)的應用,該數據庫擁有迄今最大規模的人類遺傳變異體公開目錄,是我們深入認識人類基因功能、發現新疾病相關基因的寶貴資源。

人類基因組中絕大多數基因的功能依然未知。揭示基因功能的一種方法是觀察基因發生突變後的結果。這些變異體往往會産生不良結果,但通常較為罕見。大規模基因測序研究有助於考察這些功能喪失型變異體的效應,或能帶來對人類生物學特徵和疾病的重要見解。

此次《自然》發表的一篇概述性報告中,美國麻省理工學院—哈佛大學博德研究所科學家康拉德·卡澤維斯基及其同事,描述了從125748個全外顯子組和15708個全基因組測序數據集中鑒定出的443769個預測的功能喪失型變異體。鋻於這些變異體預計會影響其編碼蛋白的正常運作,團隊進而評估了這些變異體對生理機能的影響:究竟是幾乎沒有影響,還是會導致嚴重的健康問題。《自然》同時發表的另外兩篇報告,利用該數據庫創建了一個結構性變異體資源庫,並評估了基因缺失、複製,甚至是顛倒方向所産生的影響。

同時出爐的其他報告,探討了如何利用人類功能喪失型變異體評價候選藥物靶點,提升對遺傳變異體的臨床解讀,以及如何更詳細地考察特異性功能喪失型變異體。譬如英國帝國理工學院科學家尼古拉·威芬和同事分析了與帕金森病風險增加相關的一個基因的變異體,結果顯示靶向這個基因或是一種安全的治療方法。

科學家們表示,gnomAD項目的樣本量是其前任的兩倍多,之前的外顯子組聚集聯盟(ExAC)收錄了6萬多個外顯子組數據。卡澤維斯基與同事也指出,他們距離鑒定出人類全部的預測功能喪失型變異體還很遙遠,儘管如此,他們認為這項資源能夠提升我們對罕見和常見遺傳病的評估。

總編輯圈點

生物學和醫學的發展,已經使科學家對很多疾病的研究直抵分子和基因層面。深入研究人類基因組,成為解鎖諸多重大疾病病因的關鍵,帕金森症、阿爾茲海默症、自閉症等一系列病因複雜的疾病都在此列。除了尋找病因,對人類基因組的破譯,也可以為很多疾病的治療定位重要藥物靶點,從而為研發更有效的生物藥物、制定更精準的診療方案帶來希望。