近期熱播綜藝《我家那小子》中,兩位年近30的藝人體驗了一把基因檢測項目。一口唾液、一週等回的檢測報告給出了對於他們心理特質、營養代謝、運動能力等的評估。有趣的是,檢測報告還預測了兩人的身高,但卻與實際身高出入不小。

基因檢測發展初期一直被用於疾病的診斷,近些年的基因檢測産品也能為健康人進行不同功能的診斷,包括通過對比得出宗譜等帶有娛樂色彩的項目。隨著新産品的開發,基因檢測能夠道出的身體秘密越來越多。

身高基因發力像“集體拔河”

要通過基因預測身高,需要先知道哪些基因和身高有關。過往對25萬多人進行的大量全基因組關聯分析發現,大約有700個基因區域與身高有關,它們的綜合作用可能決定他長1米8,還是只長1米7。

就像集體拔河,700個人參加“拔河”合力只能“拔高”10釐米,那誰是裏面發力最大的呢?

為了縮小範圍,尋找最有“功勞”的基因,全世界的科學家做了大量的工作。他們有的對有明顯身高差別的不同種族人群進行了全基因組的序列分析,找到群體序列間的差別,確定部分突出基因。有的在對模型動物的疾病研究中“無心插柳”,觀察到某一基因的突變影響了動物的骨骼發育,認為其與身高相關。

例如,哈佛醫學院研究者發現矮的秘魯人攜帶了一種叫做FBN1基因的等位基因,該等位基因與FBN1通常的DNA序列在1個鹼基上存在差別,這一微小的差別改變了纖維蛋白-1(在結締組織中提供結構支援)中的一個氨基酸。攜帶一個這種突變的人會矮約2.2釐米,而攜帶2個這種FBN1突變的人則會矮4釐米以上。

再例如有研究人員發現攜帶SPAG17基因定向突變的小鼠脛骨和股骨短于正常小鼠,它們有骨骼畸形和骨礦化缺陷。

不過上面的研究就像“點名”,難以分離出究竟有哪些基因在人體長高的過程中起著決定性作用。而另一些科學家則希望批量地厘清:影響身高的基因中,究竟有哪些是通過影響骨骼發育進而影響身高的。

2017年12月5日美國《電子生命》發表了哈佛大學的研究,研究人員對700個基因中所有可能的約6萬多個與身高相關的基因變異體進行分析,最終發現了約900個基因變異體。這樣基因變異影響身高的密碼可以精確到單個鹼基級別。

2018年,中國科學家在《細胞》上發表論文,通過對14萬餘例無創産前基因檢測數據展開的群體水準研究,一次性發現並且驗證了48個與身高以及13個與BMI(身體品質指數)顯著相關的基因位點,包括這些位點在內的常見突變位點分別解釋了48%的身高遺傳率以及10%的BMI遺傳率。隨著研究的進一步深入,科學家和演算法工程師有可能利用這些資訊構建適合於中國人的身高預測模型,通過基因數據推斷個人的身高情況。

 新技術可能帶來新位點

基礎研究為尋找身高與基因的關聯奠定了基礎。對個人而言,要進行實際測序,才能獲取每個個體不同他人的數據。

人基因組測序的方法叫重測序(Resequence)。華大智造首席運營官蔣慧介紹,人類基因組計劃構建出來參考基因組集,現在每個人測基因組的時候,並不是把個體的基因組組裝出來,而是把個體的基因組測完後和參考基因組做比較。

對於有具體功能基因測序産品來説,一般不會對每個人進行全基因組的測序,而是針對具體的功能進行確定位點的測序,再進行分析比對。

“每個人的基因組是有差異的,與統一的參考模板比對,會讓很多差異難以體現,比如除開在單鹼基上的突變,還可能存在一些個體獨有的序列難以發現。”蔣慧説,未來隨著基因測序成本的降低,如果每個人都進行從頭測序,也就是真正的個人自己的基因組,將可以反應個體的資訊,會是一個重要的跨越,很可能發現更多不同的資訊。

相似的研究正在進行,《自然》曾發表一項由波士頓兒童醫院、博德研究所、倫敦瑪麗女王大學等近280個研究團隊共同完成的大規模研究,不採用傳統的全基因組關聯分析技術,改為採用外顯子晶片技術。因為前者雖然能夠成功挖掘出常見的基因突變但不能篩選出相對罕見卻影響顯著的遺傳變異,且分析範圍不包括更有潛力的非編碼區域。

通過新技術,研究團隊找到了83個罕見的遺傳變異,它們被證實會直接影響蛋白質表達,從而顯著影響人類身高。其中24個基因變異對身高的影響超過1釐米。

數據分析考驗模型和策略

一個生物的表型是多個因素綜合作用的結果,比如身高,不僅與骨骼發育有關,還與營養物質的吸收、生長素的分泌等其他因素相關,那麼其他關聯的基因是否要進行檢測,並以多少權重加入到演算法和模型的構建中,對於不同的測序分析公司來説應該是不同的。

檢測是基礎,但數據分析是關鍵。

到數據分析、出報告的階段,基因檢測已經走出了生物學的範疇,而進入了模型構建、資訊處理等資訊學的範疇。

《我家那小子》中的專家表示,目前酒精代謝的檢測是相對較準的。但就是這樣一個關聯基因較少、位點確切的檢測要想更準確或者反應更多的東西,演算法程式也不能是“單線程”,歸根結底,人體是錯綜複雜的整體。

“華大開發出的對酒精代謝的‘微醺’檢測最初檢測的也是與酒精代謝相關的位點。”華大基因工程師郭瑞東介紹,但在升級後的“微醺”裏,還包括了更多位點。有一個屬於FTO基因,當初設計微醺時,認為該基因是與酒精的味覺相關的。不過在2015年9月份,研究者們在權威期刊《新英格蘭醫學》的一篇論文上發現,FTO基因的不同會影響前脂肪細胞的線粒體産熱機制,從而細胞自發地由能量消耗的棕色脂肪細胞(好的)轉換為能量存儲的白色脂肪細胞(使你變胖的元兇)。

看到這則報道,微醺團隊的科學家想到在已有的微醺産品中,是要求用戶填寫其身高體重的,既然也測了FTO基因,那為什麼不能拿微醺的數據去驗證一下這個發現呢?於是他們計算了微醺用戶的BMI與其FTO基因的相關關係。結果顯示,微醺的數據驗證了新英格蘭醫學上的結論。

因此,對於基因數據來説,挖掘是一門充滿想像的“藝術”。

“科學上對許多基因的功能的研究還不夠透徹,一個基因可能與多項功能相關,因此基因檢測的預言準確性更多停留在統計意義上。”郭瑞東表示,但不管檢測的結果是否符合預期,基因檢測産品都會為個人給出個性化的資訊。讓基因給出建議,是基因檢測産品的最大價值所在。

聽取基因檢測建議的最著名例子,是好萊塢女星安吉麗娜·朱莉通過基因檢測,選擇切除乳腺手術降低患乳腺癌的風險。她的做法是否妥當有無過激,觀點不一。但無論基因檢測給出的建議是什麼,在具體實施方面必須聽取專業意見是毋庸置疑的,畢竟如果根據建議進行干預,一旦需要尋醫問藥,則是進入診療階段,需要兼顧資質和規範。