驅動科學發展的原動力是無知。——馬特
牛津英語詞典將“基因組”一詞歸功於德國生物學家溫克勒。1920年,他的著作《植物和動物群落中孤雌生殖的分佈和原因》出版。書中提出:對單倍體染色體組用“基因組”來表述,因為它與相關的原生質一起構成物種的物質基礎……
健客:什麼是單倍體?
雲飛:染色體倍性是指細胞內同源染色體的數目,其中只有一組的稱為“單套”或“單倍體”。
健客:單倍體是不是就是細胞內含一個染色體組?
雲飛:不是,一組和一個還是有區別的,有的單倍體生物的細胞中不只含有一個染色體組。絕大多數生物為雙倍體生物,其單倍體的細胞中只含一個染色體組,如果原物種本身為多倍體,那麼它的單倍體細胞中含有的染色體組數一定多於一個。如四倍體水稻的單倍體含兩個染色體組,六倍體小麥的單倍體含三個染色體組。
在人類中,只有精子和卵子是單倍體,其他細胞都是雙倍體細胞。如果一個人類胚胎部分染色體為多倍體,多數不能正常發育,但如果是性染色體是多倍體(XXX或XYY)、三套第21對染色體(唐氏綜合症)、三套第18對染色體(愛德華氏症)、三套第13對染色體(巴陶氏症),則有機會長大成人,不應歧視。
1986年,美籍醫學家諾貝爾獎得主杜爾貝科在《科學》雜誌撰文回顧腫瘤研究的進展,指出要麼依舊採用“零敲碎打”的策略,要麼從整體上研究和分析人類基因組。文中指出:如果我們想更多地了解腫瘤,我們必須關注細胞的基因組。
1990年,人類基因組計劃正式啟動。美國、英國、法國、德國、日本和中國科學家共同參與了這一規模宏大,跨國跨學科的科學探索工程。其宗旨在於測定組成人類染色體(指單倍體)中所包含的約30億個鹼基對組成的核苷酸序列,從而繪製人類基因組圖譜,並且辨識其載有的基因及其序列,達到破譯人類遺傳資訊的最終目的。“人類基因組計劃”在研究人類過程中建立起來的策略、思想與技術,構成了生命科學領域新的學科——基因組學,可以用於研究微生物、植物及其他動物。人類基因組計劃與曼哈頓原子彈計劃和阿波羅計劃並稱為三大科學計劃,是人類科學史上的又一個偉大工程,被譽為生命科學的“登月計劃”。“基因組”一詞也從鮮為人知,到炙手可熱。
健客:在《細菌傳》中講過人類基因組計劃,其中還包括若干模式生物體基因組計劃。
雲飛:嗯,第一個被測序的細菌基因組是流感嗜血桿菌,于1995年完成。
1996年6月,在國際網際網路的公共數據庫中公佈了釀酒酵母的完整基因組順序,被稱為遺傳學上的里程碑。因為這是人們第一次獲得真核生物基因組的完整核苷酸序列。實際上,在釀酒酵母基因組測序前,人們通過傳統的遺傳學方法已明確釀酒酵母中編碼RNA或蛋白質的基因約2600個。不過,它們只是釀酒酵母基因組的一部分。
健客:等等,編碼RNA是什麼意思?
雲飛:編碼RNA就是編碼蛋白質的RNA。上篇説過,rRNA是一種非編碼RNA,也就是説不會被翻譯為蛋白質。生物體中的RNA種類繁多,功能複雜,一般按照是否編碼蛋白質將其分為編碼RNA和非編碼RNA兩大類,同理,DNA可分為編碼DNA和非編碼DNA。
在分子生物學和遺傳學領域,基因組是指生物體所有遺傳物質的總和。這些遺傳物質包括DNA或RNA(病毒RNA)。基因組包括編碼DNA和非編碼DNA、線粒體DNA和葉綠體DNA。研究基因組的科學稱為基因組學。通過對釀酒酵母的完整基因組測序,發現在12068kb的全基因組序列中有5885個編碼專一性蛋白質的開放閱讀框。這意味著在酵母基因組中平均每隔2kb就存在一個編碼蛋白質的基因,即整個基因組有72%的核苷酸順序由開放閱讀框組成。這説明酵母基因比其他高等真核生物基因排列緊密。如線上蟲基因組中,平均每隔6kb存在一個編碼蛋白質的基因;在人類基因組中,平均每隔30kb或更多的鹼基才能發現一個編碼蛋白質的基因。酵母基因組的緊密性是因為基因間隔區較短與基因中內含子稀少。
健客:再打斷一下,kb是基因組鹼基序列的長度單位,在《細菌傳》中講過,可是,開放閱讀框是什麼意思?
雲飛:在分子生物學中,開放閱讀框是開始於起始密碼子,結束于終止密碼子,連續的鹼基序列,是DNA序列中具有編碼蛋白質潛能的序列。
健客:內含子是什麼意思?
雲飛:內含子是基因中在編碼RNA剪切後切除的部分。與之對應的是外顯子,是基因中在編碼RNA剪切後保留的部分,絕大部分的外顯子為編碼序列。
健客:今天太難啦!
雲飛:哈哈,專業名詞了解一下。
釀酒酵母基因組的開放閱讀框平均長度為1450bp。遺傳資訊分佈在16個染色體中。其中有大約三分之一的編碼基因被認為是沒有家族譜係的“孤兒基因”,它們沒有任何明顯的“祖先”,就好像是憑空出現一樣。科學家正在全力以赴、追蹤著它們的來龍去脈。當然,這一數據仍在不斷修正中。
健客:等等,孤兒基因,挺形象嘛。
雲飛:嗯,一些孩子在很小的時候便成孤兒,沒有家庭擋風遮雨,他們要付出千百倍于常人的努力與命運抗爭,迎難而上去激發自己的潛能。而這些孤兒中的佼佼者,比如亞裏士多德和史蒂夫喬布斯,有時竟能改變這個世界。孤兒基因有相似的情形,而且並非釀酒酵母獨有。在人體基因片斷中,有超過三分之一的部分既找不到與它們同源的基因,也沒有發現它們的演化史——看上去既沒有“父母”,也沒有任何“親屬”,就像是不知道從哪冒出來的“孤兒”。但是千萬不要小看它們,要知道在這些“孤兒基因”中,有一部分在人類大腦的進化過程中,扮演了相當重要的角色。
釀酒酵母染色體是由高、低G-C含量DNA結構域交替組成的,這和基因密度在染色體中的變化是呈相關性的。比如富含G-C區的波峰總與每一個染色體臂中的高度重組區相重合,而富含A-T區的波谷總與低度重組的著絲點和端粒序列相重合。也有實驗證實,在酵母中與遺傳重組起始有關的基因雙鏈分離現象,與此染色體中富含G-C的區域直接相關。
健客:還好,在《細菌傳》中講過鹼基互補配對、基因重組、著絲點和端粒。別太難了,好嗎?
雲飛:再介紹最後一點,留個念想。
釀酒酵母基因組另一個特徵是含有許多DNA重復序列。在開放閱讀框或者基因的間隔區包含大量的三核苷酸重復,引起了人們的高度重視。因為一部分人類遺傳疾病是由三核苷酸重復數目的變化所引起的。還有更多的DNA序列彼此間具有較高的同源性,這些DNA序列被稱為遺傳冗余。酵母多條染色體末端具有長度超過幾十個kb的高度同源區,它們是遺傳豐余的主要區域,這些區域至今仍然在發生著頻繁的DNA重組過程。遺傳冗余的另一種形式是單個基因重復,其中以分散類型最為典型,另外還有一種較為少見的類型是成簇分佈的基因家族。成簇同源區是酵母基因組測序揭示的一些位於多條染色體的同源大片段,各片段含有相互對應的多個同源基因,介於染色體大片段重復與完全分化之間的中間産物,因此是研究基因組進化的良好材料,被稱為基因重復的化石。染色體末端重復、單個基因重復與成簇同源區組成了酵母基因組遺傳豐余的大致結構。研究表明,遺傳冗余中的一組基因往往具有相同或相似的生理功能,因而它們中單個或少數幾個基因的突變並不能表現出可以辨別的表型。
健客:核苷酸,在《細菌傳》中講過,可是表型是什麼意思?
雲飛:表型,又稱表現型,有機體可被觀察到的結構和功能方面的特性,如一個人是單眼皮還是雙眼皮。表型是基因型和環境交互作用的産物,即特定的基因型在一定環境條件下的表現形式。因此,表型=基因型+環境條件。基因型控制著生物個體的表現型,是表型的決定性因素,但不是唯一的決定性因素,它與生物個體所處的特定的環境條件同時發揮作用,使得表型呈現出多樣性。
健客:講完了吧。如果這本書一定要有一個主角的話,那麼非酵母莫屬,絕對的高頻詞,大概20篇左右都有其身影吧,而且承載的知識密度太大了。我有點頭暈。
雲飛:哈哈,知道你吃不消了,咱們換個話題。
1998年,漢德爾斯曼想出了一個名字:宏基因組學,旨在研究一個群落的基因組。顯然,佩斯是該學科的開創者。漢德爾斯曼曾説過,“自顯微鏡問世以來,宏基因組學可能是微生物研究中最重要的事件”。她開始研究生活在各種環境中的微生物:阿拉斯加的土壤、威斯康星州的草原、從加利福尼亞州礦山上衝下來的酸性物質,還有馬尾藻海的海水、深海蠕蟲的屍體、昆蟲的內臟等等。當然,也有微生物學家像列文虎克一樣,把研究對象轉向了自己。
健客:宏基因組學,果然是一個霸氣的名字,研究對象從一個物種,到相同時間聚集在同一區域或環境內各種微生物。還算容易理解,在《細菌傳》仲介紹過,不陌生。佩斯是上篇的主角,漢德爾斯曼好像之前沒出現過。
雲飛:漢德爾斯曼是一個奇女子。1959年生於紐約,1979年獲康奈爾大學農學學士學位,1984年獲威斯康星大學麥迪遜分校分子生物學博士學位。她主要研究土壤和昆蟲腸道中的微生物,其中她對宏基因組學有深入研究,並開創性地運用宏基因組學的方法研究抗生素耐藥性的産生,取得了突破性進展。她負責編寫“宏基因組學”這一術語的具體解釋。此外,她還支援女性投身科研,她的一項研究發現,科研人員簡歷上的性別影響了教授聘用、科研經費申請、獎學金申請等方面。2015年,她走進白宮,成為奧巴馬總統的科學顧問。
健客:興趣來了,怎樣才能成為美國總統的科學顧問呢?
雲飛:這可難住我了。漢德爾斯曼是接到了時任奧巴馬總統的最高科學顧問、科技政策辦公室主任約翰的電話,問她是否願意加入白宮,管理科技政策辦公室。起初,她沒有答應,因為她不願意離開耶魯大學,那裏的實驗室是她和她 的本科生、研究生和博士後探討昆蟲內臟、土壤以及植物中的微生物群落的地方。後來,她同意加入白宮,因為約翰的才智和總統對科學的強烈的使命感打動了她。在經過美國聯邦調查局(FBI)標準化但讓人疲憊不堪的背景審查、關於如何回答參議院問題的速成班,以及參議院商業、科學和交通委員會讓人驚訝的有趣的確認聽證會之後,再加上長達9個月的等待遴選的時間,她最終被參議院確認並宣誓擔任白宮科技辦公室副主任。扯遠了,馬上拉回來。
1998年,俄勒岡州森林的樹木出現大片死亡。美國林業局的科學家從112棵死亡和正在枯萎的樹上取了樣本,發現除了4棵樹以外,其餘都感染了同一種蜜環菌。進一步的研究,讓他們驚奇地發現,其中61棵樹上感染的蜜環菌的基因是完全相同的,也就是説,它們是從同一個生物中延伸出來的。受其感染的樹木之間的最遠距離為4公里。據估計,這個蜜環菌佔地9.6平方公里,約有2400歲(有科學家認為它已經8650歲了)。至於品質,根據檢測蜜環菌在土壤中的生物量來估算,菌體總重估計超過600噸,一舉成為迄今世界上最重的、最古老的、佔地面積最大的生命個體。
健客:判定採樣蜜環菌基因是否相同是不是要進行基因組測序呢?
雲飛:當然不用那麼麻煩。只要對若干等位基因進行測序、對比就可以了,跟親子鑒定一個道理。
健客:不行了,頭暈,想吃小雞燉蘑菇,補補腦。
雲飛:哈哈,李玉院士説的“世界最大的生物是在美國發現的榛蘑”,指的就是1998年在俄勒岡州發現的奧氏蜜環菌。2017年,安德森在接受《大西洋月刊》採訪時説,他正在對那株高盧蜜環菌的不同部分進行DNA測序,希望理解經歷了1500年,它是如何變異的。後來,他在論文中修正當年的數據——這是一個存活了2500年之久,重達440噸的高盧蜜環菌。你看,一個是奧氏蜜環菌,一個是高盧蜜環菌,它們同屬不同種。
健客:為什麼要研究蘑菇變異呢?
雲飛:隨著生長,一個細胞分裂成兩個,産生新的子細胞。隨著時間的推移,細胞中的DNA會被破壞,導致錯誤,即突變,並潛入遺傳密碼。這被認為是導致衰老的關鍵機制之一。但高盧蜜環菌對這種DNA損傷有一些內在的抵抗力。“突變頻率比我們想像的要低得多,”安德森説,“為了實現這種低水準的突變,我們預計細胞每生長一米平均分裂一次。但令人驚訝的是,這些細胞非常微小,只有幾微米大小,所以每一米的生長需要數百萬個細胞。”安德森和他的團隊認為,這種真菌有一種機制,可以幫助保護其DNA免受損害,使其成為自然界中最穩定的基因組之一。雖然科學家們還沒有弄清楚這到底是什麼,但高盧蜜環菌基因組的穩定性可以為人類健康提供新的見解。
健客:我還是對誰是最大生物比較感興趣。
雲飛:獵奇嘛,正常。藍鯨是地球上依然活著的最大動物,其體型最長可達33米以上,體重可以超過180噸,但絕對不是地球上最大的生物,其實一些植物也很大。例如地球上最高的樹木,例如澳洲的杏仁桉樹以及美國的被命名為亥伯龍神樹的巨型紅杉,它們的高度都超過百米。除此之外最常被提及的還有位於美國猶他州中南部魚湖國家森林公園的潘多林,佔地幾十公頃,數萬棵白楊都擁有相同的基因,它們都是從最初的一棵白楊無性繁殖而來。從某種意義上來説潘多林就是一個整體,但是令人比較擔憂的是這個巨大的生命正在走向死亡,它的面積連年在縮減,主要是受到病蟲的災害,究其根本原因就是基因上沒有什麼多樣性,一損俱損。
極具競爭力的是位於澳大利亞西海岸的波西多尼亞海草,壽命超過10萬年的無性繁殖海草。通過測量發現這片海草覆蓋了大約180平方公里的淺水區,並且年齡已經超過了4500歲。今後,地球最大生物或許不再是美國榛蘑而是澳大利亞海草。
健客:不得不説,植物或真菌,這種巨大體型有種作弊的感覺,動物很難複製。特別是蘑菇屬於真菌,被歸為微生物,似乎有背常識,後來居然還成了最大生物,感覺怪怪的。
雲飛:這筆賬要算在科學頭上。看上去,蘑菇似乎跟微小生物、巨大生物都扯不上關係,但是科學把三者聯繫起來。人類基因組計劃的主要負責人之一蘭德指出,基因組提出的問題比其回答的還要多。就像阿拉伯故事一千零一夜一樣,你可以躺在床上翻閱基因組,而每天它都會帶給你一個新故事。套用一下這句話。科學提出的問題比其回答的還要多。你看,一樣適用。正如英國科普作家馬特在《基因組》一書中説的,“驅動科學發展的原動力是無知”。據説,密歇根州推出蜜環菌旅遊。每年秋天舉辦“蜜環菌節”,遊行、比賽和大餐。科學有新發現,旅遊有新項目,經濟有新發展,皆大歡喜。
欲知後事如何,且聽下回分解。