後基因組生物學即在2005年以後,人類基因組的全核苷酸順序測定工作完成,而且,到那時也許還有一些別的生物的基因組全核苷酸順序測定工作完成了,到那時生物學該是個什麼樣子?生物學該研究些什麼?這些問題目前我們還不能十分有把握地回答,但至少可以說,那時是基因組測定工作完成後的時代,那時的生物學也就是所謂"後基因組生物學。"有人對2001年後的生物學作出了一些預測。
首先,我們將能夠對更多的疾病在基因中找到答案,我們將能夠對更多疾病套用基因藥物來治療。本來基因是不應申請專利的,被授於專利的只限於發明,而不是發現。但是,每克隆一個與疾病有關的基因,搞清它的作用機制、並製成基因藥物用於臨床,平均要投入1億美元。有投入就必須有回報,如果投入者的成果最後大家都能享用,那么經過商業競爭新產品就只能以略高於成本的價格出售。如果是這樣,投入者的先期投入將無法收回。其後果一是打擊了投入者的積極性,二是限制了投入者對新項目投入的能力。所以,人類基因現在也被授予了專利。如肥胖基因,該基因的克隆曾被一家生物製藥公司以3000萬美元收購;但該公司並未自己生產減肥藥物,而是在第二年以7000萬美元的高價轉手獲利,年利率高達250%。可見,與基因有關的買賣將會在今後大量湧現。
2001年以後的藥物,很多是基因藥物,基因既然可以申請專利,就會變成一項有利可圖的產業。在這個產業中,我泱泱大國如何作為呢? 10萬基因我們能"搶"到多少呢?在"人類基因組"研究方面我們應該做些什麼呢?這是值得我國科學界深思的問題。
1997年11月11日聯合國教科文組織在巴黎召開大會,通過了《人類基因宣言 》。宣言指出:每個人身上的基因物質是"人類的共同遺產",不應成為盈利的手段。這就是說,科學研究應該與商業行為分開,科學研究可以從商業機構那裡得到資助,但科學成果應該是人類的共同財富。
除了基因藥物的研製以外,後基因組生物學至少還應進行以下幾方面的研究。
關於基因表達譜的研究
前面講到尿黑酸尿症是單基因遺傳病,只要有缺陷的基因被正常基因取代,問題也就迎刃而解了。
這些過程肯定是涉及基因組中一群基因的過程,這些基因協同活動、程式化地表達,從而使生命過程有條不紊地進行。我們要了解的就是這一群基因的表達模式(gene expression pattern),即基因表達譜,而不是僅僅某個基因的活動情況,要解決如此複雜的問題就必須在方法學上有所突破,創造出高效快速地同時測定基因組成幹上萬的基因活動的方法。有人提出了"基因表達連續分析法"(serial analysts of gene expression,SAGE)和"微陣列法"(microarry),企圖能解決以上問題,以上兩法的模式說明如圖。
基因表達連續分析法:如圖1所示,我們可同時測定正常人和病人細胞中的基因活動情況。基因表達產生mRNA,表達的基因數越多,mRNA的種類也越多;某一基因的表達水平越高,該基因的mRNA的量也就越多。將所有mRNA都反轉錄成cDNA,從每一個cDNA中截取一段9bP的"標記"片段,進行PCR擴增、拼接,對拼接後的大片段測序,即可對各表達基因進行分類、定量統計。用此法即可看出正常細胞和病變細胞中表達基因在種類和水平上的差異,同時還可能從基因表達圖的特別處發現新的基因。套用此法還可比較不同分化細胞里基因表達群在種類和水平上的差異。微陣列法: 此法是將生物的mRNA反轉錄成cDNA,並建立CDNA基因文庫(雙鏈CDNA的克隆);然後將這些克隆一個一個地放入9b孔板上(每孔一個),加熱使CDNA變性並固定;最後如圖1(左)所示,將正常細胞和病變細胞的mRNA製成。DNA,分別用不同的顯色標記(如紅色螢光標記和綠色螢光標記),並分別滴入各孔進行分子雜交。測量各孔的顯色反應,根據顏色和強度即可直觀地反映出不同細胞中活動基因在種類及水平上的差異。已經有人用此法測定了酵母1800個基因的表達情況,據說他們還準備對酵母抱子形成時全套6500個基因的活動進行測定。
對蛋白質組的研究
在基因組中究竟有哪些部分能表達成蛋白質?顯然,我們現成已知的蛋白質產物僅僅只是其中的一小部分,還有許多我們不清楚的蛋白質種類。2001年以後,搞清基因組所編碼的全部蛋白質將是科學家的任務之一。相對於基因組(genome),全部蛋白質即為蛋白質組(proteome)。
基因組分析和基因功能研究
以釀酒酵母基因組為例,根據基因組分析,有5885個蛋白質基因,140個rRNA基因,40個snRNA基因和275個tRNA基因,總計6340個基因。這一數目遠遠超過了測序前由遺傳分析得出的基因數(約超出1000個)。而對一些功能未知的基因進行計算機序列分析,發現其中半數可歸於已知的功能蛋白質類(激酶,轉錄因子等)。
基因組分析還能發現與染色體高級結構和行為(重組、轉座、複製和表達調控等)有關的信息。如酵母第3號染色體沿長軸鹼基組成(G+C)的周期變化與局部基因密度變化可能存在平行關係,而染色體各區AT或GC豐度則可能與重組率有關。
關於基因組進化與生物進化的研究
當對生物進化的研究進入分子水平時,產生了"分子進化"這一分支領域。分子進化是對不同生物的同源分子,即結構和功能相似的蛋白質或編碼該蛋白質的基因,進行比較。從比較的角度看,這與在巨觀上比較不同生物的同源器官類似,所不同的是,巨觀比較時尺度單位比較粗放,分子水平上的比較則尺度單位比較精細。分子水平上是以胺基酸或核苷酸為單位進行比較的,比較同源分子的組成和順序,並從中揭示生物進化的歷程。
僅從分子的角度進行比較,所得到的結果必然帶有局限性和片面性。因為分子本身就是生物體的一個局部,不同的分子在隨生物進化時也許會走不同的途徑。即使是綜合若干分子的進化途徑,得出一個反映生物進化的綜合面貌,這樣的結果顯然還是不如基因組比較所得到的結果。
關於遺傳語言的研究
如前所述,人類基因組約含10萬個基因,由1億鹼基對構成,僅占基因組大小的3%。在餘下的97%的非編碼序列中,僅少部分已知與基因調控或與染色體的結構和行為有關,大多數的功能還不清楚。如此大的未知部分顯然不能全都看成是作為進化後備力量的"基因冗餘"。在基因組這篇大文章里,顯然不是只有基因這一種語言,肯定還有許多我們還看不懂,甚至還沒料到的其他遺傳語言。破譯這些語言,也許需要數學家、計算機科學家和生命科學家的通力合作,有待於非線性科學的發展。