簡介
什麼是基因組(Genome)?基因組就是一個物種中所有基因的整體組成。人類基因組有兩層意義:遺傳信息和遺傳物質。要揭開生命的奧秘,就需要從整體水平研究基因的存在、基因的結構與功能、基因之間的相互關係為什麼選擇人類的基因組進行研究?因為人類是在“進化”歷程上最高級的生物,對它的研究有助於認識自身、掌握生老病死規律、疾病的診斷和治療、了解生命的起源。在人類基因組計畫中,還包括對五種生物基因組的研究:大腸桿菌、酵母、線蟲、果蠅和小鼠,稱之為人類的五種“模式生物”。
HGP的目的是解碼生命、了解生命的起源、了解生命體生長發育的規律、認識種屬之間和個體之間存在差異的起因、認識疾病產生的機制以及長壽與衰老等生命現象、為疾病的診治提供科學依據。
現代遺傳學家認為,基因是DNA(脫氧核糖核酸)分子上具有遺傳效應的特定核苷酸序列的總稱,是具有遺傳效應的DNA分子片段。基因位於染色體上,並在染色體上呈線性排列。基因不僅可以通過複製把遺傳信息傳遞給下一代,還可以使遺傳信息得到表達。不同人種之間頭髮、膚色、眼睛、鼻子等不同,是基因差異所致。
隨著人類基因組逐漸被破譯,一張生命之圖將被繪就,人們的生活也將發生巨大變化。基因藥物已經走進人們的生活,利用基因治療更多的疾病不再是一個奢望。因為隨著我們對人類本身的了解邁上新的台階,很多疾病的病因將被揭開,藥物就會設計得更好些,治療方案就能“對因下藥”,生活起居、飲食習慣有可能根據基因情況進行調整,人類的整體健康狀況將會提高,二十一世紀的醫學基礎將由此奠定。 利用基因,人們可以改良果蔬品種,提高農作物的品質,更多的轉基因植物和動物、食品將問世,人類可能在新世紀裡培育出超級作物。通過控制人體的生化特性,人類將能夠恢復或修復人體細胞和器官的功能,甚至改變人類的進化過程。
研究內容
HGP的主要任務是人類的DNA測序,包括下圖所示的四張譜圖,此外還有測序技術、人類基因組序列變異、功能基因組技術、比較基因組學、社會、法律、倫理研究、生物信息學和計算生物學、教育培訓等目的。
1、遺傳圖譜(geneticmap)
又稱連鎖圖譜(linkagemap),它是以具有遺傳多態性(在一個遺傳位點上具有一個以上的等位基因,在群體中的出現頻率皆高於1%)的遺傳標記為“路標”,以遺傳學距離(在減數分裂事件中兩個位點之間進行交換、重組的百分率,1%的重組率稱為1cM)為圖距的基因組圖。遺傳圖譜的建立為基因識別和完成基因定位創造了條件。意義:6000多個遺傳標記已經能夠把人的基因組分成6000多個區域,使得連鎖分析法可以找到某一致病的或表現型的基因與某一標記鄰近(緊密連鎖)的證據,這樣可把這一基因定位於這一已知區域,再對基因進行分離和研究。對於疾病而言,找基因和分析基因是個關鍵。
2、物理圖譜(physicalmap)
物理圖譜是指有關構成基因組的全部基因的排列和間距的信息,它是通過對構成基因組的DNA分子進行測定而繪製的。繪製物理圖譜的目的是把有關基因的遺傳信息及其在每條染色體上的相對位置線性而系統地排列出來。DNA物理圖譜是指DNA鏈的限制性酶切片段的排列順序,即酶切片段在DNA鏈上的定位。因限制性內切酶在DNA鏈上的切口是以特異序列為基礎的,核苷酸序列不同的DNA,經酶切後就會產生不同長度的DNA片段,由此而構成獨特的酶切圖譜。因此,DNA物理圖譜是DNA分子結構的特徵之一。DNA是很大的分子,由限制酶產生的用於測序反應的DNA片段只是其中的極小部分,這些片段在DNA鏈中所處的位置關係是應該首先解決的問題,故DNA物理圖譜是順序測定的基礎,也可理解為指導DNA測序的藍圖。廣義地說,DNA測序從物理圖譜製作開始,它是測序工作的第一步。製作DNA物理圖譜的方法有多種,這裡選擇一種常用的簡便方法──標記片段的部分酶解法,來說明圖譜製作原理。
3、序列圖譜
隨著遺傳圖譜和物理圖譜的完成,測序就成為重中之重的工作。DNA序列分析技術是一個包括製備DNA片段化及鹼基分析、DNA信息翻譯的多階段的過程。通過測序得到基因組的序列圖譜。
大規模測序基本策略:逐個克隆法:對連續克隆系中排定的BAC克隆逐個進行亞克隆測序並進行組裝(公共領域測序計畫)。
全基因組鳥槍法:在一定作圖信息基礎上,繞過大片段連續克隆系的構建而直接將基因組分解成小片段隨機測序,利用超級計算機進行組裝(美國Celera公司)。
4、基因圖譜
基因圖譜是在識別基因組所包含的蛋白質編碼序列的基礎上繪製的結合有關基因序列、位置及表達模式等信息的圖譜。在人類基因組中鑑別出占具2%~5%長度的全部基因的位置、結構與功能,最主要的方法是通過基因的表達產物mRNA反追到染色體的位置。
其原理是:所有生物性狀和疾病都是由結構或功能蛋白質決定的,而已知的所有蛋白質都是由mRNA編碼的,這樣可以把mRNA通過反轉錄酶合成cDNA或稱作EST的部分的cDNA片段,也可根據mRNA的信息人工合成cDNA或cDNA片段,然後,再用這種穩定的cDNA或EST作為“探針”進行分子雜交,鑑別出與轉錄有關的基因。用PolyA互補的寡聚T或克隆載體的相關序列作為引物對mRNA雙端尾側的幾百個bp進行測序得到EST(表達序列標籤)。2000年6月,EMBL中EST數量已有4,229,786。
對人類的重要意義
1、HGP對人類疾病基因研究的貢獻
人類疾病相關的基因是人類基因組中結構和功能完整性至關重要的信息。對於單基因病,採用“定位克隆”和“定位候選克隆”的全新思路,導致了亨廷頓舞蹈病、遺傳性結腸癌和乳腺癌等一大批單基因遺傳病致病基因的發現,為這些疾病的基因診斷和基因治療奠定了基礎。對於心血管疾病、腫瘤、糖尿病、神經精神類疾病(老年性痴呆、精神分裂症)、自身免疫性疾病等多基因疾病是目前疾病基因研究的重點。健康相關研究是HGP的重要組成部分,1997年相繼提出:“腫瘤基因組解剖計畫”“環境基因組學計畫”。
2、HGP對醫學的貢獻
基因診斷、基因治療和基於基因組知識的治療、基於基因組信息的疾病預防、疾病易感基因的識別、風險人群生活方式、環境因子的干預。
3、HGP對生物技術的貢獻
(1)基因工程藥物:分泌蛋白(多肽激素,生長因子,趨化因子,凝血和抗凝血因子等)及其受體。
(2)診斷和研究試劑產業:基因和抗體試劑盒、診斷和研究用生物晶片、疾病和篩藥模型。
(3)對細胞、胚胎、組織工程的推動:胚胎和成年期幹細胞、克隆技術、器官再造。
4、HGP對製藥工業的貢獻
篩選藥物的靶點:與組合化學和天然化合物分離技術結合,建立高通量的受體、酶結合試驗以知識為基礎的藥物設計:基因蛋白產物的高級結構分析、預測、模擬—藥物作用“口袋”。
個體化的藥物治療:藥物基因組學
5、HGP對社會經濟的重要影響
生物產業與信息產業是一個國家的兩大經濟支柱;發現新功能基因的社會和經濟效益;轉基因食品;轉基因藥物(如減肥藥,增高藥)
6、HGP對生物進化研究的影響
生物的進化史,都刻寫在各基因組的“天書”上;草履蟲是人的親戚——13億年;人是由300~400萬年前的一種猴子進化來的;人類第一次“走出非洲”——200萬年的古猿;人類的“夏娃”來自於非洲,距今20萬年——第二次“走出非洲”?
7、HGP帶來的負面作用
侏羅紀公園不只是科幻故事;種族選擇性滅絕性生物武器;基因專利戰;基因資源的掠奪戰;基因與個人隱私。
成果
1860至1870年: 奧地利學者孟德爾根據豌豆雜交實驗提出遺傳因子概念,並總結出孟德爾遺傳定律。
1909年 :丹麥植物學家和遺傳學家詹森首次提出“基因”這一名詞,用以表達孟德爾的遺傳因子概念。
1944年 :3位美國科學家分離出細菌的DNA(脫氧核糖核酸),並發現DNA是攜帶生命遺傳物質的分子。
1953年 :美國人沃森和英國人克里克通過實驗提出了DNA分子的雙螺鏇模型。
1969年 :科學家成功分離出第一個基因。
1990年 :10月 被譽為生命科學“阿波羅登月計畫”的國際人類基因組計畫啟動。
1998年 :一批科學家在美國羅克威爾組建塞萊拉遺傳公司,與國際人類基因組計畫展開競爭。 12月 一種小線蟲完整基因組序列的測定工作宣告完成,這是科學家第一次繪出多細胞動物的基因組圖譜。
1999年 :9月 中國獲準加入人類基因組計畫,負責測定人類基因組全部序列的1%。中國是繼美、英、日、德、法之後第6個國際人類基因組計畫參與國,也是參與這一計畫的唯一開發中國家。 12月1日 國際人類基因組計畫聯合研究小組宣布,完整破譯出人體第22對染色體的遺傳密碼,這是人類首次成功地完成人體染色體完整基因序列的測定。
2000年 :4月6日 美國塞萊拉公司宣布破譯出一名實驗者的完整遺傳密碼,但遭到不少科學家的質疑。 4月底 中國科學家按照國際人類基因組計畫的部署,完成了1%人類基因組的工作框架圖。 5月8日 德、日等國科學家宣布,已基本完成了人體第21對染色體的測序工作。 6月26日 科學家公布人類基因組工作草圖,標誌著人類在解讀自身“生命之書”的路上邁出了重要一步。 12月14日 美英等國科學家宣布繪出擬南芥基因組的完整圖譜,這是人類首次全部破譯出一種植物的基因序列。
2001年 2月12日 中、美、日、德、法、英等6國科學家和美國塞萊拉公司聯合公布人類基因組圖譜及初步分析結果。
2001年 8月26日,北京,人類基因組計畫中國測序部分通過國家驗收,“中國卷”繪製完成。
進展與未來
2000年6月26日,參加人類基因組工程項目的美國、英國、法蘭西共和國、德意志聯邦共和國、日本和中國的6國科學家共同宣布,人類基因組草圖的繪製工作已經完成。最終完成圖要求測序所用的克隆能忠實地代表常染色體的基因組結構,序列錯誤率低於萬分之一。95%常染色質區域被測序,每個Gap小於150kb。完成圖將於2003年完成,比預計提前2年。
完成人類基因組序列完成圖:
(1)從當前物理圖譜生成的克隆產生完成的序列,覆蓋基因組的常染色質區域大於96%。大約1Gb的完成序列已經實現。剩下的也已經形成草圖,所有的克隆期望達到8~10倍的覆蓋率,大約2001年中期(99.99%的正確率),使用已經建立的和日益自動化的協定。
(2)檢測另外的庫來關閉gaps。使用FISH技術或其他方法來分析沒有閉合的Gaps大小。22,21條染色體用這種方式。2003年經完成。
(3)開發新的技術來關閉難度較大的gaps,大約幾百個。
基因組序列工作框架圖(Workingdraft):通過對染色體位置明確的BAC連續克隆系4-5倍覆蓋率的測序(在BAC克隆水平的覆蓋率不應低於3倍),獲得基因組90%以上的序列,其錯誤率應低於1%。工作框架圖可用於基因組結構的認識、基因的識別和解析、疾病基因的定位克隆,SNP的發現等。
草圖的作用:
1、草圖,許多疾病相關的基因被識別
2、SNP(人與人之間的區別),草圖提供了一個理解遺傳基礎和人類特徵進化的框架。
3、草圖後,研究人員有了新的工具來研究調節區和基因網路。
4、比較其它基因組可以揭示共同的調控元件,和其他物種共享的基因的環境也許提供在個體水平之上的關於功能和調節的信息。
5、草圖同樣是研究基因組三維壓縮到細胞核中的一個起點。這樣的壓縮可能影響到基因調控6、在套用上,草圖信息可以開發新的技術,如DNA晶片、蛋白質晶片,作為傳統方法的補充,目前,這樣的晶片可以包含蛋白質家族中所有的成員,從而在特定的疾病組織中可以找到那些是活躍的。
2001年2月12日,美國Celera公司與人類基因組計畫分別在《科學》和《自然》雜誌上公布了人類基因組精細圖譜及其初步分析結果。其中,政府資助的人類基因組計畫採取基因圖策略,而Celera公司採取了“鳥槍策略”。至此,兩個不同的組織使用不同的方法都實現了他們共同的目標:完成對整個人類基因組的測序的工作;並且,兩者的結果驚人的相似。整個人類基因組測序工作的基本完成,為人類生命科學開闢了一個新紀元,它對生命本質、人類進化、生物遺傳、個體差異、發病機制、疾病防治、新藥開發、健康長壽等領域,以及對整個生物學都具有深遠的影響和重大意義,標誌著人類生命科學一個新時代的的來臨。
展望
1、生命科學工業的形成
由於基因組研究與製藥、生物技術、農業、食品、化學、化妝品、環境、能源和計算機等工業部門密切相關,更重要的是基因組的研究可以轉化為巨大的生產力,國際上一批大型製藥公司和化學工業公司大規模紛紛投巨資進軍基因組研究領域,形成了一個新的產業部門,即生命科學工業。
世界上一些大的製藥集團紛紛投資建立基因組研究所。Ciba-Geigy和Ssandoz合資組建了Novartis公司,並斥資2.5億美元建立研究所,開展基因組研究工作。SmithKline公司花1.25億美元加快測序的進度,將藥物開發項目的25%建立在基因組學之上。Glaxo-Wellcome在基因組研究領域投入4,700萬美元,將研究人員增加了一倍。
大型化學工業公司向生命科學工業轉軌。孟山都公司早在1985年就開始轉向生命科學工業。至1997年,該公司向生物技術和基因組研究的投入已高達66億美元。1998年4月,杜邦公司宣布改組成三個實業單位,由生命科學領頭。1998年5月,該公司又宣布放棄能源公司Conaco,將其改造成一家生命科學公司。Dow化學公司用9億美元購入EliLilly公司40%的股票,從事穀物和食品研究,後又成立了生命科學公司。Hoechst公司則賣了它的基本化學品部門,轉項投資生物技術和製藥。
傳統的農業和食品部門也出現了向生物技術和製藥合併的趨勢。GenzymeTransgenics公司培養出的基因工程羊能以較高的產量生產抗凝血酶III,一群羊的酶產量相當於投資1.15億美元工廠的產量。據估計,轉基因動物生產的藥物成本是大規模細胞培養法的十分之一。一些公司還在研究生產能抗骨質疏鬆的穀物,以及大規模生產和加工基因工程食品。
能源、採礦和環境工業也已在分子水平上向基因組研究匯合。例如,用產甲烷菌Methanobacterium作為一種新能源。用抗輻射的細菌Deinococcusradiodurans清除放射性物質的污染,並在轉入tod基因後,在高輻射環境下清除多種有害化學物質的污染。
2、功能基因組學
人類基因組計畫當前的整體發展趨勢是什麼?一方面,在順利實現遺傳圖和物理圖的製作後,結構基因組學正在向完成染色體的完整核酸序列圖的目標奮進。另一方面,功能基因組學已提上議事日程。人類基因組計畫已開始進入由結構基因組學向功能基因組學過渡、轉化的過程。在功能基因組學研究中,可能的核心問題有:基因組的表達及其調控、基因組的多樣性、模式生物體基因組研究等。
(1)基因組的表達及其調控
1)基因轉錄表達譜及其調控的研究
一個細胞的基因轉錄表達水平能夠精確而特異地反映其類型、發育階段以及反應狀態,是功能基因組學的主要內容之一。為了能夠全面地評價全部基因的表達,需要建立全新的工具系統,其定量敏感性水平應達到小於1個拷貝/細胞,定性敏感性應能夠區分剪接方式,還須達到檢測單細胞的能力。近年來發展的DNA微陣列技術,如DNA晶片,已有可能達到這一目標。
2)蛋白質組學研究
蛋白質組學研究是要從整體水平上研究蛋白質的水平和修飾狀態。目前正在發展標準化和自動化的二維蛋白質凝膠電泳的工作體系。首先用一個自動系統來提取人類細胞的蛋白質,繼而用色譜儀進行部分分離,將每區段中的蛋白質裂解,再用質譜儀分析,並在蛋白質資料庫中通過特徵分析來認識產生的多肽。蛋白質組研究的另一個重要內容是建立蛋白質相互關係的目錄。
3)生物信息學的套用
目前,生物信息學已大量套用於基因的發現和預測。然而,利用生物信息學去發現基因的蛋白質產物的功能更為重要。模式生物體中越來越多的蛋白質構建編碼單位被識別,無疑為基因和蛋白質同源關係的搜尋和家族的分類提供了極其寶貴的信息。同時,生物信息學的算法、程式也在不斷改善,使得不僅能夠從一級結構,也能從估計結構上發現同源關係。但是,利用計算機模擬所獲得的理論數據,還需要經過實驗經過的驗證和修正。
(2)基因組多樣性的研究
人類是一個具有多態性的群體。不同群體和個體在生物學性狀以及在對疾病的易感性與抗性上的差別,反映了進化過程中基因組與內、外部環境相互作用的結果。開展人類基因組多樣性的系統研究,無論對於了解人類的起源和進化,還是對於生物醫學均會產生重大的影響。認識不同生物中基因序列的保守性,將能夠使我們有效地認識約束基因及其產物的功能性的因素。對序列差異性的研究則有助於認識產生大自然多樣性的基礎。在不同生物體之間建立序列變異與基因表達的時空差異之間的相關性,將有助於揭示基因的網路結構。
(3)開展對模式生物體的研究
隨著線蟲和果蠅基因組測序的完成,將來也可能開展對這兩種生物的類似性研究。一些突變株系和技術體系建立後,不僅能夠成為研究單基因功能的有效手段,而且為研究基因冗餘性和基因間的相互作用等深層次問題奠定了基礎。小鼠作為哺乳動物中的代表性模式生物,在功能基因組學的研究中展有特殊的地位。同源重組技術可以破壞小鼠的任何一個基因,這種方法的缺點是費用高。利用點突變、缺失突變和插入突變造成的隨機突變是另一中可能的途徑。對於人體細胞而言,建立反義寡核苷酸和核酶瞬間阻斷基因表達的體系可能更加合適。蛋白質水平的剔除術也許是說明基因功能最有力的手段。利用組合化學方法有望生產出化學剔除試劑,用於激活或失活各種蛋白質。
總之,模式生物體的基因組計畫為人類基因組的研究提供了大量的信息。今後,模式生物體的研究方向是將人類基因組8~10萬個編碼基因的大部分轉化為已知生化功能的多成分核心機制。而要獲得酶一種人類進化保守性核心機制的精細途徑,以及它們的紊亂導致疾病的各種途徑的知識,將只能來自對人類自身的研究。通過功能基因組學的研究,人類最終將將能夠了解哪些進化機制已經確實發生,並考慮進化過程還能夠有哪些新的潛能。一種新的解答發育問題的方法可能是,將蛋白質功能域和調控順序進行重新的組合,建立新的基因網路和形態發生通路。也就是說,未來的生物科學不僅能夠認識生物體是如何構成和進化的,而且更為誘人的是產生構建新的生物體的可能潛力。該計畫在人類科學史上又豎起了一座新的里程碑!這是一項改變世界,影響人類生活的壯舉,隨著時間的推移,它的偉大意義將愈顯昭彰。