人類基因存在於人體每一個細胞內的脫氧核糖核酸分子即DNA分子內。DNA分子在細胞核內的染色體上由兩條相互盤繞的鹼基鏈組成。經初步測定,人類基因組共有31.6億個鹼基對,人類基因組計畫就是測試出人類23對染色體上鹼基的排列順序。這項耗資30億美元的計畫於1990年由美國國家衛生研究機構發起,包括中國在內的多個國家的科學家參與了這一研究,中國承擔了1%的工作量,並於去年5月圓滿完成。
在人類基因組探索過程中,人類基因組工程的科學家和美國塞萊拉公司的科學家採用了兩種不同的測序和分析的方法。塞萊拉公司的核心分析方法被稱為“霰彈法”,人類基因組工程則採用了“克隆法”。
塞萊拉公司研究組包括282位來自美國、歐洲、澳大利亞、以色列和西班牙的研究機構的人員,他們代表了12個不同的學術機構、非盈利機構和商業性組織。科學家們從3女2男5位志願者體內提取了DNA樣品,他們包括1名非洲裔美國人,1名亞裔、1名拉美裔和兩名白人。
霰彈法是一個高度計算機化的方法,它是先把基因組隨機分成已知長度(2000個鹼基對、1萬個鹼基對、5萬個鹼基對)的片段,然後用數學算法將這些片段組裝成毗鄰的大段並確定它們在基因組上的正確位置。
由公共經費支持的人類基因組工程則採用另一種方法,即先複製更大段的人類基因序列,然後將它們繪製到基因組的適當區域,這種方法需要研究人員在早期把較多的時間和精力放到克隆和繪製草圖上,而塞萊拉公司的方法是在後期需要做大量的計算工作。塞萊拉公司的科學家先用霰彈法測序DNA,並將整個基因組覆蓋8次,然後用兩個數學公式將人類基因組序列多次組裝起來,確定出了基因中的轉錄單元,預測出了60%的已識別基因的分子功能。最後研究人員將人類基因組信息與此前已完成的果蠅和線蟲的基因組序列進行比較,從而找出了三者共有的核心功能。
兩個研究組將數據進行的對比以及人類基因組工程的科學家、《科學》和《自然》雜誌高級指導編輯的評估表明,塞萊拉公司的基因組分析與人類基因組工程的分析結果雖然存在一些差異,但大部分地方都有極高的吻合度。塞萊拉公司測定的序列覆蓋了95%以上的人類基因組,其中約85%的人類基因組存在於按照正確順序排列、至少包含50萬個鹼基對的片段中。這一序列為人類至少擁有2.6383萬個控制合成蛋白質的基因提供了有力的證據,也為另外1.2731萬個假設基因的存在提供了較弱的證據。