簡介
千人基因組計畫,由美國國立人類基因組研究所、中國深圳華大基因研究院、英國桑格研究所等75家公司和組織協同建立,用以建立最詳細的人類遺傳變異目錄。項目於2008年啟動,旨在繪製迄今(截至2011年)最詳盡、最有醫學套用價值的人類基因多態性圖譜,為基因變異如何影響健康以及與疾病間關係的研究奠定基礎 。
基因多態性是指人與人之間的基因差異,人的基因組總體上差不多,但在有些位置上你我他都不一樣,存在各種基因變種,它們最終導致了人與人之間的差異。
中美英等協作組採用了新一代測序技術,使用全球數千人的全基因組測序數據,構建了最詳盡的人類基因組遺傳多態性圖譜。
目前(截至2012年4月)該項目擁有超過1700個樣本,高達200TB數據量的DNA序列。
測序人群
奈及利亞伊巴丹區域的Yoruba人;居住於東京的日本人;居住於北京的中國人;美國猶他州的北歐和西歐人後裔;肯亞Webuye的Luhya人和Kinyawa的Maasai人;義大利的Toscani居民;居住於休斯頓的Gujarati印第安人;居住于丹佛的中國人;居住於洛杉磯的墨西哥人後裔;居住於美國西南部的非洲人後裔。
研究成果
千人基因組計畫共同主席、英國桑格研究所基因專家、《自然》封面文章主要作者之一理察·德賓說這一計畫已經取得了兩個重要成果:第一是獲得了迄今最詳盡的人類基因多態性圖譜,第二是探索出了研究基因多態性的新技術手段。
人類基因多態性圖譜
在第一個成果方面,研究人員找出了1000多萬個大大小小的基因變種,其中約800萬個都是前所未知的。對於人群攜帶率在1%以上的基因變種,本次研究的覆蓋率達到95%以上,得出了迄今最詳盡的基因多態性圖譜。這一成果在醫學等領域有很高的套用價值,比如通過參照圖譜,可以方便地找出致病的基因變種。
多種基因測序手段
在第二個成果方面,研究人員驗證了在大型基因研究中綜合使用多種基因測序手段的可行性。由於基因測序成本仍很高昂,如果能在“精測”一些基因序列的同時,對另一些基因序列只需“粗測”就能保證最終結果的準確性,將可以大幅降低基因測序研究的成本。
先導項目
第一個先導項目運用多種下一代高通量測序技術平台,完成了兩個核心家庭共6人的高覆蓋度全基因組測序,每個基因組的測序深度在20~60倍。通過此項目,可以評價多種主要測序方法的優缺點,為“國際千人基因組計畫”的後續項目掃清技術障礙。
第二個先導項目完成了179人的低覆蓋度全基因組測序,平均測序深度在3倍。數據表明,大樣本低覆蓋度測序在降低成本的同時,仍然能有效識別人群中的基因多樣性。
第三個先導項目通過對700人的1000個基因外顯子的測序,獲得了占人類基因組全部序列2%的蛋白質編碼基因名錄。前所未有的大樣本量有助於研究人群罕見變異的表達圖譜。
科研新聞
全部數據免費對外開放
2012年3月29日,美國國立衛生研究院宣布,他們的千人基因組計畫的全部數據將免費對外開放 。這些數據總量達到200TB,是世界上最大的人類基因變異數據集。亞馬遜旗下的雲計算公司——“亞馬遜網路服務”將存儲這個龐大的資料庫。所有數據免費對外開放意味著更多科學家可以利用這些數據進行研究,以更快的速度得出基因型與癌症、糖尿病等疾病間關係的發現。
由於類似千人基因組計畫這樣的數據集規模龐大,很少有研究人員具備處理能力,因此也就無法使用。根據國立衛生研究院的計算,千人基因組計畫的數據如果列印出來,可放滿1600萬個檔案櫃;如果使用標準DVD存儲,需要3萬多張DVD。對於科學家和他們所在的研究機構來說,千人基因組計畫數據進行雲存儲無疑是一個好訊息,對於亞馬遜網路服務公司來說,存儲千人基因組計畫的數據可能也是一個好訊息。美國《紐約時報》報導稱,處理如此海量數據需要極大的運算能力,亞馬遜網路服務公司可以要求獲得額外的資源,用於進一步處理或者分析這些數據。
高精度遺傳圖譜發布
2012年11月,“千人基因組計畫”項目協作組公布了高解析度的人類基因組遺傳變異整合圖譜,將為基因組學在人類疾病與健康領域中的套用,以及個體化醫療時代的到來奠定堅實基礎。