概述
同人類基因組計畫帶給生物醫學研究領域的革新意義一樣,ENCODE項目也將推動生物醫學的前進,開闢研究新道路。這一計畫是於2003年啟動,主要目的是建立人類基因組中生物功能關鍵性元素目錄。
我們的基因組就是簡單地通過無數的開關進行調控,這些上百萬的區域能決定基因是開還是關,人類基因組計畫HGP表明,基因組中只有2%包含有基因,也就是說能編碼蛋白。從ENCODE項目中,我們可以看到,基因組中剩餘的這約80%的區域其實並沒有閒著,我們發現基因組這個更大的部分調控了蛋白何時和何地生成,而不是簡單的其中產生,比簡單地作為構建框架”。
任何疾病的相關研究人員都可以利用ENCODE數據,分析他們可能會感興趣的相關病理,許多情況下,可能已經想到了哪些基因參與了正在研究的疾病,但卻不知道其中涉及的開關。有時這些開關令人驚訝,因為它們的位置說明它們更有可能與一個完全不同的疾病相關。ENCODE為我們提供了一組非常有價值的線索,沿著這些線索,發現與健康和疾病有關的關鍵機制,這些將能被用來創建全新的藥物,或重新利用現有的治療方法。“
因為我們的基因組即複雜的,又是三維立體的,這些調控元件有時遠離被調節基因,而是通過環繞得以接觸到。如果沒有ENCODE,可能永遠也不會看著這些區域,這項研究朝著深入了解人類運轉邁進了一大步。ENCODE可以幫助更深入探討監控環路,這些環路能指揮所有的零件組裝成一個複雜的個體。
ENCODE聯合了來自英國,美國,西班牙,新加坡和日本的32個實驗室中442名科學家的努力,他們獲得並分析了超過15兆兆位元組(15萬億位元組)的原始數據,目前已經全部公布,並可公開獲得。研究花費了約300年的計算機時間,對147個組織類型進行了分析,以確定哪些能打開和關閉特定的基因,以及不同類型細胞之間的“開關”存在什麼差異。
影響
在2001年,人類基因組計畫產生了近乎完整的人類DNA。但是,研究人員還希望了解這些GS,CS,和TS是如何利用,控制或組織,比它們少得多的編碼區域,造就活生生的人。聚集了422位科學家的國際團隊,在經過十年的努力後,完成了解析基因組剩餘部分(非編碼區域)的工作,公布在Nature等多份期刊上。
長期以來,研究人員已經認識到,一些非編碼DNA可能具有功能,相關研究也指明了這一點。但同時,人們也相信,這些序列事實上還是垃圾。不過ENCODE項目提出了異議。
研究人員發現,許多人類基因組的非編碼部分包含蛋白可以綁定的區域,這將會影響附近和遠處的基因表達。其它轉錄成RNA分子的非編碼區從來沒有翻譯成蛋白。還有一些影響了DNA摺疊和包裝的方式。總之,這些區域並不是垃圾,據ENCODE的分析,80%的基因組區域具有一定的生化功能。
其餘的20%也不是垃圾,雖然ENCODE只分析了147種不同類型的細胞,但總數上千。如果還檢測其他類型的細胞,功能可能會出現比例分化。這項研究的影響是巨大的,這將重新定義什麼是“基因”,也為尋求理解疾病機制,以及基因組是如何在三維空間中工作的,提供了新的線索。
重要性
研究人員已經知道,基因組只有1.5%編碼蛋白。ENCODE發現,除此之外還有8.5%的區域編碼結合在DNA上的蛋白,用於調控基因轉錄。而且,因為ENCODE並沒有尋找結合在DNA上的每一個可能類型的細胞或每一個可能的蛋白,因此這一數字可能還是保守的。
ENCODE其餘部分的功能元件,涵蓋了其它類別的序列,這些序列被認為是基本上無功能的,包括內含子。已經確認一個事實,那就是基因組有比我們所知的存在更多奧秘 。