前言
結構決定功能,僅僅知道基因組序列並不能使我們充分了解蛋白質的功能,更無法知道它是如何工作的。蛋白質可憑藉相互作用在細胞環境(特定的酸鹼度、溫度等)下自己組裝自己,這種自我組裝的過程被稱為蛋白質摺疊。蛋白質摺疊問題被列為“21世紀的生物物理學”的重要課題,它是分子生物學中心法則尚未解決的一個重大生物學問題。從一級序列預測蛋白質分子的三級結構並進一步預測其功能,是極富挑戰性的工作。研究蛋白質摺疊,尤其是摺疊早期過程,即新生肽段的摺疊過程是全面的最終闡明中心法則的一個根本問題,在這一領域中,近年來的新發現對新生肽段能夠自發進行摺疊的傳統概念做了根本的修正。這其中,X射線晶體衍射和各種波譜技術以及電子顯微鏡技術等發揮了極其重要的作用。第十三屆國際生物物理大會上,Nobel獎獲得者Ernst在報告中強調指出,NMR用於研究蛋白質的一個主要優點在於它能極為詳細的研究蛋白質分子的動力學,即動態的結構或結構的運動與蛋白質分子功能的關係。目前的NMR技術已經能夠在秒到皮秒的時間域上觀察蛋白質結構的運動過程,其中包括主鏈和側鏈的運動,以及在各種不同的溫度和壓力下蛋白質的摺疊和去摺疊過程。蛋白質大分子的結構分析也不僅僅只是解出某個具體的結構,而是更加關注結構的漲落和運動。例如,運輸小分子的酶和蛋白質通常存在著兩種構象,結合配體的和未結合配體的。一種構象內的結構漲落是構象轉變所必需的前奏,因此需要把光譜學,波譜學和X 射線結構分析結合起來研究結構漲落的平衡,構象改變和改變過程中形成的多種中間態,又如,為了了解蛋白質是如何摺疊的,就必須知道摺疊時幾個基本過程的時間尺度和機制,包括二級結構(螺旋和摺疊)的形成,捲曲,長程相互作用以及未摺疊肽段的全面崩潰。多種技術用於研究次過程,如快速核磁共振,快速光譜技術(螢光,遠紫外和近紫外圓二色)。
研究概況
在生物體內,生物信息的流動可以分為兩個部分:第一部分是存儲於DNA序列中的遺傳信息通過轉錄和翻譯傳入蛋白質的一級序列中,這是一維信息之間的傳遞,三聯子密碼介導了這一傳遞過程;第二部分是肽鏈經過疏水塌縮、空間盤曲、側鏈聚集等摺疊過程形成蛋白質的天然構象,同時獲得生物活性,從而將生命信息表達出來;而蛋白質作為生命信息的表達載體,它摺疊所形成的特定空間結構是其具有生物學功能的基礎,也就是說,這個一維信息向三維信息的轉化過程是表現生命活力所必需的。
自從20世紀60年代,Anfinsen基於還原變性的牛胰RNase在不需其他任何物質幫助下,僅通過去除變性劑和還原劑就使其恢復天然結構的實驗結果,提出了“多肽鏈的胺基酸序列包含了形成其熱力學上穩定的天然構象所必需的全部信息”的“自組裝學說”以來,隨著對蛋白質摺疊研究的廣泛開展,人們對蛋白質摺疊理論有了進一步的補充和擴展。Anfinsen的“自組裝熱力學假說”得到了許多體外實驗的證明,的確有許多蛋白在體外可進行可逆的變性和復性,尤其是一些小分子量的蛋白,但是並非所有的蛋白都如此。而且由於特殊的環境因素,體內蛋白質的摺疊遠非如此。
體內蛋白質的摺疊往往需要有其他輔助因子的參與,並伴隨有ATP的水解。因此,Ellis 於1987年提出了蛋白質摺疊的“輔助性組裝學說”。這表明蛋白質的摺疊不僅僅是一個熱力學的過程,顯然也受到動力學的控制。有的學者基於有些相似胺基酸序列的蛋白質具有不同的摺疊結構,而另外一些不同胺基酸序列的蛋白質在結構上卻相似的現象,提出了mRNA二級結構可能作為一種遺傳密碼從而影響蛋白質結構的假說。但目前為止,該假說尚沒有任何實驗證據,只有一些純數學論證[3]。那么,蛋白質的胺基酸序列究竟是如何確定其空間構象的呢?圍繞這一問題科研人員已進行了大量出色的工作,但迄今為止我們對蛋白質的摺疊機制的認識仍是不完整的,甚至有些方面還存在著錯誤的觀點。
在這方面作出重要貢獻的典型研究實例是美國C.B.安芬森小組關於牛胰核糖核酸酶的變性和復性的研究。牛胰核糖核酸酶含有124個胺基酸殘基,由8個巰基配對組成4對二硫鍵。可以計算出酶分子中8個巰基組成4對二硫鍵的可能方式有105種,這就提供了一個定量估算復性重組的指標。在溫和的鹼性條件下,8摩爾的濃脲和大量巰基乙醇能使四對二硫鍵完全還原,整個分子變為無規則捲曲狀,酶分子變性。透析去除脲,在氧的存在下,二硫鍵重新形成,酶分子完全復性,二硫鍵中成對的巰基都與天然一樣,復性分子可以結晶且具有與天然酶晶體相同的X射線衍射花樣,從而證實,酶分子在復性過程中,不僅能自發地重新摺疊,而且只選擇了105種二硫鍵可能配對方式中的一種。
理論模型
框架模型
(Framework Model)
框架模型[4] 假設蛋白質的局部構象依賴於局部的胺基酸序列。在多肽鏈摺疊過程的起始階段,先迅速形成不穩定的二級結構單元; 稱為“flickering cluster”,隨後這些二級結構靠近接觸,從而形成穩定的二級結構框架;最後,二級結構框架相互拼接,肽鏈逐漸緊縮,形成了蛋白質的三級結構。這個模型認為即使是一個小分子的蛋白也可以一部分一部分的進行摺疊,其間形成的亞結構域是摺疊中間體的重要結構。
塌縮模型
(Hydrophobic Collapse Model)
在疏水塌縮模型[5]中,疏水作用力被認為是在蛋白質摺疊過程中起決定性作用的力的因素。在形成任何二級結構和三級結構之前首先發生很快的非特異性的疏水塌縮。
粘合機制
(Diffusion-Collision-Adhesion Model)
該模型認為蛋白質的摺疊起始於伸展肽鏈上的幾個位點,在這些位點上生成不穩定的二級結構單元或者疏水簇,主要依靠局部序列的進程或中程(3-4個殘基)相互作用來維繫。它們以非特異性布朗運動的方式擴散、碰撞、相互黏附,導致大的結構生成並因此而增加了穩定性。進一步的碰撞形成具有疏水核心和二級結構的類熔球態中間體的球狀結構。球形中間體調整為緻密的、無活性的類似天然結構的高度有序熔球態結構。最後無活性的高度有序熔球態轉變為完整的有活力的天然態。
生長模型
(Nuclear-Condensation-Growth Model)
根據這種模型,肽鏈中的某一區域可以形成“摺疊晶核”,以它們為核心,整個肽鏈繼續摺疊進而獲得天然構象。所謂“晶核”實際上是由一些特殊的胺基酸殘基形成的類似於天然態相互作用的網路結構,這些殘基間不是以非特異的疏水作用維繫的,而是由特異的相互作用使這些殘基形成了緊密堆積。晶核的形成是摺疊起始階段限速步驟。
拼版模型
(Jig-Saw Puzzle Model)
此模型[9]的中心思想就是多肽鏈可以沿多條不同的途徑進行摺疊,在沿每條途徑摺疊的過程中都是天然結構越來越多,最終都能形成天然構象,而且沿每條途徑的摺疊速度都較快,與單一途徑摺疊方式相比,多肽鏈速度較快,另一方面,外界生理生化環境的微小變化或突變等因素可能會給單一摺疊途徑造成較大的影響,而對具有多條途徑的摺疊方式而言,這些變化可能給某條摺疊途徑帶來影響,但不會影響另外的摺疊途徑,因而不會從總體上干擾多肽鏈的摺疊,除非這些因素造成的變化太大以致於從根本上影響多肽鏈的摺疊。
格點模型
格點模型(也簡稱HP模型),最早是由Dill等人1989年提出的。格點模型可分為二維模型和三維模型兩類。二維格點模型就是在平面空間中產生正交的單位長度的格線,每個胺基酸分子按在序列中排序的先後順序依次放置到這些格線交叉點上,在序列中相鄰的胺基酸分子放置在格點中時也必須相鄰,即相鄰胺基酸分子在格點模型中的距離為1。但是需要注意的是,格線中的每個交叉點最多只能放置一個胺基酸分子,如果序列中的某個胺基酸分子已經放置在此位置上,則後序的胺基酸分子就不可以再放置在這個格點上。如果在放置胺基酸分子的過程中出現當前所要放置的胺基酸分子沒有位置可以放置了,那就說明該構型是不合理的,需要重新放置。三維格點模型和二維格點模型相似,它是在三維空間中產生的單位長度的立體格線。格點中放置胺基酸分子的方法和二維的相同,但在二維格點模型中放置胺基酸分子時除了序列前兩個胺基酸分子外最多只有三個方向可以選擇,而在三維格點模型中複雜度提高了很多,放置胺基酸分子最多可以有五個方向可選。
分子伴侶
1978 年,Laskey 在進行組蛋白和DNA 在體外生理離子強度實驗時發現,必須要有一種細胞核內的酸性蛋白———核質素(nucleoplasmin) 存在時,二者才能組裝成核小體,否則就發生沉澱。據此Laskey 稱它為“分子伴侶”。分子伴侶是指能夠結合和穩定另外一種蛋白質的不穩定構象,並能通過有控制的結合和釋放,促進新生多肽鏈的摺疊、多聚體的裝配或降解及細胞器蛋白的跨膜運輸的一類蛋白質 [10,11]。分子伴侶是從功能上定義的,凡具有這種功能的蛋白質都是分子伴侶,它們的結構可以完全不同。這一概念目前已延伸到許多蛋白質,現已鑑定出來的分子伴侶主要屬於三類高度保守的蛋白質家族[12]:stress 90 family、stress 70 family、stress 60 family。其中stress 60 family存在於真核生物的線粒體(在哺乳動物中稱為Hsp58)、葉綠體(稱為cpn60)中,在原核生物的細胞質中,它被稱為GroEL。
意義
蛋白質摺疊機制的闡明將揭示生命體內的第二套遺傳密碼,這是它的理論意義。蛋白質摺疊的研究,比較狹義的定義就是研究蛋白質特定三維空間結構形成的規律、穩定性和與其生物活性的關係。在概念上有熱力學的問題和動力學的問題;蛋白質在體外摺疊和在細胞內摺疊的問題;有理論研究和實驗研究的問題。這裡最根本的科學問題就是多肽鏈的一級結構到底如何決定它的空間結構?既然前者決定後者,一級結構和空間結構之間肯定存在某種確定的關係,這是否也像核苷酸通過“三聯密碼”決定胺基酸順序那樣有一套密碼呢?有人把這構想的一級結構決定空間結構的密碼叫作“第二遺傳密碼”。
如果說“三聯密碼”已被破譯而實際上已成為明碼,那么破譯“第二遺傳密碼”正是“蛋白質結構預測”從理論上最直接地去解決蛋白質的摺疊問題,這是蛋白質研究最後幾個尚未揭示的奧秘之一。“蛋白質結構預測”屬於理論方面的熱力學問題。就是根據測得的蛋白質的一級序列預測由Anfinsen原理決定的特定的空間結構。蛋白質胺基酸序列,特別是編碼蛋白質的核苷酸序列的測定現在幾乎已經成為常規技術,從互補DNA(cDNA)序列可以根據“三聯密碼”推定胺基酸序列,這些在上一世紀獲得重大突破的分子生物學技術,大大加速了蛋白質一級結構的測定。目前蛋白質資料庫中已經存有大約17萬個蛋白的一級結構,但是測定了空間結構的蛋白大約只有1.2萬個,這中間有許多是很相似的同源蛋白,而真正不同的蛋白只有1000多個。隨著人類基因組計畫的勝利完成,解讀了人類DNA的全序列,蛋白質一級結構的數據增長必定會出現爆炸的態勢,而空間結構測定的速度遠遠滯後,因此二者之間還會形成更大的距離,這就更需要進行蛋白質結構的預測。
前景
同時,它還存在重要的潛在套用前景,例如以下幾個方面:
包涵體復性
▲利用DNA重組技術可以將外源基因導入宿主細胞。但重組基因的表達產物往往形成無活性的、不溶解的包涵體。摺疊機制的闡明對包涵體的復性會有重要幫助。
蛋白質
▲DNA重組和多肽合成技術的發展使我們能夠按照自己的意願設計較長的多肽鏈。但由於我們無法了解這一多肽將摺疊為何種構象,從而無法按照自己意願設計我們需要的、具有特定功能的蛋白質。
致病機理
▲許多疾病,如阿茲海默症(Alzheimer's),瘋牛病(Mad Cow,BSE),可傳播性海綿狀腦病(CJD),肌萎縮性脊髓側索硬化症(ALS),還有帕金森氏症(Parkinson's)等正是由於一些細胞內的重要蛋白發生突變,導致蛋白質聚沉或錯誤摺疊而造成的。因此,深入了解蛋白質摺疊與錯誤摺疊的關係對於這些疾病的致病機制的闡明以及治療方法的尋找將大有幫助。
揭示功能
▲基因組序列的發展使我們得到了大量的蛋白質序列,結構信息的獲得對於揭示它們的生物學功能是十分重要的。依靠現有手段(X-ray晶體衍射、NMR及電鏡)測定蛋白質的結構需要較長的時間,因此結構解析的步伐已落後於發現新蛋白的步伐。而結構預測的方法雖然速度較快,但可靠性並不高,只有當我們對於維持蛋白質結構,驅動蛋白質摺疊的理化因素更為了解,這一方法才可能有根本的改進。另外,我們對於蛋白質相互作用、配體與蛋白質的作用等結構與功能關係的研究也有賴於蛋白質摺疊機制的闡明。
摺疊病
人們對由於基因突變造成蛋白質分子中僅僅一個胺基酸殘基的變化就引起疾病的情況已有所了解,即所謂“分子病”,如地中海鐮刀狀紅血球貧血症就是因為血紅蛋白分子中第六位的谷氨酸突變成了頡氨酸。現在則發現蛋白質分子的胺基酸序列沒有改變,只是其結構或者說構象有所改變也能引起疾病,那就是所謂“構象病”,或稱“摺疊病”。
大家都知道的瘋牛病,它是由一種稱為Prion的蛋白質的感染引起的,這種蛋白質也可以感染人而引起神經系統疾病。在正常機體中,Prion是正常神經活動所需要的蛋白質,而致病Prion與正常Prion的一級結構完全相同,只是空間結構不同。這一疾病的研究涉及到許多生物學的基本問題。一級結構完全相同的蛋白質為什麼會有不同的空間結構,這與Anfinsen原理是否矛盾?顯然這裡有蛋白質的能量和穩定性問題。
從來認為蛋白結構的變化來自於序列的變化,而序列的變化來自於基因的變化,生命信息從核酸傳遞到蛋白。而致病Prion的信息已被諾貝爾獎獲得者普魯辛納證明不是來自基因的變化,致病蛋白Prion導致正常蛋白Prion轉變為致病的摺疊狀態是通過蛋白分子間的作用而感染!這種相互作用的本質和機制是什麼?僅僅改變了摺疊狀態的分子又如何導致嚴重的疾病?這些問題都不能用傳統的概念給予滿意的解釋,因此在科學界引起激烈的爭論,有關研究的強度和競爭性也隨之大大增強。
由於蛋白質摺疊異常而造成分子聚集甚至沉澱或不能正常轉運到位所引起的疾病還有老年性痴呆症、囊性纖維病變、家族性高膽固醇症、家族性澱粉樣蛋白症、某些腫瘤、白內障等等。由於分子伴侶在蛋白質摺疊中至關重要的作用,分子伴侶本身的突變顯然會引起蛋白質摺疊異常而引起摺疊病。隨著蛋白質摺疊研究的深入,人們會發現更多疾病的真正病因和更針對性的治療方法,設計更有效的藥物。現在發現有些小分子可以穿越細胞作為配體與突變蛋白結合,從而使原已失去作戰能力的突變蛋白逃逸“蛋白質質量控制系統”而“帶傷作戰”。這種小分子被稱為“藥物分子伴侶”,有希望成為治療“摺疊病”的新藥。新生肽的摺疊問題或蛋白質摺疊問題不僅具有重大的科學意義,除了上面提到的在醫學上的套用價值外,在生物工程上具有極大的套用價值。基因工程和蛋白工程已經逐漸發展成為產值以數十億美元計的大產業,進入21世紀後,還將會有更大的發展。但是當前經常遇到的困難,是在簡單的微生物細胞內引入異體DNA後所合成的多肽鏈往往不能正確摺疊成為有生物活性的蛋白質而形成不溶解的包含體或被降解。這一“瓶頸”問題的徹底解決有待於對新生肽鏈摺疊更多的認識。