概論
什麼是系統生物學(systems biology)?“系統生物學(systems biology)”辭彙(最早出現於60年代),檢索美國NIH的PubMed文獻庫見於Zieglgansberger W和Tolle TR.1993發表的研究神經系統疾病的論文摘要中。20世紀早期貝塔郎菲多次發表一般系統論提出理論生物學和“有機生物學”,並定義“有機”為“整合或系統”概念,以及於1973年版《一般系統論:基礎、發展與套用》闡述了採用開放系統論、數學模型與計算機方法研究生物學,儘管貝塔朗菲的興趣跨越了生物學領域,但仍然包括了系統生物學的概念、原理與方法探討。依據1968年的國際系統理論與生物學(systems theory and biology)會議上MesarovicD.提出systemsbiology辭彙(術語)的概念為採用系統論研究生物學或生物學中的系統論研究。1986年著述而於1991-1997年發表的生物自組織系統《結構論 - 泛進化論》,曾邦哲(ZengBJ)闡述了系統結構整合(integrative)、調適穩態與建構(constructive)分層等理論;因此,系統(systems)生物學又稱為整合(integrative)生物學,合成(synthetic)生物學又叫“建構生物學(constructive biology)”(Zeng BJ.中譯)。根據胡德的定義,系統生物學是研究一個生物系統中所有組成成分(基因、mRNA、蛋白質等)的構成,以及在特定條件下這些組分間的相互關係的學科(注,該定義在國際國內都引起異議,缺乏系統論基礎)。也就是說,系統生物學不同於以往的分子生物學——僅關心個別的基因和蛋白質,它要研究所有的基因、所有的蛋白質、組分間的所有相互關係。顯然,系統生物學是以系統論、整體性研究為特徵的一種交叉科學。20 世紀生物學從巨觀到微觀進步巨大, 傳統的分析還原的研究方法受到質疑。在此背景下, 系統生物學是繼基因組學、蛋白質組學之後一門新興的生物學交叉學科。從系統角度來進行生物學研究逐步成為現代生物學研究方法的主流。在研究上, 了解一個複雜的生物系統需要整合實驗和計算方法、基因組學和蛋白質組學中的高通量方法為系統生物學發展提供大量的數據, 計算生物學通過數據處理、模型構建和理論分析, 成為系統生物學發展的一個必不可缺的、強有力的工具, 已經在諸多醫學前沿領域的研究中成為重要研究方法而被廣泛套用。
背景
近代生物學研究主要是以分子生物學和細胞生物學研究為主。研究方法皆採用典型的還原論方法。目前為止, 還原論的研究已經取得了大量的成就, 在細胞甚至在分子層次對生物體都有了很具體的了解, 但對生物體整體的行為卻很難給出系統、圓滿的解釋。生物科學還停留在實驗科學的階段,沒有形成一套完整的理論來描述生物體如何在整體上實現其功能行為, 這實際上是還停留在牛頓力學思想體系的簡單系統的研究階段。但是生物體系統具有紛繁的複雜性。儘管對一個複雜的生物系統來說, 研究基因和蛋白質是非常重要的, 而且它將是我們系統生物學的基礎, 但是僅僅這些尚不能充分揭示一個生物系統的全部信息。這種研究結果只限於解釋生物系統的微觀或局部現象, 並不能解釋系統整體整合功能的來源, 不能充分揭示一個生物系統的信息, 且忽略了系統中各個層面的互動、支持、整合等作用,限制了生物學研究的發展。在這種現狀下, 20 世紀末人類基因組計畫完成後, 生物學領域的科學家都在考慮一個問題: 未來生物學研究的方向在哪裡? 為此學術界也不乏辯論。得出的共識是: 生物學的發展未來主要面對如下問題: (1)如何弄清楚單一生物反應網路, 包括反應分子之間的關係、反應方式等;如何研究生物反應網路之間的關係, 包括量化生物學反應及生物反應網路; (3)如何利用計算機信息及生物工程技術進行生物反應, 生物反應網路, 乃至器官及生物體的重建。
起源
早在1969 年, Bertalanfy LV 就提出了一般系統理論(general systems theory), 他在文章中指出生物體是一個開放系統, 對其組成及生物學功能的深入研究最終需要藉助於計算機和工程學等其他分支學科才能完成。1968年國際召開了系統理論與生物學(systems theory and biology)會議,探討了生物學的系統論(整合)方法,系統生物學的概念形成。1989年在美國召開了生物化學系統論與計算機模型的國際會議,探討了定量與數學的計算生物學- 即,目前所稱的計算系統生物學,2009年於上海中科院召開了其第11屆國際分子系統生物學會議。1996年主辦了第1屆國際轉基因動物學術研討會,中科院曾邦哲闡述了系統(結構)遺傳學、系統生物工程與輸卵管生物反應器等,1999年於德國籌建系統生物科學與工程聯合會,曾邦哲(ZengBJ)定義生物系統分析學與人工生物系統研究的實驗(experimental)、計算(computational)與工程方法,以及分子生物學和計算機科學的結合研究。2000 年, 由LeroyHood 創立的系統生物學研究所(Institute for systems biology)則是在以還原論為主流的現代分子生物學中反其道而行之, 把這種以整體為研究對象的概念重新提出。他給系統生物學賦予了這樣的定義, 系統生物學(systems biology)是研究一個生物系統中所有組成成分(基因、mRNA、蛋白質等)的構成, 以及在特定條件下這些組分間的相互關係的學科。換言之, 以往的實驗分子生物學僅關心基因和蛋白質的個案, 而系統生物學則要研究所有的基因、所有的蛋白質、組分間的所有相互關係。日本北野宏明(Kitano H.)2002年、美國胡德(Hood L.)2003年同樣論述了系統生物學是實驗(experimental)與計算(computational)方法結合的生物系統研究。顯然, 系統生物學是以整體性研究為特徵的一種大科學, 是生物學領域革命性的方法論。以胡德的觀點, 基因、蛋白質以及環境之間不同層次的互動作用共同架構了整個系統的完整功能。因此, 用系統的方法來理解一個生物系統應當成為並正在成為生物學研究方法的主流。利用系統的方法對其進行解析, 綜合分析觀察實驗的數據來進行系統分析。具體通過建立一定的數學模型, 並利用其對真實生物系統進行預測來驗證模型的有效性, 從而揭示出生物體系所蘊涵的奧秘, 這正是生物學研究方法的關鍵所在。
系統生物學的主要研究內容
系統生物學主要研究實體系統(如生物個體、器官、組織和細胞)的建模與仿真、生化代謝途徑的動態分析、各種信號轉導途徑的相互作用、基因調控網路以及疾病機制等。
系統生物學的首要任務是對系統狀態和結構進行描述,即致力於對系統的分析與模式識別, 包括對系統的元素與系統所處環境的定義, 以及對系統元素之間的相互作用關係和環境與系統之間的相互作用的深入分析。具體如生物反應中反應成分之間的量的關係, 空間位置, 時間次序, 反應成分之間的因果關係, 特別是反饋調節和變數控制等有關整個反應體系的問題等。其次要對系統的演化進行動態分析, 包括對系統的穩態特徵、分岔行為、相圖等的分析。掌握了系統的基本演化機制, 使系統具有目標性和可操作性, 使之按照我們所期望的方向演化, 也有助於我們重新構建或修復系統, 為組織工程學的組織設計提供指導。另外, 系統科學對生物系統狀態的描述是分層次的, 對不同層次進行的描述可能是完全不同的; 系統科學對系統演化機制的分析更強調整體與局部的關係, 要分析子系統之間的作用如何形成系統整體的表現、功能, 而且對系統整體的每一行為都要找出其與微觀層次的聯繫。
系統生物學的研究包括兩方面的內容。首先是實驗數據的取得, 這主要包括提供生物數據的各種組學技術平台, 其次是利用計算生物學建立生物模型。因此科學家把系統生物學分為“濕”的實驗部分( 實驗室內的研究)和“乾”的實驗部分( 計算機模擬和理論分析)。“濕”、“乾”實驗的完美整合 - 1999年中科院曾邦哲國際會議與協會籌備中提的實驗生物學家與計算生物學家結合的研究體系,才是真正的系統生物學。
系統生物學的技術平台主要為各種組學研究。這些高通量的組學實驗構成了系統生物學的技術平台。提供建立模型所需的數據, 並辨識出系統的結構。其中包括基因組學、轉錄組學、蛋白質組學、代謝組學、相互作用組學和表型組學計算生物學通過建模和理論探索。可以為生物系統的闡明和定量預測提供強有力的基礎。計算生物學包括數據開採和模擬分析。數據開採是從各實驗平台產生的大量數據和信息中抽取隱含其內的規律並形成假說。模擬分析是用計算機驗證所形成的假說, 並對擬進行的體內、體外生物學實驗進行預測, 最終形成可用於各種生物學研究和預測的虛擬系統。計算生物學涉及一些新的數學原理和運算規則, 需要物理和數學來研究生物學的最基本的原理, 也需要計算科學、信息學、工程學等進行生物工程重建和生物信息傳遞的研究。
研究思路及特點
系統生物學識別目標生物系統中的各種因素, 然後構架一個系統模型, 在其中賦予這個生物系統能動性。在此模型中研究細胞、組織、器官和生物體整體水平, 研究結構和功能各異的各種分子及其相互作用, 並通過計算生物學來定量描述和預測生物功能、表型和行為。系統生物學最大的特點即整合。這裡的整合主要包括三重含義。首先, 把系統內不同性質的構成要素(DNA、mRNA、蛋白質、生物小分子等)整合在一起進行研究; 其次, 對於多細胞生物, 系統生物學要實現從基因到細胞、到器官、到組織甚至是個體的各個層次的整合。第三, 研究思路和方法的整合。經典的分子生物學研究是一種垂直型的研究, 即採用多種手段研究個別的基因和蛋白質。而基因組學、蛋白質組學和其他各種“組學”則是水平型研究, 即以單一的手段同時研究成千上萬個基因或蛋白質。而系統生物學的特點, 則是要把水平型研究和垂直型研究整合起來, 成為一種“三維”的研究。
研究方法
系統生物學最重要的研究手段是干涉(perturbation)。系統生物學的發展正是由於對生物系統的干擾手段不斷進步促成的。干涉主要分為從上到下(top- down)或從下到上(bottom-up)兩種。從上到下, 即由外至里, 主要指在系統內添加新的元素, 觀察系統變化。例如, 在系統中增加一個新的分子以阻斷某一反應通路。而從下到上, 即由內到外, 主要是改變系統內部結構的某些特徵, 從而改變整個系統, 如利用基因敲除, 改變在信號傳導通路中起重要作用的蛋白質的轉錄和翻譯水平。
目前國際上系統生物學的研究方法根據所使用研究工具的不同可分為兩類: 一類是實驗性方法, 一類是數學建模方法。實驗性方法主要是通過進行控制性的反覆實驗來理解系統。首先明確要研究的系統以及所關注的系統現象或功能, 鑑別系統中的所有主要元素, 如DNA、mRNA、蛋白質等,並收集所有可用的實驗數據, 建立一個描述性的初級模型(比如圖形的), 用以解釋系統是如何通過這些元素及其之間的相互作用實現自身功能的。其次在控制其他條件不變的情況下, 干擾系統中的某個元素, 由此得到這種干擾情況下系統各種層次水平的一些數據, 同時收集系統狀態隨時變化的數據, 整合這些數據並與初級模型進行比較, 對模型與實際之間的不符之處通過提出各種假設來進行解釋, 同時修正模型。再設計不同的干擾, 重複上面的步驟, 直到實驗數據與模型相一致為止。
數學建模]方法在根據系統內在機制對系統建立動力學模型, 來定量描述系統各元素之間的相互作用, 進而預測系統的動態演化結果。首先選定要研究的系統, 確定描述系統狀態的主要變數, 以及系統內部和外部環境中所有影響這些變數的重要因素。然後深入分析這些因素與狀態變數之間的因果關係, 以及變數之間的相互作用方式, 建立狀態變數的動態演化模型。再利用數學工具對模型進行求解或者定性定量分析, 充分挖掘數學模型所反映系統的動態演化性質,給出可能的演化結果, 從而對系統行為進行預測。
當代系統生物學研究熱點
基因表達、基因轉換開關、信號轉導途徑, 以及系統出現疾病的機制分析等四個方面是目前系統生物學研究的主要陣地。
基因組醫學(genomic medicine)是以人類基因組為基礎的生命科學和臨床醫學的革命。生命科學和臨床醫學結合, 將人類基因組研究成果轉化套用到臨床實踐中, 是後基因組時代最重要的研究方向之一。人類基因組計畫從完成和多種疾病相關的基因研究發現, 迅速進入到蛋白質組學、染色體組和人類疾病基因的研究, 通過單基因或複雜多基因疾病的相關基因研究和疾病易感因素分析, 達到揭示基因與疾病的關係之目的; 遺傳背景與環境因素綜合作用對疾病發生髮展的影響; 為疾病的診斷、預防和治療、預後和風險預測提供依據。基因組醫學將大大提高我們對健康和疾病狀態的分子基礎的認識, 增強研製有效干預方法的能力。
後基因組(post- genome)的交叉學科研究是目前生命科學研究的前沿。交叉學科是一個新的研究領域, 範圍非常廣闊,如基因組、蛋白質組、轉錄組等等, 從而出現許多新的交叉學科。
細胞信號轉導(signal transduction)的研究是當前細胞生命活動研究的重要課題。細胞信號轉導蛋白質組學是功能蛋白質組學的重要組成部分。系統地研究多條信號轉導通路中蛋白質及蛋白質間相互關係及其作用規律, 細胞信號轉導通路網路化, 其作用模式、通路、功能機制、調控多樣化, 細胞信號轉導結構、功能、途徑的異常在癌症、心血管疾病、糖尿病和大多數疾病中起重要作用。對細胞信號轉導機制的了解,已成為創新藥物、防病治病的關鍵。細胞信號轉導不是一門單一學科, 而是多種學科, 如細胞學、生物化學、生物物理學和藥理學等多學科的交叉學科。
現階段系統生物學存在的問題
目前的系統生物學研究還只是初步使用動力學建模方法來定量描述系統的動態演化行為, 這種方法對簡單巨系統是適用的, 但是在運用到複雜適應性系統時就會表現出很多的局限性, 有很多問題就不能解決。生物體系統的複雜程度超乎我們的想像, 現階段不宜研究整個生物體系統, 可以從研究“小系統”(生物體中具有一定功能、相對獨立的部分, 將其看成一個“系統”)開始, 當然如何正確地分析這個小系統本身也不是件易事。
現有技術水平的限制
著眼於整體的系統生物學對技術、儀器的依賴性大大超過傳統的分子生物學。高通量、大規模的基因組及蛋白質組等的發展都是建立於新技術、新儀器出現基礎之上。就目前的技術水平來講, 距系統生物學所要求達到的理想水平還相差很遠。由於技術發展的不均衡造成了系統中各個水平上的研究不均衡。基因組和基因表達方面的研究已經比較成熟,而在其他水平如蛋白質、小分子代謝物等的研究仍處於起步階段。各種蛋白質在數量上的巨大差異是全面分析低豐度蛋白質的一大障礙。而低豐度蛋白往往是最重要的生物調節分子, 如何加強對低豐度蛋白的高通量研究, 將是對蛋白質組套用前景的重要保障。同樣, 如何研究系統記憶體在的非遺傳性分子即細胞中存在的成百上千的獨立的代謝底物及其他各種類型的大小分子, 它們在基因表達、酶的構象形成等方面有著重要作用。建立適當的方法來系統檢測這些分子的變化是系統生物學能否發展的關鍵。
分析水平的限制
系統的複雜性決定了全面分析的複雜性。人類基因組計畫的實施提供了龐大的信息資源, 已讓人眼花繚亂, 而對於較核苷酸複雜得多的蛋白質及代謝物等的分析將是更大的挑戰。如何系統而詳盡地為公共資料庫中的信息加上註解,對這些複雜數據進行儲存和分析將成為系統生物學發展的瓶頸。系統生物技術,涉及組學生物技術、計算生物技術與化學生物技術等,從系統生物學(1968年系統論與生物學國際會議)、系統遺傳學(1994年Zeng BJ)的提出到系統生物醫學(1992年Kamada T.)或系統醫學與藥物學(1992年Zeng BJ)與系統生物工程(1994年Zeng BJ)概念是系統生物學的理論發展路徑,還基因組結構、功能與進化的實驗方法、計算模型與工程設計的現代生物技術突破將決定系統生物學的發展未來。
系統生物學的工程套用
中科院曾邦哲(1994年發表“論系統生物工程範疇”)在籌辦1996年北京第1屆國際轉基因動物學術研討會(大會秘書長,同美國L. Hood的轉基因通訊)及1999年在德國籌辦系統生物科學與工程國際聯合會及會議(見Nature1999年10月、12月Kybernetes和網際網路,邀請研究e-cell模型的日本M.Tomita)時期,闡述了生物系統論與系統生物工程、遺傳學等,並定義實驗、計算、工程方法的生物系統分析與人工生物系統研究。系統生物工程(systems bioengineering)或生物系統工程(biosystem engineering)可簡述為生物系統論、仿生工程與基因工程的整合,涉及醫療診斷、藥物篩選、遺傳育種與生物製藥等產業,包括,轉基因生物反應器、分子與細胞生物計算機等技術開發。2002年Zeng BJ在德國提出細胞計算機模型(cell automatics, the bio-computer),2003年美國貝克萊大學J.Keasling成立了世界上第一家合成生物學系 - 系統生物學基礎的遺傳工程,採用酵母細胞表達天然植物藥箐篙素分子,實現工程微生物代謝工程製藥。採用計算機輔助設計技術、高通量生物技術、納米生物技術,人工合成全基因乃至基因組,把細胞作為計算機來重新進行人工設計,將帶來細胞製藥廠和細胞生物分子計算機的產業化。歐美科技權威機構稱基因工程、轉基因動物與分子生物技術時代已經轉向系統生物工程、系統與合成生物學時代。