基因組簡介
Clustered Regularly Interspaced Short Palindromic Repeats RNA,是最近幾年才發現的原核生物中的調控RNA,第一次是在1987年在大腸桿菌中有報導,到2000年時,有人證實了,目前為止,已有40%已測序的細菌和90%已測序的古細菌中有報導。CRISPR含有一個與噬菌體和質粒同源的短的重複序列,通過對外來同源的DNA作用對噬菌體有抗性,影響質粒的連線,是原核生物的免疫系統一部分。 CRISPR sequences是一個高度多變的DNA序列,常包含一個550bp的leader 序列和一系列重複單位(repeat-spacer units)。重複序列長度在24-48bp,他們通常會形成二重對稱,因此會形成如髮夾結構的二級結構,但不是迴文結構,重複次數最高可達250 次。重複序列之間被26~72 bp 間隔序列(spacer)隔開, 間隔序列長度與細菌種類和CRISPR 位點有關。在一個原核細胞基因組中通常存在1 至幾個CRISPR 位點, 例如在Methanocaldococcus jannaschii 的染色體上已鑑定出18 個不同的CRISPR 位點, 差不多占整個染色體的1%。CRISPR 位點通常定位在原核細胞染色體上, 個別出現在質粒中。CRISPR 的間隔序列與噬菌體或質粒序列存在有同源性, 甚至有一些間隔序列與噬菌體基因組序列同源性為100%, 這表明間隔序列來源於噬菌體基因組。
Cas 家族
在CRISPR 位點附近, 存在一系列CRISPR相關基因(CRISPR-associated, Cas),在許多原核生物中都有發現。cas 基因根據其保守程度可分為核心cas 基因, 亞型特異性cas 基因和 RAMP (repeat -associated mysterious proteins)組件基因。在CRISPR 位點的第一個重複序列的上游定位有CRISPR 前導序列(leader sequence), 其功能作為啟動子。當CRISPR轉錄後,Cas 蛋白加工CRISPR RNA成一個沉默RNA,這個沉默RNA就會對外來同源的DNA起到作用。CRISPR-Cas 系統的生物學功能開始是通過計算機分析細菌和古細菌的基因組序列被發現的, 之後得到了實驗證實。
作用機制
目前為止, 雖然對CRISPR-Cas 系統的詳細作用機制尚未得到完全闡明, 但已基本明確了它的作用機制的整個過程。CRISPR-Cas 系統的作用機制大體可分為3 個不同階段,如圖:
在噬菌體侵入的起始階段,Cas 蛋白複合物靶向並裂解噬菌體基因組中短的原型間隔序列(proto-spacer),這些原型間隔序列剪下來整合到宿主基因組中的CRISPR 位點的5′端。然後這些短的摻入的間隔序列被轉錄成crRNAs(CRISPR RNAs), crRNAs 中除含有間隔序列轉錄物外, 還含有間隔序列兩側部分重複序列的轉錄產物。最後階段是靶向和干擾侵入的噬菌體DNA 序列, 這個過程仍需Cas 蛋白複合物參與。當宿主再被噬菌體感染時, crRNAs 作為模板靶向噬菌體的原型間隔序列,靶向的DNA 序列中是否含有CRISPR 的部分重複序列, 如果含有這部分序列, crRNAs 與之通過鹼基配對結合後被干擾降解。
小結
CRISPR-Cas 系統作為原核細胞的適應性免疫系統, 不但具有真核細胞的特異性和記憶性,而且還具有原核細胞特有的可遺傳性,從CRISPR 系統在細菌中分布的廣泛性和多樣性可以看出, CRISPR 位點是細菌在漫長的進化中不斷形成的, 也說明CRISPR 免疫防禦系統在原核細胞中可能是最原始的免疫系統之一。CRISPR 位點除了它的防禦功能外, 在一些細菌中似乎具有其它功能。如, 在鑑定的兩個相關的Thermotoga 菌的基因組中, 有許多大的轉位發生在CRISPR位點。