基本概述
中文名稱:長散在元件
英文名稱:10nginterspersednuclearelements,LINE
長散在元件亦稱長散在重複序列,意為散在分布的長細胞核因子,是散在分布在哺乳動物基因中的一類重複序列,這種重複序列較長;LINE是可以自主轉座的一類反轉錄轉座子,來源於RNA聚合酶Ⅱ的轉錄產物;L1是LINE中的一種重複序列,長約6500bp,哺乳動物基因組中的拷貝數可多達10萬份,主要集中在AT富集區。L1以及由L1編碼的反轉錄酶作用於其他非自主反轉錄轉座子以後所生成的DNA序列,加起來至少占人類基因組全長的四分之一。LINE不同成員之間的序列有較大差別,但是同一物種中的LINE的不同成員仍有較大的同源性。
結構構造
LINE有分別長1137bp和3900bp的可讀框,這兩種可讀框有14bp的重疊序列。從LINE的結構分析,它並不具有反轉錄病毒特有的LTR,因此曾把LINE歸於非病毒超家族。測序的結果發現LINEL1的一個可讀框同反轉錄酶是同源的,這提示LINE可能來源於能夠編碼轉座所需的酶進行自主轉座的可動元件,所以現在在分類時被歸人病毒超家族。
發現歷史
1988年,人們第一次認識到可動元件可能是人類疾病的一種致病因素。當時在血友病A的凝血因子Ⅷ基因中發現了兩個截
短的L1,後來在凝血因子Ⅷ的基因中又發現了一個反轉座的L1插入片段。進行性假肥大性—肌營養不良(Duchenne’smusculardystrophy,DMD)基因中有三個L1,腸道癌的致病基因APC以及夕—珠蛋白基因中也都發現了L1。已發現的致病的L1插入片段絕大多數出現在生殖細胞或早期胚胎中。APC基因中的11插入片段則是在結腸癌中發現的。這表明L1的反轉座作用也可以發生在體細胞中。L1的插入有以下兩個,結構特徵:①已發現的每一個插入片段的序列都各不相同,這表明它們是分別來自不同的原初元件(progenitorelements);②上面提到的已發現的8個L1插入片段中,有7個是5,端截短的,其長度變化很大,從538bp到3.8kb,但是所有這些L1插入片段的蛋白質編碼區都保持完整;插人口—珠蛋白基因的L1是全長的。這些數據提示,並非所有具誘變作用的L1片段在插入後都不再移動了,有些片段很有可能仍保持再次反轉錄轉座的能力。例如,小鼠的全長L1插入片段,確實能再經歷幾輪的反轉錄轉座。
重要作用
L1插入片段的全長原初元件可能是哺乳動物中有活性的反轉錄轉座子的來源。L1被認為是人類基因組中主要的可動因子,它不僅能自主轉座,而且它的蛋白質產物可促使非自主轉座因子的反轉錄轉座。同時L1還能十分有效地將位於L13’端的側序一起轉座到新的位置,這種作用稱為3'轉導(3'transduction),其結果是將宿主基因組中原先不連鎖的兩個DNA片段排列在一起。許多真核細胞中都發生3'轉導作用。當L1本身的轉錄終止信號較弱而3'側序中有很強的轉錄終止信號時,RNA聚合酶進行L1轉錄時就會發生“連讀”(read-through),而將11’和3'側序一起轉錄,其結果是包含L1和3'側序的嵌合片段一起插入染色體新的位置,這對新基因的形成和基因組的進化都有重要作用。