序列分布
集中分布
Alu序列一般散在分布,少數呈簇狀分布。在細胞遺傳學水平上觀察, Alu重複序列集中在基因轉錄最活躍的染色體區段內。在所有已知的基因內含子中,幾乎都發現了 Alu序列。
同源序列
與 Alu序列亞基有很高同源性的7S LRNA是7S RNA的一部分,是將蛋白質運送到內質網以便分泌出胞外的信號識別顆粒(signal—recognition particle,SRP)的組成部分。7S RNA 5' 端的90個核苷酸同 Alu序列左端同源,中間的160個核苷酸與 Alu序列沒有同源性,而3' 端的40個核苷酸與 Alu序列右端同源。7S RNA基因是由RNA聚合酶Ⅲ轉錄的。人體 Alu重複序列絕大多數要由RNA聚合酶Ⅲ轉錄成RNA,而且 Alu 3' 端有polyA尾,這些都提示 Alu重複序列是通過RNA為中介,反轉錄成DNA後整合在基因組新位置上的。這裡要提及的是,所有真核細胞里都含有3種RNA聚合酶;RNA聚合酶I負責轉錄rRNA基因,產生核糖體RNA(ribosomal RNA,rRNA);RNA聚合酶Ⅱ負責轉錄所有編碼蛋白質的基因,產生信使RNA(messenger RNA,mRNA),再由多聚腺嘌呤核苷酸聚合酶(poly(A)polymerase)負責加上poly(A)尾;RNA聚合酶Ⅲ負責轉錄轉移RNA(transfer RNA,tRNA)以及細胞核和細胞質內的各種小RNA,這些被轉錄的基因一般長300bp左右,且在基因組的重複拷貝數可達幾千份甚至上百萬份。
序列同性
Alu家族不同成員之間的一致序列(consensus sequence)的同一性平均達87%。小鼠基因組內約有5萬份拷貝的B1重複序列,長130 bp,與 Alu的一個亞基的同源性達70%--80%。
研究情況
哺乳動物基因組中為什麼有這么多重複拷貝的DNA序列,還不是很清楚。現已發現, Alu序列中有一個14 bp的區段同乳多空病毒(papova virus)如SV40病毒,以及B型肝炎病毒的複製起始序列幾乎完全相同。這提示 Alu序列很可能同真核生物基因組中的複製起始有某種相關,但這也存在爭論。因為 Alu重複序列的拷貝數比複製起始點的預期數多出幾十倍。此外還發現,中國倉鼠的 Alu類家族( Alu-equivalent family)的一些成員,當位於其他轉錄單位附近時,能在體內被轉錄生成單獨的RNA分子。