歐洲分子生物學實驗室核酸序列資料庫

介紹

歐洲分子生物學實驗室EMBL(European Molecular Biology Laboratory)1974年由歐洲14個國家加上亞洲的以色列共同發起建立,現在由歐洲30個成員國政府支持組成,目的在於促進歐洲國家之間的合作來發展分子生物學的基礎研究和改進儀器設備、教育工作等。EMBL分為7個部分:結構、分化、物理儀器、生化儀器、生物儀器、計算機和套用數學。它的宗旨是:從事結構分子生物學及分子醫學方面的基礎研究;為科學家、學生及訪問學者提供高層次的培訓;為成員國的科學家提供必需的科研服務;在生命科學領域開發新型的科研儀器及研究方法;積極參與生物技術的轉化及套用。

研究領域

EMBL目前約有85個獨立的課題組,涵蓋分子生物學的各個主要分支,其研究主要集中在以下幾個方面:

1.生化實驗技術質譜分析(Mass Spectrometry)等。

2.細胞生物學(Cell Biology),研究細胞膜上蛋白和脂肪的分布,包括膜運輸、微管網路、細胞核及細胞周期,焦點是Rab蛋白。

3.細胞生物物理(Cell Biophysics),重點是理論創新和實際套用的研究,尤其是光學顯微鏡的完善使用。

4.分化(Differentiation),集中研究果蠅的早期發育。

5.基因表達(Gene Expression),研究基因到蛋白質信息傳遞的過程,尤其是核糖體合成在整個細胞生命過程中的重要作用。

6.結構生物學(Structure Biology),在過去幾年中建立了cDNA測序技術、生物計算、蛋白工程、晶體學、電子顯微鏡(EM)及核磁共振(VMR),研究肌肉巨型蛋白分子Titin。

7.法國格勒諾布爾(Grenoble)分站,主要研究蛋白質合成過程,尤其揭示了G-蛋白-鳥苷酸交換因子偶聯物的結構。

8.德國Hamburg分站,著重於結構生物學研究,如光學測量系統、晶體學、X-線吸收光譜及小角散射,有長期的分子生物學國際合作研究歷史。

9.英國Hinxton分站EBI(European Bioinformatics Institute,歐洲生物信息學研究所),重點是與世界上其他分子生物學資料庫進行合作研究,最主要的有EMBL核酸序列資料庫,後參與了與日內瓦大學共同進行的SWISS-PROT的建設。在SWISS-PROT與EMBL核苷酸序列庫之間的數據轉移的基礎上,產生了新的資料庫TREMBL(Translation from EMBL),使核苷酸序列庫的核苷酸序列自動翻譯成SWISS-PROT蛋白序列庫中的蛋白序列。

10.放射性雜交資料庫(Radiation Hybrid Database)。

11.Monterotondo研究中心組,EMBL和歐洲其他研究組一起,加入到哺乳類生物學和生物醫學的研究行列,中心位於義大利羅馬北部的Monterotondo,著重於鼠遺傳學研究。

核酸序列資料庫

EMBL-DNA資料庫於1982年由EMBL建立,與美國的GenBank及日本的DDBJ共同組玉成球性的國際DNA資料庫,近年來發展很快,在1995年數據量成倍遞增。EBI是EMBL在英國Hinxton的分部,主要負責建立EMBL-DNA資料庫,可進行核苷酸序列檢索及序列相似性查詢。

EMBL資料庫的基本單位也是序列條目,包括核甘酸鹼基排列順序和注釋兩部分。序列條目由欄位組成,每個欄位由標識字起始,後面為該欄位的具體說明。有些欄位又分若干次子欄位,以次標識字或特性表說明符開始,最後以雙斜槓“//”作本序列條目結束標記。條目的關鍵字包括ID(序列名稱),DE(序列簡單說明),AC(序列編號),SV(序列版本號),KW(與序列相關的關鍵字),OS(序列來源的物種名),OC(序列來源的物種學名和分類學位置),RN(相關文獻編號或遞交序列的註冊信息),RA(相關文獻作者或遞交序列的作者),RT(相關文獻題目),RL(相關文獻雜誌名或遞交序列的作者單位),RX(相關文獻 Mediline引文代碼),RC(相關文獻注釋),RP(相關文獻其他注釋),CC(關於序列的注釋信息),DR(相關資料庫交叉引用號),FH(序列特徵表起始),FT(序列特徵表子項),SQ(鹼基種類統計數)。

歐洲生物信息學研究所(European Bioinformatics Institute, EBI)創建的一個核酸序列資料庫。EMBL的數據來源主要有兩部分,一部分由科研人員或某些基因組測序機構通過計算機網路直接提交,另一部分則來自科技文獻或專利(Stoesser等, 1998)。EMBL與DDBJ、GenBank建有合作關係,他們分別在全世界範圍內收集核酸序列信息,每天都將新發現或更新過的數據相互交換。

DNA資料庫的規模正在以指數方式增長,平均不到9個月就增加一倍。1998年1月,EMBL中收錄的序列數已超過一百萬,包括15,500個物種,其中模式生物的序列占50%以上,它們包括人類(Homo sapiens), 線蟲(Caenorhabditis elegans),啤酒酵母(Saccharomyces cerevisiae),小鼠(Mus musculus)和擬南芥(Arabidopsis thalania)。

可以利用序列查詢系統 SRS(Sequence Retrieval System)從EMBL資料庫中提取有關信息(Etzold等,1996年)。SRS序列查詢系統通過超文本連結將DNA序列資料庫和蛋白質序列、功能位點、結構、基因圖譜以及文獻摘要MEDLINE等各種資料庫聯繫在一起。利用EBI網站提供的BLAST或FastA程式,可以對EMBL資料庫進行未知序列同源性搜尋。

相關詞條

熱門詞條

聯絡我們