內容簡介
本服務平台的啟動是針對2006 年中國科學院上海生命科學研究院申請的院重大項目《模式生物與細胞等功能系統的系統生物學研究》的數據支持而開展的,對該項目中轉錄組和蛋白質組產生的數據管理,集成,分析和共享提供解決方案。該服務平台在2009 年5 月開始上線服務,集成了NCBI 的GEO 資料庫數據和EBI 的Pride 資料庫的數據(共4.7GB),以及項目本身自帶的數據1GB。在服務平台的設計過程中,我們考慮了平台和公共資料庫的半自動更新功能,保證數據的以季度為周期的更新。另外,用戶可以遵守平台要求的格式(如SOFT 格式)提交自己的數據。
本服務平台除了數據存儲功能外,還集成了轉錄組- 蛋白質組豐度數據的基本分析功能。針對生物大分子豐度數據的分析,我們提供了組間比較,聚類,主成份分析等功能。對於蛋白質組數據,本平台提供了蛋白質注釋等功能。對於轉錄組和蛋白質組數據的整合分析,本平台提供以基因為中心的整合,即將兩個不同生物學層次上的數據都映射到基因層次以保證數據實體的一致性。本平台部分自主開發的算法以R 包的方式(如蛋白質注釋相關的函式見論文提供給用戶下載和進一步開放。本服務平台中的數據對所有用戶開放。用戶可以匿名下載我們從公共資料庫整合的數據,對於特定項目相關的數據,用戶需要在系統註冊後下載項目公共數據。匿名用戶可以查看本系統中所有數據。
使用方法
本服務平台提供快速檢索和高級檢索兩種方式。在快速檢索框中,用戶可以使用常用的限定詞自由組合,快速實現對數據的搜尋;在高級檢索中,用戶既可以按限定詞單個檢索或邏輯組合檢索還可以用平台的定義的規則編寫搜尋規則語句進行搜尋。搜尋結果以簡要顯示或者概要顯示格式展示。具體的搜尋規則可見本服務平台的幫助檔案。
對於每個條目,用戶可以瀏覽數據自身的元數據,對數據預處理得到的一些基本的統計描述信息。用戶可以對選中的條目進行平台內嵌的統計方法進行統計分析。在每個條目中,我們會聚集所有和該條目相關的其它信息,如關聯條目的連結,物種信息,實驗信息,數據質控情況等。用戶可以直接拷貝條目上的信息,或以文本格式下載。
對於平台提供的數據分析功能。用戶除了對系統本身數據的直接分析,還可以遞交自己的數據進行線上分析。對於小於10M 的線上數據分析,用戶可以自己直接遞交分析。但如果數據量過大,由於考慮到伺服器的負荷情況,我們需要用戶進行預約。
套用案例
中科院系統生物學重點實驗室蛋白質組學研究平台:本服務平台與中科院系統生物學重點實驗室蛋白質組學研究平台進行了深入的合作,使用該蛋白質組學平台產生的實驗數據對適配器技術(adapter)和蛋白質組學子庫進行了測試,測試結果表明適配器技術可以有效地將不同實驗室產生的數據有效地轉化為標準數據交換格式(PRIDESchema、MZML、iPRIDESchema 格式),大大方便了實驗室數據的發布和交流。
上海交通大學生命科學技術學院某實驗室:該實驗室同時擁有基因晶片數據和蛋白質組數據,因此通過我們的平台進行整合分析。首先該實驗室將數據存入我們平台,然後通過平台的數據預處理(如PannBuilder 軟體包的蛋白質注釋)。借用平台已有的組間比較,聚類,主成份分析等功能,我們可以得到常規分析的結果。此時,我們可以對兩個不同生物學層次的數據直接進行比較分析。
持續發展
本服務平台採用半自動更新方式,實現對GEO 和PRIDE 數據的同步,以保證每個季度的數據一致性。另外,主動參與到一些項目中,為這些科研項目提供技術支撐和數據存儲。