定義
一種查找系列上局部特徵的方法。對序列家族大量模體特徵的識別具有顯著優勢,並且可建立更具統計特徵的模體模型,從而提高序列分類的準確性。
作用
該方法用於查找序列上的局部特徵.一般的,在序列整體同源性不明顯的情況下,該方法可以提高功能預測的靈敏度。
組成
該方法一般由以下兩部分組成:
(1)收集現有的蛋白質家族,通過多重聯配對蛋白質家族各成員的序列進行分析,構造模體資料庫;
(2)利用序列對比等方法通過搜尋該資料庫預測未知蛋白質的功能.典型的模體資料庫有Prosite等.
套用
生物序列模體發現的最最佳化模型
提出了生物序列模體發現的最最佳化模型,該模型適用於搜尋資源(如計算時間)有限的情況,傳統的模體發現方法可能在資源耗盡後仍不能得出任何結果.基於最優搜尋理論給出了一種在有限的時間資源下的最優模體發現策略和算法實現,並得到了一些實驗結果.