這是一個全面的、經過注釋的、非冗餘的蛋白質序列資料庫,包含超過142,000條蛋白質序列(至99年9月),其中包括來自幾十個完整基因組的蛋白質序列。所有序列數據都經過整理,超過99%的序列已按蛋白質家族分類,一半以上還按蛋白質超家族進行了分類。PSD的注釋中還包括對許多序列、結構、基因組和文獻資料庫的交叉索引,以及資料庫內部條目之間的索引,這些內部索引幫助用戶在包括複合物、酶-底物相互作用、活化和調控級聯和具有共同特徵的條目之間方便的檢索。每季度都發行一次完整的資料庫,每周可以得到更新部分。
PSD資料庫有幾個輔助資料庫,如基於超家族的非冗餘庫等。PIR提供三類序列搜尋服務:基於文本的互動式檢索;標準的序列相似性搜尋,包括BLAST、FASTA等;結合序列相似性、注釋信息和蛋白質家族信息的高級搜尋,包括按注釋分類的相似性搜尋、結構域搜尋GeneFIND等。