介紹
三元組損失需要三張輸入圖片和對比損失不同。一個輸入的三元組(Triplet)包括一對正樣本對和一對負樣本對。三張圖片分別命名為固定圖片(Anchor) a ,正樣本圖片(Positive)p和負樣本圖片(Negative) n 。圖片和圖片為一對正樣本對,圖片和圖片為一對負樣本對。則三元組損失表示為:
其中,仍然表示樣本之間特徵的距離。如下圖1所示,三元組可以拉近正樣本對之間的距離,推開負樣本對之間的距離,最後使得相同ID的行人圖片在特徵空間裡形成聚類,達到行人重識別的目的。
核心思想
TriHard損失的核心思想是:對於每一個訓練batch,隨機挑選 P 個ID的行人,每個行人隨機挑選 K 張不同的圖片,即一個batch含有 P×K 張圖片 。之後對於batch中的每一張圖片a ,我們可以挑選一個最難的正樣本和一個最難的負樣本和a 組成一個三元組。