數學定義
分數( Score),又稱平衡F分數(balanced F Score),它被定義為精確率和召回率的調和平均數。
更一般的,我們定義 分數為
除了 分數之外, 分數和 分數在統計學中也得到大量的套用。其中, 分數中,召回率的權重高於準確率,而 分數中,準確率的權重高於召回率。
物理意義
人們通常使用準確率和召回率這兩個指標,來評價二分類模型的分析效果。
但是當這兩個指標發生衝突時,我們很難在模型之間進行比較。比如,我們有如下兩個模型A、B,A模型的召回率高於B模型,但是B模型的準確率高於A模型,A和B這兩個模型的綜合性能,哪一個更優呢?
準確率 | 召回率 | |
A | 80% | 90% |
B | 90% | 80% |
為了解決這個問題,人們提出了 分數。
的物理意義就是將準確率和召回率這兩個分值合併為一個分值,在合併的過程中,召回率的權重是準確率的 倍。 分數認為召回率和準確率同等重要, 分數認為召回率的重要程度是準確率的2倍,而 分數認為召回率的重要程度是準確率的一半。
套用領域
F分數被廣泛套用在信息檢索領域,用來衡量檢索分類和文檔分類的性能。早期人們只關注 分數,但是隨著谷歌、百度等大型搜尋引擎的興起,召回率和準確率對性能影響的權重開始變得不同,人們開始更關注其中的一種,所以 分數得到越來越廣泛的套用。
F分數也被廣泛套用在自然語言處理領域,比如命名實體識別、分詞等,用來衡量算法或系統的性能。
G分數
G分數是另一種統一準確率和召回率的系統性能評估標準。
F分數是準確率和召回率的調和平均數,G分數被定義為準確率和召回率的幾何平均數。