2.3.2 查準率、查全率與Fl
錯誤率和精度雖常用,但并不能滿足所有任務需求.以西瓜問題為例,假定瓜農拉來一車西瓜,我們用訓練好的模型對這些西瓜進行判別,顯然,錯誤率衡量了有多少比例的瓜被判別錯誤.但是若我們關心的是“挑出的西瓜中有多少比例是好瓜”,或者“所有好瓜中有多少比例被挑了出來”,那么錯誤率顯然就不夠用了,這時需要使用其他的性能度量,類似的需求在信息檢索、Web搜索等應用中經常出現,例如在信息檢索中,我們經常會關心“檢索出的信息中有多少比例是用戶感興趣的”“用戶感興趣的信息中有多少被檢索出來了”,“查準率”(precision)與“查全查準率亦稱“準確率”率”(recall)是更為適用于此類需求的性能度量,查全率亦稱“召回率”.對于二分類問題,可將樣例根據其真實類別與學習器預測類別的組合劃分為真正例(true positive)、假正例(false positive)、真反例(true negative)、假反例(false negative)四種情形,令TP、FP、TN、FN分別表示其對應的樣例數,則顯然有TP+FP+TN+FN=樣例總數.