2.3.4 代價敏感錯誤率與代價曲線
在現實任務中常會遇到這樣的情況:不同類型的錯誤所造成的后果不同.例如在醫療診斷中,錯誤地把患者診斷為健康人與錯誤地把健康人診斷為患者,看起來都是犯了“一次錯誤”,但后者的影響是增加了進一步檢查的麻煩,前者的后果卻可能是喪失了拯救生命的最佳時機;再如,門禁系統錯誤地把可通行人員攔在門外,將使得用戶體驗不佳,但錯誤地把陌生人放進門內,則會造成嚴重的安全事故.為權衡不同類型錯誤所造成的不同損失,可為錯誤賦予“非均等代價”(unequal cost).
以二分類任務為例,我們可根據任務的領域知識設定一個“代價矩陣”(cost matrix),如表2.2所示,其中costij表示將第i類樣本預測為第歹類樣本的代價,一般來說,costii=0;若將第0類判別為第1類所造成的損失更大,則costoi>costio;損失程度相差越大,costoi與costio值的差別越大.