如此將ROC曲線上的每個點轉化為代價平面上的一條線段,然后取所有線段的下界,圍成的面積即為在所有條件下學習器的期望總體代價 有了實驗評估方法和性能度量,看起來就能對學習器的性能進行評估b匕較了:先使用某種實驗評估方法測得學習器的某個性能度量結果,然后對這些結果進行比較.但怎么來做這個“比較”呢?是直接取得性能度量的值然后“比大小”嗎?實際上,機器學習中性能比較這件事要比大家想象的復雜得多,這里面涉及幾個重要因素:首先,我們希望比較的是泛化性能,然而通過實驗評估方法我們獲得的是測試集上的性能,兩者的對比結果可能未必相同;第二,測試集上的性能與測試集本身的選擇有很大關系,且不論使用不同大小的測試集會得到不同的結果,即便用相同大小的測試集,若包含的測試樣例不同,測試結果也會有不同;第三,很多機器學習算法本身有一定的隨機性,即便用相同的參數設置在同一個測試集上多次運行,其結果也會有不同,那么,有沒有適當的方法對學習器的性能進行比較呢?
想了解更多IT資訊,請訪問中培偉業官網:中培偉業