機器學習是當今的時髦詞。它的應用遍及人工智能的各個領域,它主要使用歸納、綜合而不是演繹。隨著電腦在圍棋等游戲中擊敗了專業人士,許多人開始質疑電腦是否也能讓司機、甚至醫生變得更好。
許多最先進的機器學習模型在功能上都是黑盒,因為幾乎不可能對其內部工作原理有任何感覺。這給我們帶來了一個信任的問題:我是否相信模型中的某個預測是正確的?或者我是否相信模型總體上做出了合理的預測?雖然圍棋的賭注很低,但如果一臺電腦取代了我的醫生,或者決定我是否恐怖主義嫌疑人(有興趣的人嗎?)或許更常見的情況是,如果一家公司正在用基于機器學習的系統替換某些系統,它必須相信機器學習模型將表現得相當好。
從直覺上看,解釋單個預測背后的基本原理,將使我們更容易信任或不信任預測,或整個分類器。即使我們不能理解模型在所有情況下的行為,也有可能(實際上在大多數情況下)理解它在特定情況下的行為。
最后,我要說的是準確性。如果您有機器學習的經驗,我敢打賭您一定會這樣想:“我當然知道我的模型在現實世界中會表現得很好,我的交叉驗證準確度真的很高!”為什么我要去理解它的預測呢? 99%的時候我都知道它是對的。
任何在現實世界中(不僅僅是在靜態數據集中)使用過機器學習的人都可以證明,交叉驗證的準確性可能非常具有誤導性。有時,不應該是可用的數據會意外地泄漏到培訓數據中。
有時候,您收集數據的方式引入了現實世界中不存在的相關性,而這正是模型所利用的。許多其他棘手的問題可以讓我們錯誤地理解性能,甚至在做a /B測試時也是如此。我不是說您不應該測量準確性,只是說它不應該是您評估信任的唯一標準。
機器學習是門復雜的多領域交叉學科,如果想要深入了解機器學習,還需多瀏覽書籍,以及在實戰中進行學習。
想了解更多IT資訊,請訪問中培偉業官網:中培偉業