機器學習正是這樣一門學科,它致力于研究如何通過計算的手段,利用經驗來改善系統自身的性能.在計算機系統中,“經驗”通常以“數據”形式存在,因此,機器學習所研究的主要內容,是關于在計算機上從數據中產生“模型”(model)的算法,即“學習算法”(learning algorithm).有了學習算法,我們把經驗數據提供給它,它就能基于這些數據產生模型;在面對新的情況時(例如看到一個沒剖開的西瓜),模型會給我們提供相應的判斷(例如好瓜).如果說計算機科學是研究關于“算法”的學問,那么類似的,可以說機器學習是研究關于“學習算法”的學問,本書用“模型”泛指從數據中學得的結果,有文獻用“模型”指全局性結果(例如一棵決策樹),而用“模式”指局部性結果(例如一條規則).?