調參得好不好往往對最終模型性能有關鍵性影響.給定包含m個樣本的數據集D,在模型評估與選擇過程中由于需要留出一部分數據進行評估測試,事實上我們只使用了一部分數據訓練模型.因此,在模型選擇完成后,學習算法和參數配置已選定,此時應該用數據集D重新訓練模型,這個模型在訓練過程中使用了所有m個樣本,這才是我們最終提交給用戶的模型.另外,需注意的是,我們通常把學得模型在實際使用中遇到的數據稱為測試數據,為了加以區分,模型評估與選擇中用于評估測試的數據集常稱為“驗證集”(validation set).例如,在研究對比不同算法的泛化性能時,我們用測試集上的判別效果來估計模型在實際使用時的泛化能力,而把訓練數據另外劃分為訓練集和驗證集,基于驗證集上的性能來進行模型選擇和調參.