假設(shè)檢驗(yàn)中的“假設(shè)”是對(duì)學(xué)習(xí)器泛化錯(cuò)誤率分布的某種判斷或猜想
2018-08-16 閱讀全文>>統(tǒng)計(jì)假設(shè)檢驗(yàn)(hypothesis test)為我們進(jìn)行學(xué)習(xí)器性能比較提供了重要依據(jù),基于假設(shè)檢驗(yàn)結(jié)果我們可推斷出,若在測試集上觀察到學(xué)習(xí)器A比B好,則A的泛化性能是否在統(tǒng)計(jì)意義上優(yōu)于B,以及這個(gè)結(jié)論的把握有多大
2018-08-16 閱讀全文>>將ROC曲線上的每個(gè)點(diǎn)轉(zhuǎn)化為代價(jià)平面上的一條線段,然后取所有線段的下界
2018-08-16 閱讀全文>>回顧前面介紹的一些性能度量可看出,它們大都隱式地假設(shè)了均等代價(jià)
2018-08-16 閱讀全文>>在現(xiàn)實(shí)任務(wù)中常會(huì)遇到這樣的情況:不同類型的錯(cuò)誤所造成的后果不同.例如在醫(yī)療診斷中,錯(cuò)誤地把患者診斷為健康人與錯(cuò)誤地把健康人診斷為患者,看起來都是犯了“一次錯(cuò)誤”
2018-08-16 閱讀全文>>現(xiàn)實(shí)任務(wù)中通常是利用有限個(gè)測試樣例來繪制ROC圖,此時(shí)僅能獲得有限個(gè)(真正例率,假正例率)坐標(biāo)對(duì),無法產(chǎn)生圖2 4(a)中的光滑ROC曲線,只能基于有限個(gè)測試樣例篆繪制出如圖2 4(b)所示的近似ROC曲線
2018-08-16 閱讀全文>>錯(cuò)誤率和精度雖常用,但并不能滿足所有任務(wù)需求.以西瓜問題為例,假定瓜農(nóng)拉來一車西瓜,我們用訓(xùn)練好的模型對(duì)這些西瓜進(jìn)行判別,顯然,錯(cuò)誤率衡量了有多少比例的瓜被判別錯(cuò)誤.
2018-08-16 閱讀全文>>調(diào)參得好不好往往對(duì)最終模型性能有關(guān)鍵性影響.給定包含m個(gè)樣本的數(shù)據(jù)集D,在模型評(píng)估與選擇過程中由于需要留出一部分?jǐn)?shù)據(jù)進(jìn)行評(píng)估測試,事實(shí)上我們只使用了一部分?jǐn)?shù)據(jù)訓(xùn)練模型.
2018-08-16 閱讀全文>>大多數(shù)學(xué)習(xí)算法都有些參數(shù)(parameter)需要設(shè)定,參數(shù)配置不同,學(xué)得模型的性能往往有顯著差別.因此,在進(jìn)行模型評(píng)估與選擇時(shí),除了要對(duì)適用學(xué)習(xí)算法進(jìn)行選擇,還需對(duì)算法參數(shù)進(jìn)行設(shè)定,這就是通常所說的“參數(shù)調(diào)節(jié)”或簡稱“調(diào)參”(parameter tuning)
2018-08-16 閱讀全文>>“自助法”(bootstrapping)是一個(gè)比較好的解決方案
2018-08-16 閱讀全文>>留一法的估計(jì)結(jié)果也未必永遠(yuǎn)比其他評(píng)估方法準(zhǔn)確
2018-08-16 閱讀全文>>“交叉驗(yàn)證法”(cross validation)先將數(shù)據(jù)集D劃分為尼、個(gè)大小相似的互斥子集,即D= Di u D2 u U Dk,DinDj=g(t≠j) 每個(gè)子集Di都盡可能保持?jǐn)?shù)據(jù)分布的一致性,即從D中通過分層采樣得到
2018-08-16 閱讀全文>>一般要采用若干次隨機(jī)劃分、重復(fù)進(jìn)行實(shí)驗(yàn)評(píng)估后取平均值作為留出法的評(píng)估結(jié)果
2018-08-16 閱讀全文>>訓(xùn)練/測試集的劃分要盡可能保持?jǐn)?shù)據(jù)分布的一致性
2018-08-16 閱讀全文>>訓(xùn)練樣本相當(dāng)于給同學(xué)們練習(xí)的習(xí)題,測試過程則相當(dāng)于考試
2018-08-16 閱讀全文>>26909條 上一頁 1.. 1356 1357 1358 1359 1360 ..1794 下一頁