假設檢驗是數據分析中的一種重要方法,它是先對總體參數提出某種假設,然后利用樣本信息判斷假設是否成立的過程。假設檢驗的基本步驟包括:
1、建立原假設,確定業務需求和目的。
2、確定小概率事件的界值,概率界值在不同行業中通用。
3、獲取樣本,收集或調查數據。
4、選擇檢驗的方法和統計方法。
5、根據原需求和數據得出結論,確定假設是否可信。
在假設檢驗中,我們做出判斷所依據的邏輯是:如果在原假設正確的前提下,檢驗統計量的樣本觀測值的出現屬于小概率事件,那么可以認為原假設不可信,從而否定它,轉而接受備擇假設。
假設檢驗的特點是采用邏輯上的反證法和依據統計上的小概率原理。小概率事件在單獨一次的試驗中基本上不會發生,因此可以不予考慮。在假設檢驗中,需要注意兩類錯誤的概率相加并不一定等于1。