模塊 | 內(nèi)容 | |
第一單元 | 概率論與 數(shù)理統(tǒng)計(jì)基礎(chǔ) |
數(shù)據(jù)分析方法概述:數(shù)據(jù)分析過程、數(shù)據(jù)分析的商業(yè)驅(qū)動 概率論基礎(chǔ):集合、概率、隨機(jī)變量、概率密度、公理化 變換和期望:隨機(jī)變量函數(shù)分布、矩、矩列唯一性 常見分布族:離散分布、連續(xù)分布、指數(shù)分布、中心極限定理、概率不等式 多維隨機(jī)變量:聯(lián)合分布與邊緣分布、多層模型與混合分布、二維變化、協(xié)方差與相關(guān)系數(shù) 隨機(jī)樣本的性質(zhì):抽樣、樣本分布 數(shù)據(jù)簡化原理:似然函數(shù)、輔助函數(shù) 參數(shù)估計(jì):點(diǎn)估計(jì)、區(qū)間估計(jì)、矩估計(jì)、貝葉斯估計(jì)、EM 算法 假設(shè)檢驗(yàn):似然比檢驗(yàn)、貝葉斯檢驗(yàn)、最大功效檢驗(yàn)、置信區(qū)間、P 值、損失函數(shù) 漸進(jìn)評價:相合性、有效性、標(biāo)準(zhǔn)誤差、穩(wěn)健性、LTR 的漸進(jìn)分布、近似極大似然區(qū)間 方差分析和回歸分析:ANOVA 假設(shè)、簡單線性回歸與最小二乘 回歸模型:變量有誤差時的線性回歸、Logistic 回歸、穩(wěn)健回歸 |
第二單元 | PYTHON 基礎(chǔ) |
基礎(chǔ)知識:安裝配置、基礎(chǔ)語法等 數(shù)據(jù)可視化:數(shù)據(jù)可視化包介紹及圖像繪制 數(shù)據(jù)整理和數(shù)據(jù)清洗:Numpy 數(shù)組基礎(chǔ);Pandas 對象基礎(chǔ) |
第三單元 | 機(jī)器學(xué)習(xí)算法 | scikit-learn 入門:Scikit-Learn 庫簡介 KNN-最近鄰分類算法:原理、實(shí)現(xiàn)、示例講解 決策樹算法:原理、實(shí)現(xiàn)、示例講解 隨機(jī)森林算法:原理、實(shí)現(xiàn)、示例講解 K-Means 聚類算法:原理、實(shí)現(xiàn)、示例講解 關(guān)聯(lián)規(guī)則算法:原理、實(shí)現(xiàn)、示例講解 線性回歸:原理、實(shí)現(xiàn)、示例講解 邏輯回歸:原理、實(shí)現(xiàn)、示例講解 SVM 支持向量機(jī):原理、實(shí)現(xiàn)、示例講解 樸素貝葉斯算法:原理、實(shí)現(xiàn)、示例講解 |
第四單元 | 客戶生命周期案例 | 結(jié)合客戶生命周期案例,講解精準(zhǔn)營銷、銀行反欺詐、信用評分等內(nèi)容。 |