通過數據分析找到其中的規律,來指導業務,數據挖掘的核心是挖掘數據的商業價值。下面我們來看看數據挖掘的十大經典算法及主要特點。
1、C4.5
分類決策樹算法,選擇一個好的特征以及分裂點作為當前節點的分類條件。
2、Naive Bayes
統計分類算法,利用概率統計知識進行分類的統計學分類方法
3、SVM
有監督的分類算法,機器學習領域中最常用,廣泛應用于分類和回歸問題
4、KNN
K最近鄰分類算法,如果樣本的K個最相似鄰居屬于某類別,則該樣本也屬于這個類別
5、Adaboost
迭代算法,針對某一訓練集訓練不同的弱分類器,再把這些弱分類器集合構成一個強分類器
6、CART
分類與回歸樹算法,先生成決策樹,然后進行剪枝
7、K-Means
聚類算法,生成指定K個類,把每個對象分配給距離最近的聚類中心
8、EM
最大期望算法,在概率模型中尋找參數最大似然估計的算法
9、Apriori
挖掘潛在關聯關系的算法,采用了逐層搜索的迭代的方法
10、PageRank
網頁排名算法,根據網站的內外部鏈接的數量和質量,衡量網站的價值