數(shù)據(jù)挖掘(Data Mining)是從大量的、不完全的、有噪聲的、模糊的、隨機的數(shù)據(jù)中提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。
今天來介紹的是數(shù)據(jù)挖掘的7種方法~
1、神經(jīng)網(wǎng)絡方法
神經(jīng)網(wǎng)絡由于本身良好的魯棒性、自組織自適應性、并行處理、分布存儲和高度容錯等特性非常適合解決數(shù)據(jù)挖掘的問題,因此近年來越來越受到人們的關注。
2、遺傳算法
遺傳算法是一種基于生物自然選擇與遺傳機理的隨機搜索算法,是一種仿生全局優(yōu)化方法。遺傳算法具有的隱含并行性、易于和其它模型結合等性質使得它在數(shù)據(jù)挖掘中被加以應用。
3、決策樹方法
決策樹是一種常用于預測模型的算法,它通過將大量數(shù)據(jù)有目的分類,從中找到一些有價值的,潛在的信息。它的主要優(yōu)點是描述簡單,分類速度快,特別適合大規(guī)模的數(shù)據(jù)處理。
4、粗集方法
粗集理論是一種研究不精確、不確定知識的數(shù)學工具。粗集方法有幾個優(yōu)點:不需要給出額外信息;簡化輸入信息的表達空間;算法簡單,易于操作。粗集處理的對象是類似二維關系表的信息表。
5、覆蓋正例排斥反例方法
它是利用覆蓋所有正例、排斥所有反例的思想來尋找規(guī)則。首先在正例集合中任選一個種子,到反例集合中逐個比較。與字段取值構成的選擇子相容則舍去,相反則保留。按此思想循環(huán)所有正例種子,將得到正例的規(guī)則(選擇子的合取式)。
6、統(tǒng)計分析方法
在數(shù)據(jù)庫字段項之間存在兩種關系:函數(shù)關系和相關關系,對它們的分析可采用統(tǒng)計學方法,即利用統(tǒng)計學原理對數(shù)據(jù)庫中的信息進行分析。可進行常用統(tǒng)計、回歸分析、相關分析、差異分析等。
7、模糊集方法
即利用模糊集合理論對實際問題進行模糊評判、模糊決策、模糊模式識別和模糊聚類分析。系統(tǒng)的復雜性越高,模糊性越強,一般模糊集合理論是用隸屬度來刻畫模糊事物的亦此亦彼性的。