大數(shù)據(jù)挖掘的技術(shù)及方法包括但不限于以下幾種:
1、回歸分析:反映事務(wù)數(shù)據(jù)庫中屬性值在時(shí)間上的特征,可生成映射數(shù)據(jù)項(xiàng)到實(shí)值預(yù)測(cè)變量的函數(shù),研究問題包括數(shù)據(jù)序列的趨勢(shì)特征、數(shù)據(jù)序列的預(yù)測(cè)以及數(shù)據(jù)間的相關(guān)關(guān)系等。回歸分析可以應(yīng)用到市場(chǎng)營銷的各個(gè)方面,如客戶尋求、保持和預(yù)防客戶流失活動(dòng)、產(chǎn)品生命周期分析、銷售趨勢(shì)預(yù)測(cè)及有針對(duì)性的促銷活動(dòng)等。
2、聚類:把一組數(shù)據(jù)按照相似性和差異性分為幾個(gè)類別,目的是使得屬于同一類別的數(shù)據(jù)間的相似性盡可能大,不同類別中的數(shù)據(jù)間的相似性盡可能小。聚類分析可以應(yīng)用到客戶群體的分類、客戶背景分析、客戶購買趨勢(shì)預(yù)測(cè)、市場(chǎng)的細(xì)分等。
3、關(guān)聯(lián)規(guī)則:描述數(shù)據(jù)庫中數(shù)據(jù)項(xiàng)之間所存在的關(guān)系的規(guī)則,即根據(jù)一個(gè)事務(wù)中某些項(xiàng)的出現(xiàn)可導(dǎo)出另一些項(xiàng)在同一事務(wù)中也出現(xiàn),即隱藏在數(shù)據(jù)間的關(guān)聯(lián)或相互關(guān)系。關(guān)聯(lián)規(guī)則挖掘技術(shù)能對(duì)數(shù)據(jù)與數(shù)據(jù)之間的依賴關(guān)系進(jìn)行準(zhǔn)確描述,可以對(duì)給定事物數(shù)據(jù)庫進(jìn)行深入分析,尋找各數(shù)據(jù)和項(xiàng)目之間的內(nèi)在聯(lián)系,然后將所有符合支持度和置信度的,符合一定標(biāo)準(zhǔn)的關(guān)聯(lián)規(guī)則進(jìn)行羅列。
4、神經(jīng)網(wǎng)絡(luò):一種模擬人腦信息處理機(jī)制的機(jī)器學(xué)習(xí)算法。通過對(duì)數(shù)值數(shù)據(jù)進(jìn)行處理,并在處理過程中表現(xiàn)出一種思維、學(xué)習(xí)和記憶能力。
5、統(tǒng)計(jì)學(xué)習(xí):一種預(yù)測(cè)方法,需要對(duì)數(shù)據(jù)進(jìn)行深入分析,找出不能通過的規(guī)律,然后對(duì)所發(fā)現(xiàn)的規(guī)律進(jìn)一步研究和分析,并結(jié)合實(shí)際情況對(duì)數(shù)據(jù)發(fā)展趨勢(shì)進(jìn)行預(yù)測(cè)。
大數(shù)據(jù)挖掘的方法有很多,每一種方法都有其特定的使用場(chǎng)景和優(yōu)勢(shì)。在實(shí)際應(yīng)用中,需要根據(jù)具體的數(shù)據(jù)類型和問題來選擇合適的方法。