1.語義特征
語義特征是以文字表達(dá)的非結(jié)構(gòu)化數(shù) 據(jù)特有的語義屬性。對(duì)于書籍、電影類,語義特征一般指作者的創(chuàng)作意圖、主題說明等。該屬性是非必備屬性。
2.基本屬性
基本屬性是非結(jié)構(gòu)化數(shù)據(jù)都具有的一般屬性,包括名稱、類型、創(chuàng)建者、創(chuàng)建時(shí)間等。
3.底層特征
底層特征是通過各種專用處理技術(shù)(如圖像、語音、視頻等處理技術(shù))獲得的非結(jié)構(gòu)化數(shù)據(jù)特性,如電話錄音的格式、時(shí)長(zhǎng)要求、比特率等相關(guān)技術(shù)屬性。
4.原始數(shù)據(jù)
原始數(shù)據(jù)是非結(jié)構(gòu)化數(shù)據(jù)的原生態(tài)文件。
四面體模型的特點(diǎn)在于語義特征與底層特征進(jìn)行一體化表達(dá)的集成性;圖像、文本、視頻、音頻等多種異構(gòu)數(shù)據(jù)表達(dá)的統(tǒng)一性;支持語義特征、底層特征動(dòng)態(tài)變化的可擴(kuò)展性和簡(jiǎn)單性。基于四面體模型構(gòu)建的非結(jié)構(gòu)化數(shù)據(jù)管理模型,將能夠?qū)崿F(xiàn)異構(gòu)數(shù)據(jù)進(jìn)行統(tǒng)一存儲(chǔ)與關(guān)聯(lián)操作,從而更好地支持大數(shù)據(jù)的深度處理。