不確定數(shù)據(jù)頻繁閉項集挖掘算法
大?。?/span>0.57 MB 人氣: 2018-01-02 需要積分:2
標簽:挖掘算法(7653)
由于不確定數(shù)據(jù)的向下封閉屬性,挖掘全部頻繁項集的方法會得到一個指數(shù)級的結(jié)果。為獲得一個較小的合適的結(jié)果集,研究了在不確定數(shù)據(jù)上挖掘頻繁閉項集,并提出了一種新的頻繁閉項集挖掘算法-NA-PFCIM。該算法將項集挖掘過程看作一個概率分布函數(shù),考慮到基于正態(tài)分布模型的方法提取的頻繁項集精確度較高,而且支持大型數(shù)據(jù)庫,采用了正態(tài)分布模型提取頻繁項集。同時,為了減少搜索空間以及避免冗余計算,利用基于深度優(yōu)先搜索的策略來獲得所有的概率頻繁閉項集。該算法還設(shè)計了兩個剪枝策略:超集修剪和子集修剪。最后,在常用的數(shù)據(jù)集( T1014DIOOK、Accidents、Mushroom、Chess)上,將提出的NA-PFCIM算法和基于泊松分布的A-PFCIM算法進行比較。實驗結(jié)果表明,NA-PFCIM算法能夠減少所要擴展的項集,同時減少項集頻繁概率的計算,其性能優(yōu)于對比算法。
?
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%