稀疏化非監(jiān)督分層概率自組織圖方法
大小:0.86 MB 人氣: 2017-12-21 需要積分:1
針對基于實例的遷移學習在關聯(lián)多源異構領域數(shù)據(jù)時遇到的數(shù)據(jù)顆粒度不匹配問題,以單領域分層概率自組織圖( HiPSOC)聚類方法為基礎,提出一種具有遷移學習能力的稀疏化非監(jiān)督分層概率自組織圖(TSHiPSOC)方法。首先,在源領域和目標領域分別基于概率混合多變量高斯分布生成分層自組織模型以便在多領域中分別提取不同粒度的表示向量,并用稀疏圖方法通過概率準則控制模型增長;其次,利用最大信息系數(shù)( MIC),在具有富信息的源領域中尋找與目標領域表示向量最相似的表示向量,并利用這些源領域表示向量的類別標簽細化目標領域數(shù)據(jù)分類;最后,在國際通用分類數(shù)據(jù)集20新聞組數(shù)據(jù)集和垃圾郵件檢測數(shù)據(jù)集上進行了實驗,結果表明算法可以利用源領域的有用信息輔助目標領域的分類問題,并使分類準確率最高提高約15. 26%和9.05%;對比其他經(jīng)典遷移學習方法,通過稀疏分層可以挖掘不同顆粒度的表示向量,分類準確率最高提高約4. 48%和4.13%。
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%