一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

您好,歡迎來(lái)電子發(fā)燒友網(wǎng)! ,新用戶(hù)?[免費(fèi)注冊(cè)]

您的位置:電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

基于隱含狄列克雷分配LDA分類(lèi)特征擴(kuò)展的廣告過(guò)濾方法

大?。?/span>0.82 MB 人氣: 2017-12-14 需要積分:1

  傳統(tǒng)的微博廣告過(guò)濾方法忽略了微博廣告文本的數(shù)據(jù)稀疏性、語(yǔ)義信息和廣告背景領(lǐng)域特征等因素的影響。針對(duì)這些問(wèn)題,提出一種基于隱含狄列克雷分配( LDA)分類(lèi)特征擴(kuò)展的廣告過(guò)濾方法。首先,將微博分為正常微博和廣告型微博,并分別構(gòu)建LDA主題模型預(yù)測(cè)短文本對(duì)應(yīng)的主題分布,將主題中的詞作為特征擴(kuò)展的基礎(chǔ);其次,在特征擴(kuò)展時(shí)結(jié)合文本類(lèi)別信息提取背景領(lǐng)域特征,以降低其對(duì)文本分類(lèi)的影響;最后,將擴(kuò)展后的特征向量作為分類(lèi)器的輸入,根據(jù)支持向量機(jī)(SVM)的分類(lèi)結(jié)果過(guò)濾廣告。實(shí)驗(yàn)結(jié)果表明,與現(xiàn)有的僅基于短文本分類(lèi)的過(guò)濾方法相比,其準(zhǔn)確率平均提升4個(gè)百分點(diǎn)。因此,該方法能有效擴(kuò)展文本特征,并降低背景領(lǐng)域特征的影響,更適用于數(shù)據(jù)量較大的微博廣告過(guò)濾。

非常好我支持^.^

(0) 0%

不好我反對(duì)

(0) 0%

      發(fā)表評(píng)論

      用戶(hù)評(píng)論
      評(píng)價(jià):好評(píng)中評(píng)差評(píng)

      發(fā)表評(píng)論,獲取積分! 請(qǐng)遵守相關(guān)規(guī)定!

      ?