一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

您好,歡迎來(lái)電子發(fā)燒友網(wǎng)! ,新用戶(hù)?[免費(fèi)注冊(cè)]

您的位置:電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

結(jié)合詞向量和聚類(lèi)算法的話題演進(jìn)分析

大?。?/span>0.74 MB 人氣: 2017-11-24 需要積分:0

  話題演進(jìn)分析主要是挖掘話題內(nèi)容隨著時(shí)間流的演進(jìn)情況。話題的內(nèi)容可用關(guān)鍵詞來(lái)表示。利用word2vec對(duì)75萬(wàn)篇新聞和微博文本進(jìn)行訓(xùn)練,得到詞向量模型。將文本流處理后輸入模型,獲得時(shí)間序列下所有詞匯的詞向量,利用K-means對(duì)詞向量進(jìn)行聚類(lèi),從而實(shí)現(xiàn)話題關(guān)鍵詞的抽取。實(shí)驗(yàn)對(duì)比了基于PLSA和LDA主題模型下的話題抽取效果,發(fā)現(xiàn)本文的話題分析效果優(yōu)于主題模型的方法。同時(shí),采集足夠大量、內(nèi)容足夠豐富的語(yǔ)料,可訓(xùn)練得到泛化能力比較強(qiáng)的模型,有利于實(shí)時(shí)話題演進(jìn)分析研究工作。

非常好我支持^.^

(0) 0%

不好我反對(duì)

(0) 0%

      發(fā)表評(píng)論

      用戶(hù)評(píng)論
      評(píng)價(jià):好評(píng)中評(píng)差評(píng)

      發(fā)表評(píng)論,獲取積分! 請(qǐng)遵守相關(guān)規(guī)定!

      ?