結(jié)合詞向量和聚類(lèi)算法的話題演進(jìn)分析
大?。?/span>0.74 MB 人氣: 2017-11-24 需要積分:0
推薦 + 挑錯(cuò) + 收藏(0) + 用戶(hù)評(píng)論(0)
標(biāo)簽:聚類(lèi)算法(12092)
話題演進(jìn)分析主要是挖掘話題內(nèi)容隨著時(shí)間流的演進(jìn)情況。話題的內(nèi)容可用關(guān)鍵詞來(lái)表示。利用word2vec對(duì)75萬(wàn)篇新聞和微博文本進(jìn)行訓(xùn)練,得到詞向量模型。將文本流處理后輸入模型,獲得時(shí)間序列下所有詞匯的詞向量,利用K-means對(duì)詞向量進(jìn)行聚類(lèi),從而實(shí)現(xiàn)話題關(guān)鍵詞的抽取。實(shí)驗(yàn)對(duì)比了基于PLSA和LDA主題模型下的話題抽取效果,發(fā)現(xiàn)本文的話題分析效果優(yōu)于主題模型的方法。同時(shí),采集足夠大量、內(nèi)容足夠豐富的語(yǔ)料,可訓(xùn)練得到泛化能力比較強(qiáng)的模型,有利于實(shí)時(shí)話題演進(jìn)分析研究工作。
非常好我支持^.^
(0) 0%
不好我反對(duì)
(0) 0%
下載地址
結(jié)合詞向量和聚類(lèi)算法的話題演進(jìn)分析下載
相關(guān)電子資料下載
- 基于K-means聚類(lèi)算法的圖像分割 1113
- 介紹一種基于最小化平方誤差的聚類(lèi)算法 498
- 如何在 Python 中安裝和使用頂級(jí)聚類(lèi)算法 415
- 10種聚類(lèi)算法和Python代碼4 1118
- 10種聚類(lèi)算法和Python代碼3 960
- 10種聚類(lèi)算法和Python代碼2 796
- 10種聚類(lèi)算法和Python代碼1 644
- YOLOv5中的autoanchor.py代碼解析 1242
- 視覺(jué)新范式!COCs:將圖像視為點(diǎn)集 636
- 10種頂流聚類(lèi)算法Python實(shí)現(xiàn)(附完整代碼) 989