資料介紹
基于KNN的話題跟蹤研究_李樹平
1 引言 在話題檢測與跟蹤研究中,話題跟蹤是它的一個(gè)子任務(wù),被 定義為在給定同一個(gè)話題的幾篇新聞報(bào)道的前提下檢測出該 話題的后繼新聞報(bào)道。從定義可以看出,話題跟蹤研究在本質(zhì)上 等價(jià)于一種受監(jiān)督的分類研究, 它的關(guān)鍵技術(shù)就是文本分類算 法,難點(diǎn)在于話題/報(bào)道表示模型。文本分類算法一般包括 KNN 算法,Rocchio 算法,支持向量機(jī)(SVM),簡單貝葉斯算法和決策樹 算法,其中最常用的是 KNN 算法。它也是目前分類效果最好且 應(yīng)用最廣泛的文本分類算法。 2 基于 KNN 的話題跟蹤系統(tǒng) 基于 KNN 的話題跟蹤系統(tǒng)由話題/報(bào)道表示模型,KNN 文 本分類方法和話題檢測與跟蹤評測方法三個(gè)模塊組成。 2.1 基于向量空間模型的話題/報(bào)道表示模型 話題/報(bào)道表示模型一般采用文本表示方法實(shí)現(xiàn),向量空間 模型由 Salton 教授于 1968 年提出的,是最簡便而又高效的文本 表示方法之一,在海量文本信息處理方面具有非常強(qiáng)的優(yōu)勢。因 此,本文采用向量空間模型實(shí)現(xiàn)話題/報(bào)道表示模型。在向量空 間模型實(shí)現(xiàn)話題/報(bào)道表示模型時(shí),存在高維特征空間問題,這個(gè) 問題可以通過特征選擇算法解決。
1 引言 在話題檢測與跟蹤研究中,話題跟蹤是它的一個(gè)子任務(wù),被 定義為在給定同一個(gè)話題的幾篇新聞報(bào)道的前提下檢測出該 話題的后繼新聞報(bào)道。從定義可以看出,話題跟蹤研究在本質(zhì)上 等價(jià)于一種受監(jiān)督的分類研究, 它的關(guān)鍵技術(shù)就是文本分類算 法,難點(diǎn)在于話題/報(bào)道表示模型。文本分類算法一般包括 KNN 算法,Rocchio 算法,支持向量機(jī)(SVM),簡單貝葉斯算法和決策樹 算法,其中最常用的是 KNN 算法。它也是目前分類效果最好且 應(yīng)用最廣泛的文本分類算法。 2 基于 KNN 的話題跟蹤系統(tǒng) 基于 KNN 的話題跟蹤系統(tǒng)由話題/報(bào)道表示模型,KNN 文 本分類方法和話題檢測與跟蹤評測方法三個(gè)模塊組成。 2.1 基于向量空間模型的話題/報(bào)道表示模型 話題/報(bào)道表示模型一般采用文本表示方法實(shí)現(xiàn),向量空間 模型由 Salton 教授于 1968 年提出的,是最簡便而又高效的文本 表示方法之一,在海量文本信息處理方面具有非常強(qiáng)的優(yōu)勢。因 此,本文采用向量空間模型實(shí)現(xiàn)話題/報(bào)道表示模型。在向量空 間模型實(shí)現(xiàn)話題/報(bào)道表示模型時(shí),存在高維特征空間問題,這個(gè) 問題可以通過特征選擇算法解決。
下載該資料的人也在下載
下載該資料的人還在閱讀
更多 >
- 3*4平腳 正按觸控開關(guān)原理圖 4次下載
- 基于KCF的目標(biāo)跟蹤算法研究及嵌入式系統(tǒng)實(shí)現(xiàn)
- 面向微博熱點(diǎn)話題的改進(jìn)BBTM模型 3次下載
- 可檢測網(wǎng)絡(luò)入侵的IL-SVM-KNN分類器 7次下載
- 一種基于KNN與矩陣變化的圖節(jié)點(diǎn)嵌入歸納式學(xué)習(xí)算法 15次下載
- 一種全新的多卷積層特征響應(yīng)跟蹤算法 11次下載
- 如何使用MATLAB進(jìn)行水準(zhǔn)網(wǎng)經(jīng)典平差系統(tǒng)的開發(fā)和應(yīng)用 16次下載
- 基于軟件的GPS信號捕獲跟蹤算法研究 11次下載
- 唇語識別中的話題相關(guān)語言模型研究_王淵 0次下載
- 數(shù)據(jù)挖掘在農(nóng)業(yè)話題跟蹤中的應(yīng)用張偉 0次下載
- 數(shù)據(jù)挖掘在英語語言學(xué)話題跟蹤評價(jià)體系中的應(yīng)用王雪 0次下載
- 非接觸式高精度鋼板在線測厚系統(tǒng)的研究_何平 0次下載
- 電流跟蹤型PWM逆變器的SVPWM控制策略研究 12次下載
- 基于一種優(yōu)化的KNN算法在室內(nèi)定位中的應(yīng)用研究 46次下載
- 基于Kalma濾波的反輻射導(dǎo)彈跟蹤噪聲源研究
- 視頻目標(biāo)跟蹤從0到1,概念與方法 412次閱讀
- 從人生、歷史到單片機(jī)的話題討論 590次閱讀
- 聊聊這個(gè)有趣的話題:分布式單體 413次閱讀
- 基于訓(xùn)練階段使用知識庫+KNN檢索相關(guān)信息輔助學(xué)習(xí)方法 1675次閱讀
- 最常見的目標(biāo)跟蹤算法 2787次閱讀
- 詳解機(jī)器學(xué)習(xí)分類算法KNN 6172次閱讀
- 聊聊關(guān)于架構(gòu)的話題 2255次閱讀
- 以一個(gè)真實(shí)網(wǎng)站的驗(yàn)證碼為例,實(shí)現(xiàn)了基于一下KNN的驗(yàn)證碼識別 7803次閱讀
- kNN算法是監(jiān)督學(xué)習(xí)中分類方法的一種 1.1w次閱讀
- 人工智能機(jī)器學(xué)習(xí)之K近鄰算法(KNN) 2882次閱讀
- 一文看懂平波電抗器原理及應(yīng)用 2.2w次閱讀
- 什么是平波電抗器_平波電抗器的分類 1w次閱讀
- 平波電抗器是干什么用的_平波電抗器計(jì)算公式 1.6w次閱讀
- ADI:將異構(gòu)制造的話題作為產(chǎn)業(yè)未來發(fā)展趨勢的一個(gè)重要觀察角度 5408次閱讀
- 目前嵌入式視覺領(lǐng)域最熱門的話題之一就是機(jī)器學(xué)習(xí) 1198次閱讀
下載排行
本周
- 1TC358743XBG評估板參考手冊
- 1.36 MB | 330次下載 | 免費(fèi)
- 2開關(guān)電源基礎(chǔ)知識
- 5.73 MB | 11次下載 | 免費(fèi)
- 3嵌入式linux-聊天程序設(shè)計(jì)
- 0.60 MB | 3次下載 | 免費(fèi)
- 4DIY動(dòng)手組裝LED電子顯示屏
- 0.98 MB | 3次下載 | 免費(fèi)
- 5基于FPGA的C8051F單片機(jī)開發(fā)板設(shè)計(jì)
- 0.70 MB | 2次下載 | 免費(fèi)
- 651單片機(jī)窗簾控制器仿真程序
- 1.93 MB | 2次下載 | 免費(fèi)
- 751單片機(jī)大棚環(huán)境控制器仿真程序
- 1.10 MB | 2次下載 | 免費(fèi)
- 8基于51單片機(jī)的RGB調(diào)色燈程序仿真
- 0.86 MB | 2次下載 | 免費(fèi)
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費(fèi)
- 2555集成電路應(yīng)用800例(新編版)
- 0.00 MB | 33566次下載 | 免費(fèi)
- 3接口電路圖大全
- 未知 | 30323次下載 | 免費(fèi)
- 4開關(guān)電源設(shè)計(jì)實(shí)例指南
- 未知 | 21549次下載 | 免費(fèi)
- 5電氣工程師手冊免費(fèi)下載(新編第二版pdf電子書)
- 0.00 MB | 15349次下載 | 免費(fèi)
- 6數(shù)字電路基礎(chǔ)pdf(下載)
- 未知 | 13750次下載 | 免費(fèi)
- 7電子制作實(shí)例集錦 下載
- 未知 | 8113次下載 | 免費(fèi)
- 8《LED驅(qū)動(dòng)電路設(shè)計(jì)》 溫德爾著
- 0.00 MB | 6656次下載 | 免費(fèi)
總榜
- 1matlab軟件下載入口
- 未知 | 935054次下載 | 免費(fèi)
- 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
- 78.1 MB | 537798次下載 | 免費(fèi)
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420027次下載 | 免費(fèi)
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費(fèi)
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費(fèi)
- 6電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191186次下載 | 免費(fèi)
- 7十天學(xué)會AVR單片機(jī)與C語言視頻教程 下載
- 158M | 183279次下載 | 免費(fèi)
- 8proe5.0野火版下載(中文版免費(fèi)下載)
- 未知 | 138040次下載 | 免費(fèi)
評論