資料介紹
基于KNN的話題跟蹤研究_李樹平
1 引言 在話題檢測與跟蹤研究中,話題跟蹤是它的一個子任務(wù),被 定義為在給定同一個話題的幾篇新聞報道的前提下檢測出該 話題的后繼新聞報道。從定義可以看出,話題跟蹤研究在本質(zhì)上 等價于一種受監(jiān)督的分類研究, 它的關(guān)鍵技術(shù)就是文本分類算 法,難點在于話題/報道表示模型。文本分類算法一般包括 KNN 算法,Rocchio 算法,支持向量機(jī)(SVM),簡單貝葉斯算法和決策樹 算法,其中最常用的是 KNN 算法。它也是目前分類效果最好且 應(yīng)用最廣泛的文本分類算法。 2 基于 KNN 的話題跟蹤系統(tǒng) 基于 KNN 的話題跟蹤系統(tǒng)由話題/報道表示模型,KNN 文 本分類方法和話題檢測與跟蹤評測方法三個模塊組成。 2.1 基于向量空間模型的話題/報道表示模型 話題/報道表示模型一般采用文本表示方法實現(xiàn),向量空間 模型由 Salton 教授于 1968 年提出的,是最簡便而又高效的文本 表示方法之一,在海量文本信息處理方面具有非常強(qiáng)的優(yōu)勢。因 此,本文采用向量空間模型實現(xiàn)話題/報道表示模型。在向量空 間模型實現(xiàn)話題/報道表示模型時,存在高維特征空間問題,這個 問題可以通過特征選擇算法解決。
1 引言 在話題檢測與跟蹤研究中,話題跟蹤是它的一個子任務(wù),被 定義為在給定同一個話題的幾篇新聞報道的前提下檢測出該 話題的后繼新聞報道。從定義可以看出,話題跟蹤研究在本質(zhì)上 等價于一種受監(jiān)督的分類研究, 它的關(guān)鍵技術(shù)就是文本分類算 法,難點在于話題/報道表示模型。文本分類算法一般包括 KNN 算法,Rocchio 算法,支持向量機(jī)(SVM),簡單貝葉斯算法和決策樹 算法,其中最常用的是 KNN 算法。它也是目前分類效果最好且 應(yīng)用最廣泛的文本分類算法。 2 基于 KNN 的話題跟蹤系統(tǒng) 基于 KNN 的話題跟蹤系統(tǒng)由話題/報道表示模型,KNN 文 本分類方法和話題檢測與跟蹤評測方法三個模塊組成。 2.1 基于向量空間模型的話題/報道表示模型 話題/報道表示模型一般采用文本表示方法實現(xiàn),向量空間 模型由 Salton 教授于 1968 年提出的,是最簡便而又高效的文本 表示方法之一,在海量文本信息處理方面具有非常強(qiáng)的優(yōu)勢。因 此,本文采用向量空間模型實現(xiàn)話題/報道表示模型。在向量空 間模型實現(xiàn)話題/報道表示模型時,存在高維特征空間問題,這個 問題可以通過特征選擇算法解決。
下載該資料的人也在下載
下載該資料的人還在閱讀
更多 >
- 3*4平腳 正按觸控開關(guān)原理圖 4次下載
- 基于KCF的目標(biāo)跟蹤算法研究及嵌入式系統(tǒng)實現(xiàn)
- 面向微博熱點話題的改進(jìn)BBTM模型 3次下載
- 可檢測網(wǎng)絡(luò)入侵的IL-SVM-KNN分類器 7次下載
- 一種基于KNN與矩陣變化的圖節(jié)點嵌入歸納式學(xué)習(xí)算法 15次下載
- 一種全新的多卷積層特征響應(yīng)跟蹤算法 11次下載
- 如何使用MATLAB進(jìn)行水準(zhǔn)網(wǎng)經(jīng)典平差系統(tǒng)的開發(fā)和應(yīng)用 16次下載
- 基于軟件的GPS信號捕獲跟蹤算法研究 11次下載
- 唇語識別中的話題相關(guān)語言模型研究_王淵 0次下載
- 數(shù)據(jù)挖掘在農(nóng)業(yè)話題跟蹤中的應(yīng)用張偉 0次下載
- 數(shù)據(jù)挖掘在英語語言學(xué)話題跟蹤評價體系中的應(yīng)用王雪 0次下載
- 非接觸式高精度鋼板在線測厚系統(tǒng)的研究_何平 0次下載
- 電流跟蹤型PWM逆變器的SVPWM控制策略研究 12次下載
- 基于一種優(yōu)化的KNN算法在室內(nèi)定位中的應(yīng)用研究 46次下載
- 基于Kalma濾波的反輻射導(dǎo)彈跟蹤噪聲源研究
- 視頻目標(biāo)跟蹤從0到1,概念與方法 412次閱讀
- 從人生、歷史到單片機(jī)的話題討論 590次閱讀
- 聊聊這個有趣的話題:分布式單體 413次閱讀
- 基于訓(xùn)練階段使用知識庫+KNN檢索相關(guān)信息輔助學(xué)習(xí)方法 1675次閱讀
- 最常見的目標(biāo)跟蹤算法 2787次閱讀
- 詳解機(jī)器學(xué)習(xí)分類算法KNN 6172次閱讀
- 聊聊關(guān)于架構(gòu)的話題 2255次閱讀
- 以一個真實網(wǎng)站的驗證碼為例,實現(xiàn)了基于一下KNN的驗證碼識別 7803次閱讀
- kNN算法是監(jiān)督學(xué)習(xí)中分類方法的一種 1.1w次閱讀
- 人工智能機(jī)器學(xué)習(xí)之K近鄰算法(KNN) 2882次閱讀
- 一文看懂平波電抗器原理及應(yīng)用 2.2w次閱讀
- 什么是平波電抗器_平波電抗器的分類 1w次閱讀
- 平波電抗器是干什么用的_平波電抗器計算公式 1.6w次閱讀
- ADI:將異構(gòu)制造的話題作為產(chǎn)業(yè)未來發(fā)展趨勢的一個重要觀察角度 5408次閱讀
- 目前嵌入式視覺領(lǐng)域最熱門的話題之一就是機(jī)器學(xué)習(xí) 1198次閱讀
下載排行
本周
- 1貼片三極管上的印字與真實名稱的對照表詳細(xì)說明
- 0.50 MB | 87次下載 | 1 積分
- 2802.11_Wireless_Networks
- 4.17 MB | 12次下載 | 免費(fèi)
- 33D AD庫文件
- 16.96 MB | 2次下載 | 免費(fèi)
- 4BDR6121G直流電機(jī)驅(qū)動芯片中文手冊
- 0.54 MB | 1次下載 | 免費(fèi)
- 5ANT8817 1%3.5W/3.7V,同步自適應(yīng)升壓,超長續(xù)航,H類防破音單聲道音頻功放中文手冊
- 1.11 MB | 1次下載 | 免費(fèi)
- 610K-100K B3950-B3435NTC熱敏電阻快速查詢對照表
- 0.10 MB | 1次下載 | 1 積分
- 7ANT8825S內(nèi)置同步升壓,防破音,AB/D類雙模立體聲音頻功放中文手冊
- 1.29 MB | 次下載 | 免費(fèi)
- 8ANT3270 2×75W/2×38W+75W,免電感,低EMI,D類音頻功率放大器中文手冊
- 1.33 MB | 次下載 | 免費(fèi)
本月
- 1AI智能眼鏡產(chǎn)業(yè)鏈分析
- 4.43 MB | 311次下載 | 免費(fèi)
- 2蘇泊爾電磁爐線路的電路原理圖資料合集
- 2.02 MB | 286次下載 | 5 積分
- 3長虹液晶電視R-HS310B-5HF01的電源板電路原理圖
- 0.46 MB | 87次下載 | 5 積分
- 4貼片三極管上的印字與真實名稱的對照表詳細(xì)說明
- 0.50 MB | 87次下載 | 1 積分
- 5U盤一鍵制作
- 23.84 MB | 41次下載 | 免費(fèi)
- 6AO4803A雙P通道增強(qiáng)型場效應(yīng)晶體管的數(shù)據(jù)手冊
- 0.11 MB | 28次下載 | 2 積分
- 7長虹液晶彩電LS29機(jī)芯的技術(shù)資料說明
- 3.42 MB | 16次下載 | 2 積分
- 8802.11_Wireless_Networks
- 4.17 MB | 12次下載 | 免費(fèi)
總榜
- 1matlab軟件下載入口
- 未知 | 935127次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計
- 1.48MB | 420064次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233089次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191387次下載 | 10 積分
- 5十天學(xué)會AVR單片機(jī)與C語言視頻教程 下載
- 158M | 183342次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81586次下載 | 10 積分
- 7Keil工具M(jìn)DK-Arm免費(fèi)下載
- 0.02 MB | 73815次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65988次下載 | 10 積分
評論