基于檢索結(jié)果排序的偽相關(guān)反饋
推薦 + 挑錯(cuò) + 收藏(0) + 用戶評(píng)論(0)
隨著Web的普及,越來(lái)越多的用戶希望從互聯(lián)網(wǎng)上獲取信息。對(duì)于目前主流的基于關(guān)鍵詞的搜索方式,用戶必須通過(guò)構(gòu)造有限的查詢?cè)~來(lái)表達(dá)信息需求( information need)。Carpineto等在查詢擴(kuò)展綜述中明確指出,大多數(shù)用戶喜歡構(gòu)造短查詢交給搜索引擎,且構(gòu)造的查詢?cè)~多以1-3個(gè)詞居多;并且用戶的查詢構(gòu)造本身就是一個(gè)抽象的過(guò)程,查詢構(gòu)造結(jié)果具有模糊性、不確定性和描述的多樣性。在這種情況下,由于缺乏上下文語(yǔ)境,搜索引擎很難完全理解用戶的查詢意圖,返回的結(jié)果中經(jīng)常會(huì)包含大量無(wú)關(guān)或相似的文檔。特別是當(dāng)查詢?cè)~出現(xiàn)歧義時(shí),返回的文檔集會(huì)偏向于某一個(gè)主題,而該主題往往并不是用戶潛在查詢意圖。如果搜索引擎能夠?qū)⑴c用戶初始查詢構(gòu)造相關(guān)的信息全部返回給用戶,那么,用戶就可以在多個(gè)不同查詢結(jié)果中找到自己最想要的結(jié)果。
針對(duì)傳統(tǒng)偽相關(guān)反饋(PRF)算法擴(kuò)展源質(zhì)量不高使得檢索效果不佳的問(wèn)題,提出一種基于檢索結(jié)果的排序模型( REM)。首先,該模型從初檢結(jié)果中選擇排名靠前的文檔怍為偽相關(guān)文檔集;然后,以用戶查詢意圖與偽相關(guān)文檔集中各文檔的相關(guān)度最大化、并且各文檔之間相似性最小化作為排序原則,將偽相關(guān)文檔集中各文檔進(jìn)行重排序;最后,將排序后排名靠前的文檔作為擴(kuò)展源進(jìn)行二次反饋。實(shí)驗(yàn)結(jié)果表明,與兩種傳統(tǒng)偽反饋方法相比,該排序模型能獲得與用戶查詢意圖相關(guān)的反饋文檔,可有效地提高檢索效果。
非常好我支持^.^
(0) 0%
不好我反對(duì)
(0) 0%
下載地址
基于檢索結(jié)果排序的偽相關(guān)反饋下載
相關(guān)電子資料下載
- 手把手教你排序算法怎么寫 437
- FPGA實(shí)現(xiàn)雙調(diào)排序方法詳解 195
- 用FPGA實(shí)現(xiàn)雙調(diào)排序的方法(2) 427
- FPGA實(shí)現(xiàn)雙調(diào)排序算法的探索與實(shí)踐 205
- 想聽(tīng)聽(tīng)48和大對(duì)數(shù)光纜的排序? 211
- C語(yǔ)言實(shí)現(xiàn)經(jīng)典排序算法概覽 298
- 十大排序算法總結(jié) 830
- 時(shí)間復(fù)雜度為O (nlogn)的排序算法簡(jiǎn)述 378
- 數(shù)據(jù)結(jié)構(gòu):?jiǎn)捂湵淼呐判?/a> 600
- python中如何交換兩個(gè)數(shù)的值相加 460