一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

您好,歡迎來電子發(fā)燒友網(wǎng)! ,新用戶?[免費(fèi)注冊(cè)]

您的位置:電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

向量空間模型和算法步驟

大?。?/span>1.57 MB 人氣: 2017-11-10 需要積分:0

  隨著互聯(lián)網(wǎng)的迅速普及和發(fā)展,人們從萬維網(wǎng)上獲取信息的途徑和速度得到極大的拓展和提高,在獲得信息的同時(shí),對(duì)信息處理也提出了相應(yīng)的需求。目前,在信息的表示中,聲音、圖形、圖像、文本等類型眾多,但是文本仍然是這些類型中最主要的表示載體之一,在信息處理領(lǐng)域中,對(duì)于文本聚類、分類、查重等領(lǐng)域往往需要計(jì)算兩個(gè)文本之間的相似度,而且相似度計(jì)算往往是其他處理步驟的前提和基礎(chǔ),相似度的計(jì)算往往決定著后續(xù)處理過程的準(zhǔn)確性和有效性。

  文本相似度是衡量多個(gè)文本之間在表述內(nèi)容方相似程度的一個(gè)具體數(shù)值,這個(gè)數(shù)值越大表明互相比較的兩個(gè)文本之間在內(nèi)容方面交集越大,否則就表示相比較的文本之間在內(nèi)容上相互交集的內(nèi)容越少。相似度的計(jì)算目前已經(jīng)應(yīng)用到很多的領(lǐng)域,在機(jī)器翻譯領(lǐng)域需要通過文本相似度來選取平行語料、在信息檢索。領(lǐng)域需要通過文本相似度來擴(kuò)展或者縮減檢索的范圍,從而獲得用戶最希望得到的結(jié)果,自動(dòng)問答領(lǐng)域中往往需要問題自動(dòng)分類以及答案聚類,這些都需要進(jìn)行文本相似的計(jì)算,文本聚類和文本分類的核心問題就是將相似的對(duì)象歸為一類,所以文本相似度的計(jì)算是一個(gè)非常重要和非?;A(chǔ)而且關(guān)鍵的一個(gè)技術(shù)問題。
?

非常好我支持^.^

(0) 0%

不好我反對(duì)

(0) 0%

      發(fā)表評(píng)論

      用戶評(píng)論
      評(píng)價(jià):好評(píng)中評(píng)差評(píng)

      發(fā)表評(píng)論,獲取積分! 請(qǐng)遵守相關(guān)規(guī)定!

      ?