一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

您好,歡迎來電子發(fā)燒友網(wǎng)! ,新用戶?[免費注冊]

您的位置:電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

怎樣讓聊天機器人讀懂對話歷史

大?。?/span>0.3 MB 人氣: 2017-09-29 需要積分:1

  人工智能現(xiàn)在的火熱程度大家有目共睹,凱文凱利在《必然》中預(yù)測未來時代的人工智能可能會重新定義人類的意義,但時下的人工智能發(fā)展水平顯然還沒有大家想象得那么美好,仍然需要我們不斷地探索。目前眾多研究人員正深耕其中,作為其中代表的聊天機器人(Chatbot),已然成為科研界研究的熱點。

  通常來說聊天機器人實現(xiàn)方式有兩種:一種是基于生成式,即機器人“自己說話”,一個字一個字創(chuàng)作出回復(fù)語句來。另外一種是基于檢索式,即機器人“轉(zhuǎn)發(fā)”別人的話。從互聯(lián)網(wǎng)大家的話語中尋找到合適的回答予以轉(zhuǎn)發(fā)。

  現(xiàn)有的生成結(jié)果由于技術(shù)所限,或多或少都存在語句不流暢的問題,但能夠做到“有問必答”偶爾還能蹦出“彩蛋”。檢索的模型一般流暢性方面無須擔(dān)心,不過隨著目前網(wǎng)絡(luò)資源的日益豐富,語料規(guī)模也越來越大,如何從眾多語句中選擇合適的句子作為回復(fù)是檢索式聊天機器人的核心問題。

  雖然目前市場上的聊天機器人眾多,但我們見到的那些貌似都不是那么聰明。最直觀的一個體現(xiàn)就是前后不連貫,上下難銜接,因此在進行檢索的時候考慮歷史信息則顯得尤為重要。那么如何讓機器人理解對話歷史信息從而聰明地進行回復(fù)呢?微軟亞洲研究院的研究員們提出了一個模型Sequential Matching Network(SMN)。相關(guān)論文的作者吳俁談到“SMN模型可以讓聊天機器人準(zhǔn)確的理解當(dāng)前和用戶的對話歷史,并根據(jù)歷史給出最相關(guān)的回復(fù),與用戶進行交流,達到人機對話的目的?!?/p>

  但這在實現(xiàn)的過程中也遇到不少難點,“精準(zhǔn)計算聊天歷史和候選回復(fù)的語義相似度十分困難,主要的挑戰(zhàn)有兩個方面:

  由于聊天歷史信息繁多,如何將歷史中重要的詞語、短語以及句子選擇出來,并通過這些重要部分刻畫聊天歷史,是一個亟待解決的問題;

  如何對聊天歷史中的各輪對話進行建模,如何判斷對話歷史中的跳轉(zhuǎn),順承等關(guān)系,也是一個棘手的問題?!?那么論文作者提出的SMN模型又是如何解決這兩個問題的呢,接下來我們將為您解讀。

  怎樣讓聊天機器人讀懂對話歷史

  圖1:SMN網(wǎng)絡(luò)架構(gòu)

  SMN模型一共分為三層。第一層為信息匹配層,對之前的歷史信息和待回復(fù)的句子進行匹配度計算:同時進行詞語(embedding向量)和短語級別(GRU表示)的相似度計算。然后再把這兩個矩陣分別作為卷積神經(jīng)網(wǎng)絡(luò)的一個channel,利用CNN的max-pooling進行特征抽象,形成一個匹配向量。第二層為匹配積累層,利用一個GRU神經(jīng)網(wǎng)絡(luò),將每一句話和回復(fù)所計算出的匹配信息進一步融合。第三層為匹配結(jié)果預(yù)測層,利用融合的匹配信息計算最終的匹配得分,在預(yù)測時他們使用三種策略,分別是只利用GRU2最后一個隱藏層(SMN_last),靜態(tài)加權(quán)隱藏層(SMN_static),和動態(tài)加權(quán)隱藏層(SMN_dynamic)。在進行檢索的時候,他們將最后一句的信息結(jié)合上文歷史信息中的5個關(guān)鍵詞(歷史信息中用tf-idf進行篩選,選擇Top5關(guān)鍵詞)在系統(tǒng)中進行檢索,然后用上述SMN網(wǎng)絡(luò)對候選結(jié)果打分從而選出回復(fù)句。

  作者分別在Ubuntu語料(大型公開計算機相關(guān)求助與解答語料)和豆瓣語料(作者從豆瓣小組的公開信息中爬取并在論文中公布)上進行了實驗,分別以Rn@K和MAP、MRR、P@1為評價指標(biāo),取得的結(jié)果均為目前最好。

  作者表示“SMN不同以往的模型,第一步不進行上下文的建模學(xué)習(xí),而是讓每句話和回復(fù)進行匹配度計算,這樣可以盡可能多的保留上下文的信息,以避免重要信息在學(xué)習(xí)上下文的向量表示時丟失。而且SMN在對上下文句子關(guān)系建模時,考慮了當(dāng)前回復(fù)的影響,使得回復(fù)成為一個監(jiān)督信號,這樣可以更準(zhǔn)確的對上下文歷史進行建模?!辈⑶覅莻R向我們透露“據(jù)我們所知,我們公布的豆瓣語料是第一個人工標(biāo)注的中文多輪對話語料?!?/p>

  在談及目前的方法還有哪些不足之處時,作者表示“目前我們的檢索方式有時找不到正確的候選句,所以第一步的檢索方法還有待改善,另外雖然我們的模型可以建模當(dāng)前回復(fù)和歷史信息的關(guān)系,但還是無法避免一些邏輯上的問題,不過這也是我們未來工作的重點,我們將繼續(xù)提高候選回復(fù)在邏輯上的連貫性”,讓我們共同期待他們的未來工作。

非常好我支持^.^

(0) 0%

不好我反對

(0) 0%

      發(fā)表評論

      用戶評論
      評價:好評中評差評

      發(fā)表評論,獲取積分! 請遵守相關(guān)規(guī)定!

      ?