碰碰干碰碰射,www.aa黄色

命名實(shí)體識(shí)別是NLP領(lǐng)域中的一項(xiàng)基礎(chǔ)任務(wù)，在文本搜索、文本推薦、知識(shí)圖譜構(gòu)建等領(lǐng)域都起著至關(guān)重要的作用，一直是熱點(diǎn)研究方向之一。多模態(tài)命名實(shí)體識(shí)別在傳統(tǒng)的命名實(shí)體識(shí)別基礎(chǔ)上額外引入了圖像，可以為文本補(bǔ)充語(yǔ)義信息來(lái)進(jìn)行消岐，近些年來(lái)受到人們廣泛的關(guān)注。

盡管當(dāng)前的多模態(tài)命名實(shí)體識(shí)別方法取得了成功，但仍然存在著兩個(gè)問(wèn)題：(1)當(dāng)前大部分方法基于注意力機(jī)制來(lái)進(jìn)行文本和圖像間的交互，但由于不同模態(tài)的表示來(lái)自于不同的編碼器，想要捕捉文本中token和圖像中區(qū)域之間的關(guān)系是困難的。如下圖所示，句子中的‘Rob’應(yīng)該和圖像中存在貓的區(qū)域(V5,V6,V9等)有著較高的相似度，但由于文本和圖像的表示并不一致，在通過(guò)點(diǎn)積等形式計(jì)算相似度時(shí)，‘Rob’可能會(huì)和其它區(qū)域有著較高的相似度得分。因此，表示的不一致會(huì)導(dǎo)致模態(tài)之間難以建立起較好的關(guān)系。

(2)當(dāng)前的方法認(rèn)為文本與其隨附的圖像是匹配的，并且可以幫助識(shí)別文本中的命名實(shí)體。然而，并不是所有的文本和圖像都是匹配的，模型考慮這種不匹配的圖像將會(huì)做出錯(cuò)誤的預(yù)測(cè)。如下圖所示，圖片中沒(méi)有任何與命名實(shí)體“Siri”相關(guān)的信息，如果模型考慮這張不匹配的圖像，便會(huì)受圖中“人物”的影響將“Siri”預(yù)測(cè)為PER(人)。而在只有文本的情況下，預(yù)訓(xùn)練模型(BERT等)通過(guò)預(yù)訓(xùn)練任務(wù)中學(xué)到的知識(shí)可以將“Siri”的類型預(yù)測(cè)為MISC(雜項(xiàng))。

為了解決上述存在的問(wèn)題，本文提出了MAF，一種通用匹配對(duì)齊框架(General Matching and Alignment Framework)，將文本和圖像的表示進(jìn)行對(duì)齊并通過(guò)圖文匹配的概率過(guò)濾圖像信息。由于該框架中的模塊是插件式的，其可以很容易地被拓展到其它多模態(tài)任務(wù)上。

本文研究成果已被WSDM2022接收，

整體框架

本文框架如下圖所示，由5個(gè)主要部分組成：

Input Representations

將原始的文本輸入轉(zhuǎn)為token序列的表示以及文本整體的表示，將原始的圖像輸入轉(zhuǎn)為圖像區(qū)域的表示以及圖像整體的表示。

Cross-Modal Alignment Module

接收文本整體的表示和圖像整體的表示作為輸入，通過(guò)對(duì)比學(xué)習(xí)將文本和圖像的表示變得更為一致。

Cross-Modal Interac tion Module

接收token序列的表示以及圖像區(qū)域的表示作為輸入，使用注意力機(jī)制建立起文本token和圖像區(qū)域之間的聯(lián)系得到文本增強(qiáng)后的圖像的表示。

Cross-Modal Matching Module

接收文本序列的表示和文本增強(qiáng)后的圖像的表示作為輸入，用于判斷文本和圖像匹配的概率，并用輸出的概率對(duì)圖像信息進(jìn)行過(guò)濾。

Cross-Modal Fusion Module

將文本token序列的表示和最終圖像的表示結(jié)合在一起輸入到CRF層進(jìn)行預(yù)測(cè)。

主要部分

Input Representations

實(shí)驗(yàn)

主要結(jié)果

本文的方法在Twitter-2015和Twitter-2017數(shù)據(jù)集上效果均優(yōu)于之前的方法。

運(yùn)行時(shí)間

本文的方法相比于之前的方法除了有著模態(tài)之間交互的模塊(本文中為CI)，還添加了對(duì)齊模態(tài)表示的CA以及判斷圖文是否匹配的CM，這可能會(huì)導(dǎo)致訓(xùn)練成本以及預(yù)測(cè)成本增加。但本文簡(jiǎn)化了模態(tài)之間交互的過(guò)程，因此整體訓(xùn)練和預(yù)測(cè)時(shí)間以及模型大小均由于之前的SOTA方法。

消融實(shí)驗(yàn)

本文進(jìn)行了消融實(shí)驗(yàn)，驗(yàn)證了CA和CM的有效性。

樣例分析

本文還進(jìn)行了樣例分析來(lái)更加直觀地展示CA和CM的有效性。

審核編輯：劉清

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴