一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一種全新易用的基于Word-Word關(guān)系的NER統(tǒng)一模型

深度學(xué)習(xí)自然語言處理 ? 來源:深度學(xué)習(xí)自然語言處理 ? 作者:深度學(xué)習(xí)自然語言 ? 2022-03-23 13:37 ? 次閱讀

總體說一下

NER任務(wù)大概分為三種:flat, overlapped, and discontinuousNER,如下圖所示:

aching in legs 為flat NER

aching in shoulders為discontinuous NER

aching in legs和achingin shoulders這兩個(gè)實(shí)體共同重復(fù)了aching in,為overlapped NER

d4b71bb6-965e-11ec-952b-dac502259ad0.png

最近的研究都在考慮如何通過一個(gè)大一統(tǒng)模型一次性解決這三種問題。目前的最佳的方法基本都是基于span-based和seq2seq的,然而span-based方法主要傾向于通過枚舉所有span組合來解決邊界問題,時(shí)間復(fù)雜度上是個(gè)問題;而后者大家都知道,存在錯(cuò)誤傳播。 所以,本文提出了一種新穎的方式和框架來解決所有的NER問題:通過預(yù)測(cè)word-word之間的關(guān)系(這里稱之為W2NER)。其中word與word之間的關(guān)系主要有三種:

NNW: Next-Neighboring-Word,預(yù)測(cè)與后面詞的關(guān)系

THW-*: Tail-Head-Word-* ,預(yù)測(cè)與前面詞的關(guān)系,其中*表示具體關(guān)系(ORG、PER等)

NONE:表示沒有關(guān)系

其中,本文采用一個(gè)多粒度2D圖來表示word之間的關(guān)系,如下圖,其中為了解決圖的稀疏性,而將這兩種關(guān)系放到一個(gè)圖里,一個(gè)在右上角,一個(gè)在左下角。

d4c5f730-965e-11ec-952b-dac502259ad0.png

最終在14個(gè)公開數(shù)據(jù)集(包含中文和英文)上做了大量實(shí)驗(yàn),并都取得了最佳值,也成為了最新的SoTA。

模型

d4db75e2-965e-11ec-952b-dac502259ad0.png

一下子看,感覺模型想是一堆模塊堆積而成,其實(shí)細(xì)讀論文會(huì)發(fā)現(xiàn)這些模型都是由NER的前人經(jīng)驗(yàn)而來,有理有據(jù)。 具體來看,大概分為三個(gè)模塊: Encoder Layer通過BERT獲取表示信息,然后通過LSTM獲取上下文信息。 Convolution Layer這里有一個(gè)CLN(Conditional Layer Normalization)層,主要用來獲得word j在word i前提下的表示:

d4f25596-965e-11ec-952b-dac502259ad0.png

d507a27a-965e-11ec-952b-dac502259ad0.pngd51d7226-965e-11ec-952b-dac502259ad0.png

d531eaee-965e-11ec-952b-dac502259ad0.png

然后是BERT-Style Grid Representation層,這里主要是模型BERT的3個(gè)embedding層而來,這里的三個(gè)表示層為信息表示、關(guān)系位置信息表示和位置域表示組成,通過MLP融合到一起。 然后通過多粒度的空洞卷積(Multi-Granularity Dilated Convolution)采樣不同的信息。 Co-Predictor Layer這里用了一個(gè)普通的MLP和一個(gè)專門用于變長(zhǎng)標(biāo)簽預(yù)測(cè)的biaffine預(yù)測(cè):

d543fc2a-965e-11ec-952b-dac502259ad0.png

d553a832-965e-11ec-952b-dac502259ad0.png ? 最后過一個(gè)softmax層: d567e6e4-965e-11ec-952b-dac502259ad0.png ? 最后是一個(gè)Decoder層,這里主要就是通過NNW和HTW-*構(gòu)成一個(gè)環(huán)的部分就是一個(gè)實(shí)體,比如下面這個(gè)例子就解釋了所有情況: ?

d57ded72-965e-11ec-952b-dac502259ad0.png

損失的話,就簡(jiǎn)單了:

d591a092-965e-11ec-952b-dac502259ad0.png

實(shí)驗(yàn)

英文flat數(shù)據(jù)集:

d5a0b190-965e-11ec-952b-dac502259ad0.png

中文flat數(shù)據(jù)集:

d5b734ec-965e-11ec-952b-dac502259ad0.png

英文overlapped數(shù)據(jù)集:

d5ca541e-965e-11ec-952b-dac502259ad0.png

中文overlapped數(shù)據(jù)集,F(xiàn)1性能:

d5e4260a-965e-11ec-952b-dac502259ad0.png

英文discontinuous數(shù)據(jù)集:

d5f2ed16-965e-11ec-952b-dac502259ad0.png

和前沿最佳論文作對(duì)比:

d60f9934-965e-11ec-952b-dac502259ad0.png

消融實(shí)驗(yàn),F(xiàn)1性能:

d62d0122-965e-11ec-952b-dac502259ad0.png

訓(xùn)練速度和推理速度都得到了極大提升:

d643e432-965e-11ec-952b-dac502259ad0.png

這篇文章還是非常不錯(cuò)的,是一個(gè)簡(jiǎn)單有效的NER新框架,可以較為輕松的應(yīng)用于線下。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • word
    +關(guān)注

    關(guān)注

    1

    文章

    78

    瀏覽量

    22226
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1221

    瀏覽量

    25210

原文標(biāo)題:一種全新易用的基于Word-Word關(guān)系的NER統(tǒng)一模型,刷新了14種數(shù)據(jù)集并達(dá)到新SoTA

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    復(fù)制Simulink中的仿真模型word的方法小結(jié)

    的是個(gè)位圖文件,因而放大縮小時(shí)會(huì)存在失真。大家都知道調(diào)整矢量圖時(shí)不存在失真,那么simulink能夠?qū)С龇抡?b class='flag-5'>模型的矢量圖嗎?答案是肯定的。下面即提供了一種解決方法。1、在File->
    發(fā)表于 07-06 06:06

    Microsoft Office Word、Excel 和

    采用 Microsoft Office Word、Excel 和 PowerPoint 2007 新增的文件格式打開、編輯和保存文檔、工作簿和演示文稿。 Microsoft Office XP 和 2003 系統(tǒng) Word、Excel 或 PowerPoint 程序的用
    發(fā)表于 02-12 08:45 ?165次下載

    一種基于Word文檔的數(shù)字密寫設(shè)計(jì)與實(shí)現(xiàn)

    提出了一種新的基于 Word 文檔的數(shù)字密寫設(shè)計(jì)與實(shí)現(xiàn)方法,介紹了應(yīng)用程序的實(shí)現(xiàn)方案,給出了系統(tǒng)組成方框圖。實(shí)驗(yàn)結(jié)果表明,算法很好地實(shí)現(xiàn)了文本的嵌入和信息隱藏,且對(duì)
    發(fā)表于 08-04 09:40 ?20次下載

    《微機(jī)原理及應(yīng)用》課程教程 (word文檔)

     《微機(jī)原理及應(yīng)用》課程教案目    錄 下載WORD文檔前    言 下載WORD文檔第章 51系列單片機(jī)概述 下載W
    發(fā)表于 09-16 11:17 ?202次下載

    一種快速Word編程接口的設(shè)計(jì)與實(shí)現(xiàn)

    本文在分析MS Word文檔存儲(chǔ)格式的基礎(chǔ)上,研究了讀取Word文檔二進(jìn)制數(shù)據(jù)流并將其恢復(fù)成可讀信息的方法,設(shè)計(jì)實(shí)現(xiàn)了一種快速Word編程接口,大大地提高了文檔處理速度和系統(tǒng)性能
    發(fā)表于 02-21 15:58 ?23次下載

    Office Word、Excel和PowerPoint 文

    打開、編輯和保存采用從 Office 2007 開始引入到 Microsoft Office Word、Excel 和 PowerPoint 中的 Open XML 文件格式的文檔、工作簿和演示文稿。Microsoft Office XP 和 2003 系統(tǒng) Word、E
    發(fā)表于 07-06 00:14 ?238次下載
    Office <b class='flag-5'>Word</b>、Excel和PowerPoint 文

    一種快速Word編程接口的設(shè)計(jì)與實(shí)現(xiàn)

    本文在分析MS Word文檔存儲(chǔ)格式的基礎(chǔ)上,研究了讀取Word文檔二進(jìn)制數(shù)據(jù)流并將其恢復(fù)成可讀信息的方法,設(shè)計(jì)實(shí)現(xiàn)了一種快速Word編程接口,大大地提高了文檔處理速度和系統(tǒng)性能
    發(fā)表于 07-22 17:39 ?16次下載

    word如何去刪除水印

    word如何去刪除水印:利用WPS文字工具打開這份Word文檔,然后在菜單中依次選擇“視圖-頁眉頁腳”命令;接著把鼠標(biāo)移動(dòng)到水印上,當(dāng)出現(xiàn)十字星時(shí),單擊下鼠
    發(fā)表于 01-26 12:40 ?6253次閱讀

    word/word2003上次啟動(dòng)失敗,以安全模式啟動(dòng)的解決

    word/word2003上次啟動(dòng)失敗,以安全模式啟動(dòng)的解決方法 這個(gè)問題其實(shí)很好解決:?jiǎn)栴}在于壞的word文件導(dǎo)致word的模版出錯(cuò)了。 電子發(fā)燒友
    發(fā)表于 08-03 22:21 ?4186次閱讀
    <b class='flag-5'>word</b>/<b class='flag-5'>word</b>2003上次啟動(dòng)失敗,以安全模式啟動(dòng)的解決

    Word人工雙面打印

    Word人工雙面打印 單位的打印機(jī)只能打印單面,所以要通過軟件的方法實(shí)現(xiàn)雙面打印功能。 第一種方法分兩
    發(fā)表于 12-29 10:28 ?2225次閱讀

    如何用Word調(diào)用Protel For DOS繪制的圖形

    如何用Word調(diào)用Protel For DOS繪制的圖形 撰寫科技文章時(shí),常常需要插入些電路原理圖,如果這些原理圖用Word自帶的畫圖工具繪制
    發(fā)表于 03-09 13:40 ?1473次閱讀

    VC上機(jī)指導(dǎo)WORD文檔

    VC上機(jī)指導(dǎo)WORD文檔
    發(fā)表于 03-04 17:48 ?2次下載

    些常見的Word應(yīng)用試卷輸入方法

    如果要問Word中什么文件編輯難度最高,恐怕非學(xué)生試卷莫數(shù)了。
    的頭像 發(fā)表于 12-08 09:23 ?4027次閱讀
    <b class='flag-5'>一</b>些常見的<b class='flag-5'>Word</b>應(yīng)用試卷輸入方法

    如何使用Python讀取寫入Word文件

    01 準(zhǔn)備 Python 是一種通用編程語言,也可以用于處理 Microsoft Word 文件。在本文中,我將向你介紹如何使用 Python 和 python-docx 庫讀取、寫入和操作
    的頭像 發(fā)表于 09-27 17:03 ?2340次閱讀

    Spire.Cloud.Word云端Word文檔處理SDK介紹

    Spire.Cloud.Word款專業(yè)的云端 Word 文檔處理 SDK,開發(fā)人員使用它在云端創(chuàng)建、讀取、編輯、轉(zhuǎn)換和保存 Word 文檔。作為
    的頭像 發(fā)表于 02-11 11:11 ?356次閱讀
    Spire.Cloud.<b class='flag-5'>Word</b>云端<b class='flag-5'>Word</b>文檔處理SDK介紹