今天給大家分享的是是ACL 2022上與實體關(guān)系抽取相關(guān)的部門論文范讀筆記。其中有一些小喵自己也在學習,后續(xù)會推出精讀筆記。
1. DocRE
論文概括:具有自適應焦點損失和知識蒸餾的文檔級關(guān)系抽取
文檔級關(guān)系抽取要同時從多個句子中提取關(guān)系。針對這個任務,本文提出了一個半監(jiān)督算法 DocRE。DocRE 共有三個新組件:
第一,用軸向注意力模塊學習實體對之間的依賴關(guān)系。
第二,提出了一個自適應的焦點損失來解決DocRE中類的不平衡問題。
最后,利用知識蒸餾來克服人工標注數(shù)據(jù)與遠程監(jiān)督數(shù)據(jù)之間的差異。
現(xiàn)有問題:現(xiàn)存的方法關(guān)注實體對的句法特征,而忽略了實體對之間的交互作用;目前還沒有工作可以直接地解決類的不平衡問題?,F(xiàn)存的工作僅僅關(guān)注閾值學習來平衡正例和負例,但正例內(nèi)部的類不平衡問題并沒有得到解決;關(guān)于將遠程監(jiān)督數(shù)據(jù)應用于DocRE任務的研究很少。
貢獻點:
軸向注意力:提升two-hop關(guān)系的推理能力;
自適應焦點損失:解決標簽分配不平衡的問題,長尾類在總的損失中占比較多;
知識蒸餾:克服標注數(shù)據(jù)和遠程監(jiān)督數(shù)據(jù)之間的差異。
DocRE
2. PL-Marker
論文名稱:《Packed Levitated Marker for Entity and Relation Extraction》
論文鏈接:https://aclanthology.org/2022.acl-long.337.pdf
代碼地址:https://github.com/thunlp/PL-Marker
論文概括:打包懸浮標記用于實體和關(guān)系抽取
最近的命名實體識別和關(guān)系抽取工作專注于研究如何從預訓練模型中獲得更好的span表示。然而,許多工作忽略了span之間的相互關(guān)系。本文提出了一種基于懸浮標記的span表示方法,在編碼過程中通過特定策略打包標記來考慮span之間的相互關(guān)系。對于命名實體識別任務,提出了一種面向鄰居span的打包策略,以更好地建模實體邊界信息。對于關(guān)系抽取任務,設(shè)計了一種面向頭實體的打包策略,將每個頭實體以及可能的尾實體打包,以共同建模同頭實體的span對。
PL-Marker
3. CRL
論文名稱:《Consistent Representation Learning for Continual Relation Extraction》
論文鏈接:https://aclanthology.org/2022.findings-acl.268.pdf
代碼地址:https://github.com/thuiar/CRL
論文概括:一致表示學習用于連續(xù)關(guān)系抽取
通過對比學習和回放記憶時的知識蒸餾,提出一種新穎的一致性表示學習方法。使用基于記憶庫的監(jiān)督對比學習來訓練每一個新的任務,以使模型高效學習特征表示。為了防止對老任務的遺忘,構(gòu)造了記憶樣本的連續(xù)回放,同時讓模型保留在知識蒸餾中歷史任務之間的關(guān)系。
CRL
4. MCMN
論文名稱:《Pre-training to Match for Unified Low-shot Relation Extraction》
論文鏈接:https://aclanthology.org/2022.acl-long.397.pdf
代碼地址:https://github.com/fc-liu/MCMN
論文概括:預訓練用于匹配統(tǒng)一少樣本關(guān)系抽取
低樣本關(guān)系抽取旨在少樣本甚至零樣本場景下的關(guān)系抽取。由于低樣本關(guān)系抽取所包含任務形式多樣,傳統(tǒng)方法難以統(tǒng)一處理。本文針對這一問題,提出了一種統(tǒng)一的低樣本匹配網(wǎng)絡:
基于語義提示(prompt)范式,構(gòu)造了從關(guān)系描述到句子實例的匹配網(wǎng)絡模型;
針對匹配網(wǎng)絡模型學習,設(shè)計了三元組-復述的預訓練方法,以增強模型對關(guān)系描述與實例之間語義匹配的泛化性。
在零樣本、小樣本以及帶負例的小樣本關(guān)系抽取評測基準上的實驗結(jié)果表明,該方法能有效提升低樣本場景下關(guān)系抽取的性能,并且具備了較好的任務自適應能力。
-
數(shù)據(jù)
+關(guān)注
關(guān)注
8文章
7256瀏覽量
91887 -
編碼
+關(guān)注
關(guān)注
6文章
969瀏覽量
55781 -
訓練模型
+關(guān)注
關(guān)注
1文章
37瀏覽量
3964
原文標題:4. MCMN
文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
半監(jiān)督典型相關(guān)分析算法
基于半監(jiān)督學習的跌倒檢測系統(tǒng)設(shè)計_李仲年
半監(jiān)督的譜聚類圖像分割
基于C均值聚類和圖轉(zhuǎn)導的半監(jiān)督分類算法

基于最優(yōu)投影的半監(jiān)督聚類算法
基于半監(jiān)督學習框架的識別算法
如何約束半監(jiān)督分類方法的詳細資料概述

機器學習算法中有監(jiān)督和無監(jiān)督學習的區(qū)別
最基礎(chǔ)的半監(jiān)督學習
半監(jiān)督學習最基礎(chǔ)的3個概念

為什么半監(jiān)督學習是機器學習的未來?
一種帶有局部坐標約束的半監(jiān)督概念分解算法

一種基于光滑表示的半監(jiān)督分類算法

一種基于DE和ELM的半監(jiān)督分類方法

評論