一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

基于神經(jīng)轉(zhuǎn)移模型的論辯挖掘任務

深度學習自然語言處理 ? 來源:復旦DISC ? 作者:紀程煒 ? 2022-03-30 16:04 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

引言

論辯挖掘任務旨在識別文本中的論辯結(jié)構(gòu),近年來受到了廣泛的關注。在信息檢索等諸多領域里,論辯挖掘取得了卓越的進展。通常來說,論辯挖掘包含兩個子任務:1)對于論點進行分類;2)對于論點之間的關系進行分類。

本次分享我們將介紹兩篇來自ACL2021和一篇來自EMNLP2021的論辯挖掘相關論文。第一篇文章提出了一種基于神經(jīng)轉(zhuǎn)移的論辯挖掘模型;第二篇文章提出了一種評估論證充分性的新方法;第三篇文章對于推文的論辯挖掘定義為一種新的文本分類任務。

文章概覽

1.基于神經(jīng)轉(zhuǎn)移的論辯挖掘模型(A Neural Transition-based Model for Argumentation Mining)

論文提出了一種針對論辯挖掘任務的新方法,該方法通過產(chǎn)生一系列的動作來逐步構(gòu)建出一個論證圖,從而有效地避免了枚舉操作;此外,該方法還可以在不引入任何新的結(jié)構(gòu)約束條件下處理樹形(tree)或非樹形(non-tree)的結(jié)構(gòu)化論證。試驗結(jié)果表明,該模型在兩個不同結(jié)構(gòu)的公開數(shù)據(jù)集上達到了最優(yōu)性能。

論文地址:https://aclanthology.org/2021.acl-long.497

2.基于結(jié)論生成的論證充分性評估(Assessing the Sufficiency of Arguments through Conclusion Generation)

論文提出了一種針對論證充分性評估的新方法,即假設充分的論證所生成的結(jié)論是可以由其前提(premise)生成的。為了驗證猜想,文章基于大規(guī)模預訓練語言模型來探索充分性評估的潛力。實驗結(jié)果表明,該方法性能達到最優(yōu),F(xiàn)1-score高達0.885。

論文地址:https://aclanthology.org/2021.argmining-1.7

3. 基于推文的論辯挖掘:計劃生育立場辯論的案例研究(Argument Mining on Twitter: A Case Study on the Planned Parenthood Debate)

對于推文的論辯挖掘,論文用一種新的方式定義了該問題。由于主張在推文中很容易被識別出來,所以文章的重點就在于識別出支持或反對主張的前提,即將該問題定義為文本分類任務。論文提供了一個新的數(shù)據(jù)集,并且通過分析信息最豐富的文本,論文在推文中挖掘出了突出論點。

論文地址:https://aclanthology.org/2021.argmining-1.1

論文細節(jié)

1

922dea38-afe8-11ec-aa7f-dac502259ad0.png

動機

論辯挖掘(AM)其中一個子任務的目的是從文本中自動地識別出論點之間是否有關(ARI)。由于論點之間的語義關系是非常復雜的,所以論點之間的關系識別是論辯挖掘任務中最具有挑戰(zhàn)性的。而大多數(shù)現(xiàn)有的方法都是通過枚舉出論點之間所有可能的配對來確定它們之間是否有關。但是大多數(shù)論點之間是無關的,所以將所有的論點進行配對會使得效率極低并且會造成類別不平衡的問題。此外,對于樹型結(jié)構(gòu)來講,每一個論點至多有一個“出邊(outgoing)”來指向另一個論點;對于非樹型結(jié)構(gòu)則沒有這種限制。由于論證的復雜性,到目前為止,還沒有一種通用的方法可以同時解決樹型或非樹型的論證結(jié)構(gòu)。

92424f78-afe8-11ec-aa7f-dac502259ad0.png

任務定義

由于論文假設AM任務的第一階段已經(jīng)完成,即已經(jīng)將論點句子從文本中識別出來,所以論文的任務分為以下兩部分:1)對論點(AC)進行分類;2)識別論點之間是否存在關聯(lián),從而得到一個有向論證圖,其中論證圖的節(jié)點表示論點,有向邊表示論點之間的存在關聯(lián)。同時,論文定義了包含了個單詞的段落以及包含個論點的集合,每一個論點由論點的開始位置和結(jié)束位置來表示。

模型方法

轉(zhuǎn)移系統(tǒng)(Transition System)

轉(zhuǎn)移系統(tǒng)包含了六種動作(actions),不同的動作將會以不同的方式改變解析狀態(tài)(parser state):

:當非空并且不在之中,從彈出,然后將移到的頂部。

:當非空并且在之中,從和刪除,保持不變。

:當為空,從中刪除,并保持和不變。

:當為空,從中刪除,并為到分配一條有向邊。

:當非空,從彈出,然后將移到的頂部,并為到分配一條有向邊,并且將添加到之中。這一策略有利于挖掘出更多與有關的有向邊 。

:從中刪除,并為到分配一條有向邊。

9256c2d2-afe8-11ec-aa7f-dac502259ad0.png

狀態(tài)表示(State Representation)

文章用BERT來獲得論點的表示,用LSTM來編碼、和的長期依賴。

論點的表示將段落傳入BERT得到文本表示矩陣,其中表示第個單詞的詞向量,表示BERT最后一層的向量維度。對于論點,文章通過平均池化操作來獲得論點的表示,具體來說:

9274cdae-afe8-11ec-aa7f-dac502259ad0.png

其中表示第個論點。另外,對于論點的表示,文章結(jié)合了一些額外的特征:詞袋特征、位置編碼以及段落類型編碼。將其他特征歸結(jié)為,此時第個論點表示為和的組合:

92863382-afe8-11ec-aa7f-dac502259ad0.png

因此,在段落中的論點可以表示為。

解析狀態(tài)的表示在每一時間步,文章將解析狀態(tài)表示為,表示,存儲處理過的論點;表示,存儲未處理的論點;表示,記錄之后需要被刪除的論點;表示,記錄歷史動作。為了獲得的文本表示,將它傳遞給BiLSTM:

92964556-afe8-11ec-aa7f-dac502259ad0.png

其中,為的長度,為隱藏元的數(shù)量;同理的文本表示為:

92a6942e-afe8-11ec-aa7f-dac502259ad0.png

其中,為的長度。對于歷史動作信息,文中中采用單向LSTM來編碼:

92ba3d3a-afe8-11ec-aa7f-dac502259ad0.png

其中,為的長度??紤]到之間的相對距離對于確定它們之間是否有關來說是非常好的特征,所以文章將這種相對距離嵌入為,因此,解析狀態(tài)可以表示為:

92cb45bc-afe8-11ec-aa7f-dac502259ad0.png

其中和表示中的第一個和第二個元素,表示中的第一個元素。

動作預測首先通過多層感知機將降維到,之后再通過softmax預測動作的概率。

92dcb8ba-afe8-11ec-aa7f-dac502259ad0.png

實驗

數(shù)據(jù)集

Persuasive Essays (PE)該數(shù)據(jù)集包含402篇學生議論文,1833個段落。論點分為三種:Major-Claim,Claim和Premise。PE數(shù)據(jù)集中每個論點最多只有一條“出邊”,即符合樹型結(jié)構(gòu)。

CDCP該數(shù)據(jù)集一共包含731個段落。論點分為五類:Reference,F(xiàn)act,Testimony,Value和Policy。該數(shù)據(jù)集每個論點可以有多條“出邊”,屬于非樹型結(jié)構(gòu)。

實驗結(jié)果

實驗結(jié)果表明,文章提出的模型在兩個數(shù)據(jù)集上的結(jié)果均為最優(yōu)。

92f1d66e-afe8-11ec-aa7f-dac502259ad0.png

9301026a-afe8-11ec-aa7f-dac502259ad0.png

消融實驗: 驗證了文章提出的模型的優(yōu)越性。

931cf27c-afe8-11ec-aa7f-dac502259ad0.png

模型復雜度:之前的研究是對任意兩個論點進行配對,模型復雜度高達,而論文提出的模型可以將時間復雜度降為。

932f12ea-afe8-11ec-aa7f-dac502259ad0.png

2

9342d438-afe8-11ec-aa7f-dac502259ad0.png

動機

在之前的研究中,總是將論證的充分性評估建模為標準的文本分類任務,并且用傳統(tǒng)的卷積神經(jīng)網(wǎng)絡和特征提取的方式來處理。然而為了進一步提高性能,研究者們試圖將文本中直接可用的信息進行整合,但是現(xiàn)有的工作中既沒有考慮論證的前提和結(jié)論,也沒有考慮結(jié)論和前提之間的關系。由此作者提出了一種假設:只有充分的論證才可能從“前提”中推斷出“結(jié)論”。由于論證質(zhì)量評估任務中幾乎沒有考慮過大規(guī)模預訓練語言模型所帶來的編碼信息,所以作者提出基于預訓練語言模型來探索充分性評估的潛力。

任務定義

論證的充分性是指是否可以通過論證的前提來合理地推斷出結(jié)論。文章作者研究了由論證的前提自動生成結(jié)論是否有利于論證充分性的計算評估,作者旨在通過將生成的結(jié)論與原始標注相結(jié)合,進而從不充分的論證中挖掘出充分的論證。

935d4b38-afe8-11ec-aa7f-dac502259ad0.png

文章貢獻

語言模型可以生成與人類說話方式類似的論證結(jié)論。

文章提出的方法可以在論證充分性評估中達到SOTA效果。

深入討論了在論證的充分性評估中結(jié)構(gòu)注釋的重要性。

模型方法

方法由兩階段來實現(xiàn):

在對原始結(jié)論進行掩碼操作的論證中得到預訓練語言模型,之后通過該模型來自動的生成結(jié)論。

其次,通過對原始輸入論證的的8個實驗,利用生成的結(jié)論來評估論證的充分性。

通過降噪來生成結(jié)論

BART-unsupervised 不對BART進行微調(diào),使之作為baseline。

BART-supervised 通過在學生議論文數(shù)據(jù)集中微調(diào)BART,以便調(diào)整其降噪能力,進而生成結(jié)論。

充分性評估

通過在RoBERTa之后加入一個線性層來預測論證的前提是否可以合理地推斷出結(jié)論。

評估

評估生成結(jié)論的質(zhì)量

自動評估:通過對比BART-unsupervised與BART-supervised,可以發(fā)現(xiàn)微調(diào)之后的BART性能更優(yōu)。

9377477c-afe8-11ec-aa7f-dac502259ad0.png

評價充分性評估

直接的充分性評估通過比較RoBERTa與CNN以及人工評估,可以發(fā)現(xiàn)經(jīng)過微調(diào)的預訓練語言模型幾乎與人工評估一致。

間接的充分性評估通過對比7種不同的輸入特征可以發(fā)現(xiàn),當綜合了全部特征或者只包含論證的前提以及原始結(jié)論時,模型的性能最優(yōu)。

RoBERTa-premises-only 將原始結(jié)論進行掩碼操作之后,再作為模型的輸入。

RoBERTa-conclusion-only 只是將原始結(jié)論作為模型的輸入。

RoBERTa-generated-only 只用生成的結(jié)論作為模型的輸入。

RoBERTa-premises+conclusion 在原始輸入中對原始結(jié)論進行標記之后再作為模型輸入。

RoBERTa-premises+generated 對原始的結(jié)論進行掩碼操作并且加入生成的結(jié)論來作為模型的輸入。

RoBERTa-conclusion+generated 將原始結(jié)論以及生成的結(jié)論作為模型的輸入。

RoBERTa-all 結(jié)合所有的特征作為模型的輸入。

9391fac2-afe8-11ec-aa7f-dac502259ad0.png

3

93a19784-afe8-11ec-aa7f-dac502259ad0.png

動機

推特是一個很受歡迎的社交平臺,很多網(wǎng)友會在推特上分享自己的觀點。這些信息對決策者、營銷人員和社會科學家來說是無價的。然而,在推特上挖掘論點的努力是有限的,主要是因為一條推文通常太短,不能包含一個完整的論點——既有主張,也有前提。由于這個原因,現(xiàn)有的基于推特的論辯挖掘方法通常側(cè)重于識別主張(claim)或者是前提(premise),而不能同時識別出兩者。這并不是理想的,因為作為支持主張的證據(jù)同樣是非常重要的。

任務定義

論文就是否支持計劃生育問題,在推特了獲得了24,100條推文作為論文數(shù)據(jù)集,并且定義了“claim-hashtag”表示帶有主張的推文,“premise-tweet”表示帶有前提的推文。之所以選擇計劃生育角度,是因為關于計劃生育的辯論是多方面的,其中包括女權(quán),人權(quán)以及健康醫(yī)療等諸多社會話題從論辯挖掘的角度來說,帶有主張的推文可以通過簡單的文本匹配來檢索到。因此,文章的主要任務就是對于給定的推文,判斷其是否為“前提”,即論文將該任務定義為文本分類任務。

93af4dd4-afe8-11ec-aa7f-dac502259ad0.png

文章貢獻

論文提出了一個新的解決問題的方法,用來在推特上挖掘包含主張與前提的完整論點。

論文提供了一個由24,100條推文組成的新標注數(shù)據(jù)集,它的數(shù)據(jù)量是之前關于推特的數(shù)據(jù)集的10到80倍。

通過分析信息最豐富的文本,論文在推文中挖掘出了支持和反對資助計劃生育的突出論點。

數(shù)據(jù)集

標注人員將每一條推文分類為以下三種類別之一,從而挖掘出包含完整論點的推文:

SUPPORT WITH REASON:用戶支持或反對主張并且給出了原因,無論原因是否有效。

SUPPORT WITHOUT REASON:用戶僅僅支持或反對主張,但是并沒有給出原因。

NO EXPLICIT SUPPORT:用戶對主張表示中立或者立場不明確。

93bf119c-afe8-11ec-aa7f-dac502259ad0.png

模型方法

微調(diào)BERT在BERT之后加上全連接層并且用ReLu作為激活函數(shù)。此外,文章還驗證了DistilBERT的性能,DistilBERT是比BERT在結(jié)構(gòu)上要簡單,并且在一些特殊的下游任務中,性能可以與BERT相媲美。

CNNBERT的注意力機制被證明可以有效地捕捉到文本之間的長短期記憶,但是由于推文一般都是很簡短的,所以單純使用CNN也是有效的,對于單詞的嵌入操作則用GloVe詞向量即可。

XGBoostXGBoost在一些文本分類任務中非常有效,論文將XGBoost的變體模型作為baseline。

實驗結(jié)果

實驗結(jié)果表明,微調(diào)BERT的性能最優(yōu)。

93ce5bfc-afe8-11ec-aa7f-dac502259ad0.png

SHAP值代表對于給定特征,模型對文本分類的影響程度。通過分析微調(diào)BERT的SHAP值,可以發(fā)現(xiàn)在SUPPORT WITH REASON中,SHAP值越高,意味著該特征越有可能成為突出特征。例如,在支持計劃生育的文本中,“女權(quán)”或者“健康服務”的SHAP值排名靠前。當這類詞出現(xiàn)時,該文本最可能被分為SUPPORT WITH REASON中。

93e278a8-afe8-11ec-aa7f-dac502259ad0.png

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 模型
    +關注

    關注

    1

    文章

    3521

    瀏覽量

    50432
  • 語言模型
    +關注

    關注

    0

    文章

    561

    瀏覽量

    10794

原文標題:ACL&EMNLP'21 | 基于神經(jīng)轉(zhuǎn)移模型的論辯挖掘任務

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    BP神經(jīng)網(wǎng)絡的優(yōu)缺點分析

    BP神經(jīng)網(wǎng)絡(Back Propagation Neural Network)作為一種常用的機器學習模型,具有顯著的優(yōu)點,同時也存在一些不容忽視的缺點。以下是對BP神經(jīng)網(wǎng)絡優(yōu)缺點的分析: 優(yōu)點
    的頭像 發(fā)表于 02-12 15:36 ?925次閱讀

    如何訓練BP神經(jīng)網(wǎng)絡模型

    BP(Back Propagation)神經(jīng)網(wǎng)絡是一種經(jīng)典的人工神經(jīng)網(wǎng)絡模型,其訓練過程主要分為兩個階段:前向傳播和反向傳播。以下是訓練BP神經(jīng)網(wǎng)絡
    的頭像 發(fā)表于 02-12 15:10 ?926次閱讀

    【「基于大模型的RAG應用開發(fā)與優(yōu)化」閱讀體驗】+大模型微調(diào)技術(shù)解讀

    今天學習<基于大模型的RAG應用開發(fā)與優(yōu)化>這本書。大模型微調(diào)是深度學習領域中的一項關鍵技術(shù),它指的是在已經(jīng)預訓練好的大型深度學習模型基礎上,使用新的、特定任務相關的數(shù)據(jù)
    發(fā)表于 01-14 16:51

    人工神經(jīng)網(wǎng)絡的原理和多種神經(jīng)網(wǎng)絡架構(gòu)方法

    在上一篇文章中,我們介紹了傳統(tǒng)機器學習的基礎知識和多種算法。在本文中,我們會介紹人工神經(jīng)網(wǎng)絡的原理和多種神經(jīng)網(wǎng)絡架構(gòu)方法,供各位老師選擇。 01 人工神經(jīng)網(wǎng)絡 ? 人工神經(jīng)網(wǎng)絡
    的頭像 發(fā)表于 01-09 10:24 ?1203次閱讀
    人工<b class='flag-5'>神經(jīng)</b>網(wǎng)絡的原理和多種<b class='flag-5'>神經(jīng)</b>網(wǎng)絡架構(gòu)方法

    AI模型部署邊緣設備的奇妙之旅:目標檢測模型

    介紹了如何使用分類任務進行手寫數(shù)字的分類。相信大家腦海中可能會產(chǎn)生如下疑問: 數(shù)據(jù)依賴性強:分類模型的表現(xiàn)通常依賴于大量的標注數(shù)據(jù)進行訓練。獲取高質(zhì)量、大規(guī)模的數(shù)據(jù)集既耗時又昂貴。 泛化能力有限:模型
    發(fā)表于 12-19 14:33

    AI模型部署邊緣設備的奇妙之旅:如何實現(xiàn)手寫數(shù)字識別

    數(shù)據(jù)產(chǎn)生源的重要性,從而減少對云端計算的依賴。 2 基礎知識 2.1 神經(jīng)網(wǎng)絡模型概覽 神經(jīng)網(wǎng)絡模型的設計靈感來源于人類大腦的結(jié)構(gòu)。人腦由大量相互連接的
    發(fā)表于 12-06 17:20

    卷積神經(jīng)網(wǎng)絡與傳統(tǒng)神經(jīng)網(wǎng)絡的比較

    在深度學習領域,神經(jīng)網(wǎng)絡模型被廣泛應用于各種任務,如圖像識別、自然語言處理和游戲智能等。其中,卷積神經(jīng)網(wǎng)絡(CNNs)和傳統(tǒng)神經(jīng)網(wǎng)絡是兩種常
    的頭像 發(fā)表于 11-15 14:53 ?1878次閱讀

    深度學習中的卷積神經(jīng)網(wǎng)絡模型

    深度學習近年來在多個領域取得了顯著的進展,尤其是在圖像識別、語音識別和自然語言處理等方面。卷積神經(jīng)網(wǎng)絡作為深度學習的一個分支,因其在圖像處理任務中的卓越性能而受到廣泛關注。 卷積神經(jīng)網(wǎng)絡的基本概念
    的頭像 發(fā)表于 11-15 14:52 ?846次閱讀

    RNN模型與傳統(tǒng)神經(jīng)網(wǎng)絡的區(qū)別

    神經(jīng)網(wǎng)絡是機器學習領域中的一種強大工具,它們能夠模擬人腦處理信息的方式。隨著技術(shù)的發(fā)展,神經(jīng)網(wǎng)絡的類型也在不斷增加,其中循環(huán)神經(jīng)網(wǎng)絡(RNN)和傳統(tǒng)神經(jīng)網(wǎng)絡(如前饋
    的頭像 發(fā)表于 11-15 09:42 ?1131次閱讀

    如何使用Python構(gòu)建LSTM神經(jīng)網(wǎng)絡模型

    構(gòu)建一個LSTM(長短期記憶)神經(jīng)網(wǎng)絡模型是一個涉及多個步驟的過程。以下是使用Python和Keras庫構(gòu)建LSTM模型的指南。 1. 安裝必要的庫 首先,確保你已經(jīng)安裝了Python和以下庫
    的頭像 發(fā)表于 11-13 10:10 ?1583次閱讀

    【《大語言模型應用指南》閱讀體驗】+ 基礎知識學習

    并捕捉長距離依賴關系的神經(jīng)網(wǎng)絡結(jié)構(gòu)。Transformer通過編碼器(Encoder)和解碼器(Decoder)兩部分實現(xiàn)語言的編碼和解碼。 注意力機制:Transformer中的注意力機制使得模型
    發(fā)表于 08-02 11:03

    【《大語言模型應用指南》閱讀體驗】+ 基礎篇

    的章節(jié)包括統(tǒng)一自然語言任務、大語言模型的訓練過程和局限性分析,閱讀還算順利。 至此,基礎篇只能算是瀏覽完成,因為部分原理方法并沒有吃透,但盡管如此也是收獲頗豐,因為我了解了大語言模型的基礎知識和應用過程。
    發(fā)表于 07-25 14:33

    如何選擇神經(jīng)網(wǎng)絡種類

    在人工智能和機器學習領域,選擇適合的神經(jīng)網(wǎng)絡種類是構(gòu)建高效、準確模型的關鍵步驟。這一過程涉及對任務類型、數(shù)據(jù)特性、計算資源及模型性能要求等多方面的綜合考慮。
    的頭像 發(fā)表于 07-24 11:29 ?1200次閱讀

    UNet模型屬于哪種神經(jīng)網(wǎng)絡

    U-Net模型屬于卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network, CNN)的一種特殊形式 。它最初由德國弗萊堡大學計算機科學系的研究人員在2015年提出,專為生物醫(yī)學圖像
    的頭像 發(fā)表于 07-24 10:59 ?5558次閱讀

    如何構(gòu)建多層神經(jīng)網(wǎng)絡

    構(gòu)建多層神經(jīng)網(wǎng)絡(MLP, Multi-Layer Perceptron)模型是一個在機器學習和深度學習領域廣泛使用的技術(shù),尤其在處理分類和回歸問題時。在本文中,我們將深入探討如何從頭開始構(gòu)建一個多層神經(jīng)網(wǎng)絡
    的頭像 發(fā)表于 07-19 17:19 ?1569次閱讀