一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

用于改進(jìn)文本分類的特征投影

深度學(xué)習(xí)自然語言處理 ? 來源:深度學(xué)習(xí)自然語言處理 ? 作者:深度學(xué)習(xí)自然語言 ? 2021-03-05 15:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

TL; DR

在情感分類中,一些good features,比如”good“、”nice“表示積極,”bad“、“terrible”表示消極。但是,還有許多common features,比如voice、screen就沒有特別的情感性。

盡管深度學(xué)習(xí)擁有強(qiáng)大的representation learning(表征學(xué)習(xí),即同一個數(shù)據(jù)用不同的表示形式)。但我們認(rèn)為還有可以改進(jìn)的地方。

在本文中,我們提出了一種新的角度來進(jìn)一步改善這種表示學(xué)習(xí),即特征投影(feature projection):將現(xiàn)有特征投影到common特征的正交空間中。

所得的投影向量垂直于common特征,能更好的進(jìn)行分類。

將該方法用于改進(jìn)基于CNN,RNN,Transformer和Bert的文本分類模型,獲得更好的結(jié)果。

網(wǎng)絡(luò)結(jié)構(gòu)

Feature Purification Network 特征凈化網(wǎng)絡(luò)

模型分為兩部分:

projection network (P-net);

common feature learning network (C-net)

P-net:計算凈化的向量特征,通過將學(xué)習(xí)到的輸入文本的信息向量投影到更具區(qū)分性的語義空間中來消除共同特征的影響。

C-net:提取common features。

P-net由四部分組成:

輸入層X

特征提取器Fp

正交投影層(OPL,Orthogonal Projection Layer)

分類層Cp

C-net也由四部分組成:

輸入層X

特征提取器Fc(Fp和Fc的參數(shù)不共享)

漸變反向?qū)樱℅RL,Gradient Reverse Layer)

分類層Cc

技術(shù)的關(guān)鍵思想如下:

P-Net中特征向量fp投影到C-Net的fc的正交方向上。也就是說,將fp(從輸入文檔中提取的完整信息)投影到更具區(qū)分性的語義空間中,以進(jìn)行最終分類。

圖2:正交投影層的工作方式。這里的示例是在二維空間中。

fp表示傳統(tǒng)特征向量;

fc表示公共特征向量;

fp?是投影特征向量;

fp~是最終的正交投影特征向量。

我們首先將傳統(tǒng)特征向量fp投影到共同特征向量fc,得到fp?。

等式9中的fp?即表示對共同特征向量fc的約束。

再將fp投影到fp-fp*得到fp~

也就是說:通過將輸入的傳統(tǒng)特征向量fp投影到公共特征向量fc來限制公共特征向量的模,因此新的公共特征向量fp*的語義信息僅包含xi的公共語義信息。

這使得最終的純化特征向量fp~來自傳統(tǒng)特征向量fp,而不是與公共特征向量fc正交的任何平面中的任何向量。

最后,我們使用純化的特征向fp~進(jìn)行分類。

Experiments實驗

1 實驗使用數(shù)據(jù)集

2 Baselines模型

用LSTM、CNN、Transformer和BERT等基準(zhǔn)模型進(jìn)行對比實驗,已驗證特征投射的有效性。

3 實施細(xì)節(jié)

首先,我們將實驗中的所有詞嵌入隨機(jī)初始化為200維向量,然后在訓(xùn)練過程中進(jìn)行修改(Bert除外)。對于每種類型的特征提取器,我們具有以下配置:

對于RNN模型,使用兩層LSTM進(jìn)行特征提取,每層的hidden state=256;

對于CNN模型,為了獲得更多的細(xì)粒度特征,我們分別使用了[2,3,4,5,6]的濾波器大小,每個濾波器都有100個特征圖。

對于Transformer的模型,我們使用Transformer的編碼器作為特征提取器,使用單頭和3個block。

對于Bert模型,我們微調(diào)了預(yù)訓(xùn)練的基于Bert的參數(shù)。這些設(shè)置與FP-Net中的基線完全相同。

在C-net模塊的訓(xùn)練中,我們以0.9為初始學(xué)習(xí)率的隨機(jī)梯度和隨后的退火學(xué)習(xí)率(Ganin and Lempitsky,2014)。

其中,訓(xùn)練進(jìn)度p從0線性變化為1,l0 = 0.01,α= 10和β= 0.75。在GRL中,超參數(shù)λ為[0.05,0.1,0.2,0.4,0.8,1.0]。

4 實驗結(jié)果

5 消融實驗與分析

消融實驗類似于“控制變量法”。假設(shè)在某任務(wù)中,使用了A,B,C,取得了不錯的效果,但是這個時候你并不知道效果是由A,B,C中哪一個起的作用,于是你保留A,B,移除C進(jìn)行實驗來看一下C在整個任務(wù)中所起的作用。

結(jié)論

在本文中,我們提出了一種新的特征凈化網(wǎng)絡(luò)(FP-Net),以改進(jìn)文本分類的表示;

該方法基于特征投影。所提出的模型使用兩個子網(wǎng),一個用于識別對分類沒有區(qū)別的共同特征common features,另一個用于將傳統(tǒng)特征投射到共同特征的正交方向的特征投影;

我們當(dāng)前的方法僅用于傳統(tǒng)文本分類方法,例如LSTM,CNN和Transformer。在未來的工作中,我們將考慮將其擴(kuò)展到基于圖的方法(例如用于圖形數(shù)據(jù)的GCN),以及擴(kuò)展到基于生成的方法(例如用于對抗性學(xué)習(xí)的GAN)。

責(zé)任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 文本分類
    +關(guān)注

    關(guān)注

    0

    文章

    18

    瀏覽量

    7398
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5561

    瀏覽量

    122792
  • cnn
    cnn
    +關(guān)注

    關(guān)注

    3

    文章

    354

    瀏覽量

    22741

原文標(biāo)題:【ACL2020】用于改進(jìn)文本分類的特征投影

文章出處:【微信號:zenRRan,微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    DLP4500連續(xù)觸發(fā)投影,大約投影一百多次后,再觸發(fā)就不投影了,為什么?

    在vs程序總將投影的控制進(jìn)行了實現(xiàn),投影序列設(shè)置如下圖: 1. 測試連續(xù)觸發(fā)時:每隔一秒觸發(fā)一次投影,大約投影一百多次后,再觸發(fā)就不投影
    發(fā)表于 03-03 08:33

    DLP LightCrafter 3000 evm按照教程進(jìn)行標(biāo)定,沒有投影白色而是投影的綠色,為什么?

    (tidu985a.pdf)文檔進(jìn)行標(biāo)定,運行程序到第四五步時,投影投影出來的是純綠色光線和綠色棋盤格,請問如何設(shè)置投影出白色和白色棋盤格。 我修改了config_projector.txt配置文件中
    發(fā)表于 03-03 06:13

    用DLP4500投影正弦光柵時存在高頻噪聲,應(yīng)該如何改進(jìn)正弦光柵質(zhì)量?

    用DLP4500投影正弦光柵時存在高頻噪聲,應(yīng)該如何改進(jìn)正弦光柵質(zhì)量?
    發(fā)表于 02-26 07:24

    dlpc3479用于dlp4710這款DMD上,該系統(tǒng)的最大投影幀率是多少?

    請問一下,dlpc3479用于dlp4710這款DMD上, 該系統(tǒng)的最大投影幀率是多少?以及相應(yīng)的文檔資料, 非常感謝
    發(fā)表于 02-24 07:21

    DLP4710EVM-LC兩個條紋集合投影沖突怎么解決?

    如圖所示,我將條紋圖寫入投影用于投影,當(dāng)只有一個條紋集合時投影正常,因為一個集合最多投影7張圖片,而我需要
    發(fā)表于 02-19 08:36

    使用DLP4500進(jìn)行圖片投影時,內(nèi)置Flash太小,無法投影更多的圖片,怎么解決?

    在使用DLP4500進(jìn)行圖片投影時,內(nèi)置Flash太小,無法投影更多的圖片,請問有其他方法能夠投影更多的圖片嗎?或者有其他flash更大的型號DLP推薦嗎?
    發(fā)表于 02-18 07:33

    DLP4500怎么確定投影儀開始投影的同時相機(jī)的c++代碼開始運行?

    投影儀通過trig1 鏈接相機(jī),投影儀投圖同時觸發(fā)相機(jī),相機(jī)采集圖像并傳回電腦,相機(jī)的代碼里需要添加dlp4500的api或sdk代碼嗎,怎么確定投影儀開始投影的同時相機(jī)的c++代碼
    發(fā)表于 02-18 07:16

    液晶投影儀與傳統(tǒng)投影儀的比較

    液晶投影儀與傳統(tǒng)投影儀在多個方面存在顯著差異,以下是對兩者的比較: 一、成像技術(shù) 液晶投影儀 :采用液晶板作為成像元件,通過液晶分子的排列變化來調(diào)控光線,從而實現(xiàn)色彩的精準(zhǔn)還原與高清顯示效果。 傳統(tǒng)
    的頭像 發(fā)表于 12-26 18:10 ?1007次閱讀

    如何使用自然語言處理分析文本數(shù)據(jù)

    媒體、新聞報道、用戶評論等)收集你感興趣的文本數(shù)據(jù)。 數(shù)據(jù)清洗 :去除無關(guān)字符(如HTML標(biāo)簽、特殊符號等),確保文本數(shù)據(jù)干凈且一致。 2. 預(yù)處理 分詞 :將文本分割成有意義的單元(單詞、短語或句子),這取決于使用的語言和分析
    的頭像 發(fā)表于 12-05 15:27 ?1572次閱讀

    DMD芯片應(yīng)用于投影儀的優(yōu)勢

    DMD(Digital Micromirror Device)芯片是數(shù)字光學(xué)投影技術(shù)(DLP)的核心組件,它將數(shù)字信號轉(zhuǎn)換成可見的投影圖像。DMD芯片應(yīng)用于投影儀時,具有顯著的優(yōu)勢,具
    的頭像 發(fā)表于 12-05 10:47 ?1694次閱讀

    圖紙模板中的文本變量

    進(jìn)行定義。無論是系統(tǒng)內(nèi)置的變量,還是用戶自定義的變量,都以這種方式表述。 系統(tǒng)內(nèi)置文本變量 以下表格展示系統(tǒng)內(nèi)置的文本變量,無需定義,可以直接使用: 比如說,如果在圖紙編輯器中定義了以下標(biāo)題欄: 當(dāng)該圖紙模板應(yīng)用于原理圖或PCB
    的頭像 發(fā)表于 11-13 18:21 ?651次閱讀
    圖紙模板中的<b class='flag-5'>文本</b>變量

    RK3588 技術(shù)分享 | 在Android系統(tǒng)中使用NPU實現(xiàn)Yolov5分類檢測

    : NPU幫助機(jī)器完成更高效的翻譯、文本分類和情感分析,推動了自然語言處理技術(shù)的發(fā)展。 實例分享:Yolov5分類檢測 在RK3588處理器上,不僅可以基于Linux系統(tǒng)使用NPU,也可以
    發(fā)表于 10-24 10:13

    雷達(dá)的基本分類方法

    電子發(fā)燒友網(wǎng)站提供《雷達(dá)的基本分類方法.pdf》資料免費下載
    發(fā)表于 09-11 09:09 ?6次下載

    遙感傳感器的主要成像投影方式有哪些

    遙感傳感器的成像投影方式是遙感技術(shù)中的一個重要概念,它決定了傳感器如何捕捉地球表面的特征,并將其轉(zhuǎn)換為圖像數(shù)據(jù)。 中心投影(Perspective Projection) : 特點:傳感器與地球表面
    的頭像 發(fā)表于 09-04 14:23 ?1533次閱讀

    RK3588 技術(shù)分享 | 在Android系統(tǒng)中使用NPU實現(xiàn)Yolov5分類檢測

    : NPU幫助機(jī)器完成更高效的翻譯、文本分類和情感分析,推動了自然語言處理技術(shù)的發(fā)展。 實例分享:Yolov5分類檢測 在RK3588處理器上,不僅可以基于Linux系統(tǒng)使用NPU,也可以
    發(fā)表于 08-20 11:13