一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于k近鄰與高斯噪聲的虛擬困難樣本增強(qiáng)方法

深度學(xué)習(xí)自然語言處理 ? 來源:YeungNLP ? 作者:荷風(fēng)微擺 ? 2022-05-12 11:31 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在本文中,我們將介紹亞馬遜團(tuán)隊在ACL2022中的一篇論文VaSCL,該論文在SimCSE的基礎(chǔ)上,提出了一種基于k近鄰與高斯噪聲的虛擬困難樣本增強(qiáng)方法。作者在無監(jiān)督訓(xùn)練中,進(jìn)行困難樣本增強(qiáng),從而提高了模型的性能,并且超過了SimCSE。

6338e638-d19e-11ec-bce3-dac502259ad0.png

論文標(biāo)題:

Virtual Augmentation Supported Contrastive Learning of Sentence Representations

論文鏈接:

https://arxiv.org/abs/2110.08552

01

引言

在ACL2021中,陳丹琦團(tuán)隊提出了使用Dropout進(jìn)行正樣本增強(qiáng)的對比學(xué)習(xí)方法SimCSE,該方法操作簡單卻十分有效,在無監(jiān)督對比學(xué)習(xí)中取得了非常好的效果。在有監(jiān)督SimCSE中,作者對困難負(fù)樣本的作用進(jìn)行了探究實驗,實驗結(jié)果證明,引入困難負(fù)樣本后,有監(jiān)督SimCSE的指標(biāo)從84.9提升至86.2。這說明,在對比學(xué)習(xí)中,引入困難樣本是能夠提升模型效果的。

然而在無監(jiān)督SimCSE中,作者僅使用dropout的方式進(jìn)行了正樣本增強(qiáng),沒有額外引入困難樣本,這在一定程度上限制了模型的能力?;谶@個動機(jī),亞馬遜提出了一種基于k近鄰與高斯噪聲的虛擬困難樣本增強(qiáng)的無監(jiān)督對比學(xué)習(xí)方法VaSCL。

02

論文解讀

基于Dropout的對比損失

在介紹VaSCL模型之前,我們先簡單回顧一下無監(jiān)督SimCSE。假設(shè)訓(xùn)練時的batch size為N,將一個batch的數(shù)據(jù)記作,將同一個樣本分別輸入模型中兩次,使用不同的dropout mask編碼得到兩個向量和。則在規(guī)模為N的batch中,與的InfoNCE損失為:

基于k近鄰的虛擬增強(qiáng)對比損失

在無監(jiān)督SimCSE的損失函數(shù)的基礎(chǔ)上,作者還設(shè)計了一種基于k近鄰的虛擬困難樣本增強(qiáng)的損失函數(shù)。

將通過模型編碼之后得到向量序列。

作者通過以下方式獲得第i個句向量的虛擬困難樣本:

正樣本增強(qiáng):對添加高斯噪聲,得到,其中就是經(jīng)過高斯增強(qiáng)后的正樣本。

獲得k近鄰:獲得在中距離最近的k個負(fù)樣本,在本文中我們稱之為k近鄰,記作。

對于來說,是正樣本,是負(fù)樣本集合。則對于,k近鄰虛擬增強(qiáng)的對比損失如下。分子表示拉近與的距離,分母表示拉遠(yuǎn)與負(fù)樣本之間的距離。

在CV中,我們會為輸入的圖片添加高斯噪聲以增加模型的泛化性。添加了高斯噪聲的圖片,肉眼能看出微小的區(qū)別,但不會影響整張圖片的語義信息。所以為句向量添加合適的高斯噪聲,理論上也不會對句向量的語義信息產(chǎn)生很大的改變。

在的k近鄰中,存放的是距離最近的k個負(fù)樣本,也就是與最相似的k個負(fù)樣本。只要batch size足夠大,我們可以近似認(rèn)為,就是的困難負(fù)樣本集合,同樣也是的困難負(fù)樣本集合。

如何獲得上述的高斯噪聲呢?最容易想到的做法便是隨機(jī)生成一個高斯噪聲,直接添加到句向量中。但是為了提高模型的訓(xùn)練難度,生成更高質(zhì)量的高斯噪聲,作者生成若干個候選高斯噪聲,然后選出一個使得最大化的高斯噪聲。

從上述操作可以看出,對于最優(yōu)的高斯噪聲,作者希望它增強(qiáng)后的正樣本與的距離盡可能遠(yuǎn),與負(fù)樣本的距離盡可能近,作者希望這個高斯噪聲能夠?qū)δP彤a(chǎn)生盡可能大的迷惑性。通過這個高斯噪聲,我們就可以得到困難正樣本,并且從某種意義來說,也使得與的距離盡可能拉近,達(dá)到了增強(qiáng)負(fù)樣本難度的目的,做法確實挺巧妙。

VaSCL對比損失

63676d46-d19e-11ec-bce3-dac502259ad0.png

將上述兩種對比損失進(jìn)行組合,得到最終的VaSCL損失函數(shù):

這個損失函數(shù)的含義如下:

對于每個句子,拉近同一個句子經(jīng)過dropout之后的兩個句向量之間的距離,拉遠(yuǎn)它們與其他句子的距離。

對于每個句子,拉近原句向量與高斯噪聲增強(qiáng)之后的句向量的距離,拉遠(yuǎn)它們與k近鄰負(fù)樣本之間的距離。

03

實驗結(jié)果

作者分別在STS任務(wù)、短文本聚類、意圖識別等任務(wù)中進(jìn)行了實驗,實驗結(jié)果如下表所示??梢钥吹?,在三種任務(wù)中,絕大部分?jǐn)?shù)據(jù)集上,VaSCL的表現(xiàn)都要優(yōu)于SimCSE,這表明了基于k近鄰與高斯噪聲的困難樣本增強(qiáng)的有效性。

6385a8ce-d19e-11ec-bce3-dac502259ad0.png

63c1165c-d19e-11ec-bce3-dac502259ad0.png

63d37914-d19e-11ec-bce3-dac502259ad0.png

04

總結(jié)

SimCSE通過dropout mask這種簡單的方法,避免了人工進(jìn)行正樣本增強(qiáng)所帶來的語義改變的問題,并且在無監(jiān)督訓(xùn)練中取得了不錯的效果。而VaSCL論文延續(xù)了SimCSE這種思想,引入了高斯噪聲進(jìn)行正樣本增強(qiáng),有著異曲同工之妙。

VaSCL在SimCSE的基礎(chǔ)上,也進(jìn)行了困難樣本的增強(qiáng)。在進(jìn)行高斯噪聲增強(qiáng)時,使得增強(qiáng)的樣本與原始樣本盡可能不相似,與負(fù)樣本盡可能相似,已達(dá)到【混淆視聽】的效果。通過這種方式,VaSCL在絕大多數(shù)據(jù)集上的表現(xiàn),也超過了SimCSE。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 噪聲
    +關(guān)注

    關(guān)注

    13

    文章

    1140

    瀏覽量

    48147
  • 函數(shù)
    +關(guān)注

    關(guān)注

    3

    文章

    4381

    瀏覽量

    64896
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3521

    瀏覽量

    50430

原文標(biāo)題:ACL'22 | VaSCL:基于k近鄰與高斯噪聲的困難樣本增強(qiáng)的對比學(xué)習(xí)方法,超越SimCSE

文章出處:【微信號:zenRRan,微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    噪聲的測量方法詳細(xì)干貨

    隨著近幾年電路集成規(guī)模和信號頻率的日益提高以及對低功耗的追求,導(dǎo)致信號環(huán)境日趨復(fù)雜,相對應(yīng)測量小信號的精度要求不斷提高,測量儀器的噪聲大小成為重要的參數(shù)指標(biāo)。而噪聲是幅值很低的信號,觀測需要有效的方法,本期介紹
    的頭像 發(fā)表于 06-19 09:19 ?386次閱讀
    <b class='flag-5'>噪聲</b>的測量<b class='flag-5'>方法</b>詳細(xì)干貨

    GLAD應(yīng)用:高斯光束的吸收和自聚焦效應(yīng)

    的,這將使不同空間位置的光所經(jīng)歷的光程長度不同,即介質(zhì)對入射光束的作用等價于光學(xué)透鏡,從而導(dǎo)致光束的自行聚焦效果。 特別地,當(dāng)入射光束強(qiáng)度沿垂直光軸的界面內(nèi)呈高斯形時,且強(qiáng)度足夠產(chǎn)生非線性效應(yīng)的情況下
    發(fā)表于 06-17 08:52

    GLAD應(yīng)用:高斯光束的吸收和自聚焦效應(yīng)

    的,這將使不同空間位置的光所經(jīng)歷的光程長度不同,即介質(zhì)對入射光束的作用等價于光學(xué)透鏡,從而導(dǎo)致光束的自行聚焦效果。 特別地,當(dāng)入射光束強(qiáng)度沿垂直光軸的界面內(nèi)呈高斯形時,且強(qiáng)度足夠產(chǎn)生非線性效應(yīng)的情況下
    發(fā)表于 05-16 08:47

    基于高斯的稠密視覺SLAM研究

    基于高斯的場景表示在新視角下會出現(xiàn)幾何失真,這大大降低了基于高斯的跟蹤方法的準(zhǔn)確性。這些幾何不一致主要源于高斯基元的深度建模以及在深度融合過程中表面之間的相互干擾。為了解決這些問題,我
    的頭像 發(fā)表于 05-15 10:36 ?313次閱讀
    基于<b class='flag-5'>高斯</b>的稠密視覺SLAM研究

    多功能三維高斯

    大家對高斯計都不陌生,高斯計是檢測磁體磁感應(yīng)強(qiáng)度的專用儀器,是磁性測量領(lǐng)域中用途最為廣泛的測量儀器之一。目前市面上高斯計普遍配備的是單向的霍爾探頭,即只能測量一個方向的磁場強(qiáng)度。今天小編給大家?guī)?/div>
    的頭像 發(fā)表于 02-06 14:28 ?376次閱讀
    多功能三維<b class='flag-5'>高斯</b>計

    開關(guān)電源紋波噪聲產(chǎn)生原因和測試方法

    本文簡述了開關(guān)電源紋波噪聲測試方法及延伸,同時分享紋波噪聲測試使用設(shè)備,以及給出紋波噪聲測試的具體方法,供大家學(xué)習(xí)參考。
    的頭像 發(fā)表于 12-20 09:39 ?3505次閱讀
    開關(guān)電源紋波<b class='flag-5'>噪聲</b>產(chǎn)生原因和測試<b class='flag-5'>方法</b>

    圖像高斯濾波的原理及FPGA實現(xiàn)思路

    (Gaussian Blur),是一種高斯低通濾波。通常這個算法也可以用來模糊圖像,提供模糊濾鏡。也可以用來過濾自然界的高斯噪聲。 高斯分布(正態(tài)分布)是一個常見的連續(xù)概率分布,正態(tài)
    的頭像 發(fā)表于 12-07 09:12 ?1904次閱讀
    圖像<b class='flag-5'>高斯</b>濾波的原理及FPGA實現(xiàn)思路

    用RM3100是否可以做高斯計?

    電壓差。高斯計通過霍爾探頭感應(yīng)磁場,產(chǎn)生霍爾電壓,再依據(jù)霍爾電壓公式和已知的霍爾系數(shù)來確定磁感應(yīng)強(qiáng)度的大小。這種測量方法簡單、快速且準(zhǔn)確,被廣泛應(yīng)用于科研、工業(yè)生產(chǎn)
    的頭像 發(fā)表于 11-02 08:10 ?659次閱讀
    用RM3100是否可以做<b class='flag-5'>高斯</b>計?

    高斯濾波和均值濾波的區(qū)別

    高斯濾波和均值濾波在圖像處理中都是常用的平滑濾波方法,但它們之間存在一些關(guān)鍵的區(qū)別。以下是兩者之間的主要區(qū)別: 1. 濾波原理 高斯濾波 : 是一種線性平滑濾波,它使用高斯函數(shù)來計算卷
    的頭像 發(fā)表于 09-29 09:40 ?1693次閱讀

    高斯濾波和雙邊濾波的區(qū)別

    高斯濾波和雙邊濾波在圖像處理中都是常用的平滑濾波技術(shù),但它們之間存在一些顯著的區(qū)別。以下是兩者之間的主要區(qū)別: 一、基本原理 高斯濾波 : 是一種線性平滑濾波,適用于消除高斯噪聲。 其
    的頭像 發(fā)表于 09-29 09:37 ?1187次閱讀

    高斯濾波的特點(diǎn)有哪些

    、背景)則相對保留。這種平滑處理有助于去除圖像中的噪聲,改善圖像質(zhì)量。 邊緣保留 : 與其他平滑濾波方法相比,高斯濾波在平滑圖像的同時能夠較好地保留圖像的邊緣信息。這是因為高斯濾波的權(quán)
    的頭像 發(fā)表于 09-29 09:36 ?875次閱讀

    高斯卷積核函數(shù)在圖像采樣中的意義

    。這種平滑處理通過減小圖像中像素之間的差異來模糊圖像,有助于去除圖像中的高頻噪聲和細(xì)節(jié)紋理,使圖像看起來更加平滑。 去噪效果 :在圖像的采集或傳輸過程中,往往會受到各種噪聲的干擾。高斯卷積核函數(shù)能夠通過平滑處理有效地抑
    的頭像 發(fā)表于 09-29 09:33 ?854次閱讀

    高斯濾波的卷積核怎么確定

    高斯濾波的卷積核確定主要依賴于高斯函數(shù)的特性以及圖像處理的具體需求。以下是確定高斯濾波卷積核的幾個關(guān)鍵步驟: 一、確定卷積核的大小 卷積核形狀 :高斯濾波的卷積核通常是正方形矩陣,大小
    的頭像 發(fā)表于 09-29 09:29 ?1687次閱讀

    高斯濾波的基本原理有哪些

    高斯濾波的基本原理可以從以下幾個方面進(jìn)行闡述: 一、定義與性質(zhì) 定義 :高斯濾波(Gaussian Filter)是一種常見的圖像處理技術(shù),實質(zhì)上是一種信號的濾波器,用于平滑和降噪圖像。它采用高斯
    的頭像 發(fā)表于 09-29 09:27 ?1559次閱讀

    高斯計如何選型?

    高斯計是專門用于檢測磁場的設(shè)備。根據(jù)檢測環(huán)境與磁場方向、可靈活配置多種類檢測探頭(橫向探頭:探頭垂直磁場方向、軸(縱)向探頭:探頭平行于磁場方向、超薄探頭(橫向):微小間隙中磁場檢測)。市場上
    的頭像 發(fā)表于 08-15 08:58 ?828次閱讀
    <b class='flag-5'>高斯</b>計如何選型?