一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

通過擴散模型理解不可學習樣本對于數(shù)據(jù)隱私保護的脆弱性

CVer ? 來源:CVer ? 2023-11-25 14:45 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

0. 背景介紹

深度學習領域,網(wǎng)絡上充斥著大量可自由訪問的數(shù)據(jù),其中包括像ImageNet和MS-Celeb-1M數(shù)據(jù)集這樣的關鍵資源。然而,這些數(shù)據(jù)可能攜帶未經(jīng)授權收集的個人信息,引發(fā)了公眾對隱私的擔憂。人們擔心,私人數(shù)據(jù)可能會在沒有所有者授權的情況下被不當?shù)赜糜跇嫿ㄉ虡I(yè)模型

這一問題凸顯了在我們追求科技創(chuàng)新和性能提升的同時,更需要關注數(shù)據(jù)隱私和合理使用的問題。為了解決這些難題,越來越多的研究力量正在集中于使數(shù)據(jù)無法被濫用的方向。這些方法采用了一些巧妙的手段,比如向圖像中引入難以察覺的“捷徑”噪聲。通過這種方式,深度學習模型不再僅僅學習有用的語義信息,而是開始學習噪聲和標簽之間的對應關系。因此,在這種數(shù)據(jù)上的訓練得到的模型,無法準確分類干凈的數(shù)據(jù),有效地保護了用戶的隱私。這種巧妙的方法被稱為不可學習樣本(UE),也可稱之為可用性攻擊。

然而,隨著研究的深入,我們發(fā)現(xiàn)了在這種保護中的一個關鍵漏洞。如果無法利用的數(shù)據(jù)是唯一可訪問的數(shù)據(jù),那么這種保護就會起效果。但現(xiàn)實情況卻并非總是如此。數(shù)據(jù)保護人員只能在他們自己的數(shù)據(jù)中添加“不可學習”的擾動,卻無法阻止未經(jīng)授權的用戶訪問其他來源的類似的未受保護數(shù)據(jù)。

因此,通過研究新收集的未受保護數(shù)據(jù),人們?nèi)匀豢梢匝芯渴鼙Wo示例的潛在分布。以人臉識別為例,雖然不可學習的樣本不能直接用于訓練分類器,但很容易收集到新的未受保護的人臉數(shù)據(jù)。只要新收集的未受保護數(shù)據(jù)與原始干凈數(shù)據(jù)之間有足夠的相似性,仍然有可能訓練出能夠成功對原始干凈數(shù)據(jù)進行分類的分類器。

換句話說,未經(jīng)授權的用戶可以很容易地繞過數(shù)據(jù)保護,從新收集的未受保護數(shù)據(jù)中學習原始數(shù)據(jù)表示,即使這些數(shù)據(jù)可能規(guī)模很小,與干凈的數(shù)據(jù)不同,缺乏標簽注釋,并且單獨不適合訓練分類器。為了證明上述漏洞的存在,我們設計了一種新的方法,可以將不可學習的樣本轉化為可學習的樣本。

1. 方法

一個直接的解決方案是設計一個特定的訓練方案,可以在不可利用的數(shù)據(jù)上進行訓練。這是不太理想的,因為它只是對不可利用的數(shù)據(jù)進行分類,而沒有揭示潛在的干凈數(shù)據(jù),即不可學習數(shù)據(jù)的未保護版本。

我們認為,最終的對策是通過將UE再次轉變?yōu)榭蓪W習的方式來推斷/暴露底層的干凈數(shù)據(jù),這可能會導致進一步的未經(jīng)授權的利用,如標準訓練或表示學習。因此,理想的可學習的非授權數(shù)據(jù)應該獨立于訓練方案之外,可以像原始訓練數(shù)據(jù)一樣正常使用。我們將可學習的未授權數(shù)據(jù)中的示例稱為可學習示例(LEs)。

受擴散模型在噪聲凈化和圖像生成中的強大功能的啟發(fā),我們提出了一種基于擴散模型的新型凈化方法,用于生成可學習的示例。與常見的噪聲凈化(如對抗性凈化)假設訓練數(shù)據(jù)的可訪問性不同,在沒有訪問訓練數(shù)據(jù)的情況下訓練擴散模型對去除UE保護提出了關鍵挑戰(zhàn),這是現(xiàn)有凈化方法尚未探索的。

為了克服這一挑戰(zhàn),獲得可學習示例背后的關鍵思想是從其他類似數(shù)據(jù)中學習一個可學習的數(shù)據(jù)流形,然后將不可學習的示例投射到該流形上。然而,學習到的數(shù)據(jù)流形通常與原始數(shù)據(jù)流形不同,導致凈化樣本與原始干凈樣本相比語義偏差。為了緩解這一問題,我們進一步提出了一種新的聯(lián)合條件擴散凈化方法,以捕獲從不可學習樣本到相應的干凈樣本的映射。

385f7cba-8ae3-11ee-939d-92fbcf53809c.png

我們首先向不可學習圖像中逐步注入一定量的高斯噪聲,直到它們的不可學習擾動被高斯噪聲淹沒。接下來,我們?yōu)槿ピ脒^程提供了一個新的聯(lián)合條件,在保持圖像語義的同時加快了去噪速度。聯(lián)合條件由不可學習樣本與其相應去噪版本之間的像素距離和神經(jīng)感知距離參數(shù)化構成。這是基于這樣的觀察,即不可學習的樣本通常與干凈樣本在像素距離上表現(xiàn)出很小的差異,而這種差異對人類視覺來說是難以察覺的。因此,通過最小化與不可學習樣本的視覺差異,降噪后的圖像應該與原始樣本非常相似。

3874ef50-8ae3-11ee-939d-92fbcf53809c.png

2. 結果與討論

我們在許多基準數(shù)據(jù)集上廣泛評估了我們在監(jiān)督和無監(jiān)督UE上的方法,并將其與現(xiàn)有的對抗方法進行了比較。結果表明,LE是唯一一種在監(jiān)督學習和無監(jiān)督學習下都保持有效性的方法,更重要的是,我們的LE不像現(xiàn)有的對策那樣與特定的訓練方案捆綁在一起,我們的可學習樣例是獨立的,可以作為原始的干凈的訓練數(shù)據(jù)正常使用。

389a5fa6-8ae3-11ee-939d-92fbcf53809c.png

令人驚訝的是,我們發(fā)現(xiàn)即使新收集的數(shù)據(jù)(用于訓練可學習的數(shù)據(jù)流形)和干凈的數(shù)據(jù)之間存在很大的分布差異,我們的方法仍然保持有效性。換句話說,訓練數(shù)據(jù)和收集的原始數(shù)據(jù)之間的分布可以是不同的,我們?nèi)匀豢梢詫⒉豢蓪W習的例子變成可學習的。

38bfa860-8ae3-11ee-939d-92fbcf53809c.png

這無疑進一步加深了我們對UE保護脆弱性的擔憂,因為訓練數(shù)據(jù)和收集的原始數(shù)據(jù)之間的分布即使是不同的,我們?nèi)匀豢梢詫⒉豢蓪W習的樣本變成可學習的。

最后,我們做了消融實驗,說明了聯(lián)合條件凈化相比于直接應用簡單擴散模型凈化的有效性。

38d80d60-8ae3-11ee-939d-92fbcf53809c.png







審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 深度學習
    +關注

    關注

    73

    文章

    5561

    瀏覽量

    122805
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    基于數(shù)據(jù)流的脆弱性靜態(tài)分析

    為提高Java軟件的安全,針對Java程序的脆弱性分析問題,提出一種基于數(shù)據(jù)流的感染分析法,闡述了具體思路和實現(xiàn)步驟。依據(jù)該方法實現(xiàn)的分析系統(tǒng)能有效分析出Java字節(jié)碼程序
    發(fā)表于 04-11 09:43 ?11次下載

    基于熵方法的計算機網(wǎng)絡脆弱性檢測和優(yōu)化

    基于熵方法的計算機網(wǎng)絡脆弱性檢測和優(yōu)化_吳杏
    發(fā)表于 01-07 18:56 ?0次下載

    基于模糊集的隱私保護模型

    隱私保護數(shù)據(jù)發(fā)布是近年來研究的熱點技術之一,主要研究如何在數(shù)據(jù)發(fā)布中避免敏感數(shù)據(jù)的泄露,又能保證數(shù)據(jù)
    發(fā)表于 11-29 14:28 ?0次下載

    基于差分隱私數(shù)據(jù)匿名化隱私保護模型

    匿名化隱私保護模型;在利用微聚集MDAV算法劃分相似等價類并在匿名屬性過程中引入SuLQ框架設計得到g-MDAV算法,同時選用Laplace實現(xiàn)機制合理控制隱私
    發(fā)表于 12-11 16:31 ?0次下載
    基于差分<b class='flag-5'>隱私</b>的<b class='flag-5'>數(shù)據(jù)</b>匿名化<b class='flag-5'>隱私</b><b class='flag-5'>保護</b><b class='flag-5'>模型</b>

    電網(wǎng)脆弱性綜合評估

    電網(wǎng)脆弱性評估對預防連鎖故障具有重要意義。綜合考慮系統(tǒng)潮流分布、系統(tǒng)電壓穩(wěn)定性以及電網(wǎng)拓撲特性等因素構建了電網(wǎng)脆弱性評估模型。最小奇異值可定量表示系統(tǒng)電壓與電壓靜穩(wěn)臨界點的距離,表征節(jié)點電壓穩(wěn)定狀態(tài)
    發(fā)表于 12-22 15:09 ?2次下載
    電網(wǎng)<b class='flag-5'>脆弱性</b>綜合評估

    網(wǎng)絡脆弱性擴散分析方法

    網(wǎng)絡脆弱性評估是一種主動防范技術,意在攻擊發(fā)生之前對安全態(tài)勢進行分析進而制定防御措施,但傳統(tǒng)的定量分析模型不能對實體間動態(tài)交互關系有很好的展現(xiàn),而且大都不能得出風險擴散的全局化結果。將脆弱性
    發(fā)表于 01-05 15:21 ?0次下載
    網(wǎng)絡<b class='flag-5'>脆弱性</b><b class='flag-5'>擴散</b>分析方法

    基于位置偏移產(chǎn)生關聯(lián)概率不可區(qū)分的隱私保護方法

    產(chǎn)生關聯(lián)概率不可區(qū)分的隱私保護方法,并證明了這種方法的隱私保護效力。最后,通過實驗進一步驗證所提
    發(fā)表于 01-15 15:30 ?0次下載

    一種非脆弱性同步保性能控制方法

    針對一類時變時滯復雜網(wǎng)絡系統(tǒng),提出了一種非脆弱性同步保性能控制方法。在假設非線性向量函數(shù)f(x)可微條件下,通過Jacobi矩陣方法進行線性化處理,余項滿足匹配條件,設計具有增益攝動的非脆弱性
    發(fā)表于 01-17 11:40 ?0次下載

    改進DEAHP的支路綜合脆弱性評估

    支路抗干擾能力和影響力的指標集;基于改進的帶層次分析法約束錐的數(shù)據(jù)包絡分析模型進行多指標綜合,得到了既考慮主觀偏好又考慮客觀數(shù)據(jù)的支路綜合脆弱性評估指標,構建了多層次多角度的支路
    發(fā)表于 02-28 09:46 ?2次下載

    基于鏈路已用率的電力通信網(wǎng)脆弱性分析

    脆弱性進行了分析。然后將網(wǎng)絡運行時的主要參數(shù)歸結為數(shù)據(jù)在鏈路中的帶寬,對基于鏈路已用率的網(wǎng)絡運行脆弱性進行分析,找到網(wǎng)絡的薄弱點。最后將結構脆弱性和運行
    發(fā)表于 02-28 15:49 ?0次下載

    SCADA系統(tǒng)該如何解決脆弱性泄露問題?

    脆弱性泄露具有多種性質(zhì),在信息安全領域中歷史悠久。雖然安全專業(yè)人員有時支持以緩和形式管理脆弱性泄露,SCADA系統(tǒng)更多相關結論的出現(xiàn),使得許多安全專業(yè)人員重新對他們的觀點進行思考。利用熟練的技術風險管理方法以及對風險模型的更為細
    發(fā)表于 09-20 17:06 ?1481次閱讀

    人工智能:機器學習模型存在著對抗樣本的安全威脅

    近年來,隨著人工智能的蓬勃發(fā)展,機器學習技術在網(wǎng)絡入侵檢測領域得到了廣泛的應用。然而,機器學習模型存在著對抗樣本的安全威脅,導致該類網(wǎng)絡入侵檢測器在對抗環(huán)境中呈現(xiàn)出特定的
    的頭像 發(fā)表于 08-27 16:10 ?3887次閱讀
    人工智能:機器<b class='flag-5'>學習</b><b class='flag-5'>模型</b>存在著對抗<b class='flag-5'>樣本</b>的安全威脅

    基于深度學習的自然語言處理對抗樣本模型

    深度學習模型被證明存在脆弱性并容易遭到對抗樣本的攻擊,但目前對于對抗樣本的研究主要集中在計算機視
    發(fā)表于 04-20 14:36 ?39次下載
    基于深度<b class='flag-5'>學習</b>的自然語言處理對抗<b class='flag-5'>樣本</b><b class='flag-5'>模型</b>

    通過擴散模型理解不可學習樣本對于數(shù)據(jù)隱私保護脆弱性

    一個直接的解決方案是設計一個特定的訓練方案,可以在不可利用的數(shù)據(jù)上進行訓練。這是不太理想的,因為它只是對不可利用的數(shù)據(jù)進行分類,而沒有揭示潛在的干凈
    的頭像 發(fā)表于 11-25 14:46 ?979次閱讀
    <b class='flag-5'>通過</b><b class='flag-5'>擴散</b><b class='flag-5'>模型</b><b class='flag-5'>理解</b><b class='flag-5'>不可學習</b><b class='flag-5'>樣本</b><b class='flag-5'>對于</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>隱私</b><b class='flag-5'>保護</b>的<b class='flag-5'>脆弱性</b>

    “新一代”漏洞掃描管理系統(tǒng):脆弱性管理平臺提高自身健壯

    。 正是如此,國內(nèi)專注于保密與非密領域的分級保護、等級保護、業(yè)務連續(xù)安全和大數(shù)據(jù)安全產(chǎn)品解決方案與相關技術研究開發(fā)的領軍企業(yè)——國聯(lián)易安研究團隊推出“新一代”漏洞掃描管理系統(tǒng):國聯(lián)統(tǒng)
    的頭像 發(fā)表于 04-16 11:16 ?524次閱讀