一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

新方法:用知識蒸餾給數(shù)據(jù)集瘦身

OpenCV學(xué)堂 ? 來源:量子位 ? 作者:量子位 ? 2022-07-10 09:52 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群


	

這兩天,推特上一個任務(wù)懸賞火得一塌糊涂。

一家AI公司提供25萬美金(折合人民幣約167萬元),懸賞什么任務(wù)能讓模型越大、性能反而越差。

b24de934-fecc-11ec-ba43-dac502259ad0.png

評論區(qū)里已經(jīng)討論得熱火朝天了。

b267ad60-fecc-11ec-ba43-dac502259ad0.png

不過這事兒倒也不是單純整活,而是為了進(jìn)一步探索大模型。

畢竟,這兩年大家越發(fā)意識到,AI模型不能單純比“大”。

一方面,隨著模型的規(guī)模越來越大,訓(xùn)練付出的成本開始呈現(xiàn)指數(shù)型增長;

b2793e72-fecc-11ec-ba43-dac502259ad0.jpg

另一方面,模型性能的提升也已經(jīng)逐漸到達(dá)瓶頸期,哪怕想要讓誤差再下降1%,都需要更多的數(shù)據(jù)集增量和計算增量。

比如對于Transformer而言,交叉熵?fù)p失想要從3.4奈特降低到2.8奈特,就需要原本10倍量的訓(xùn)練數(shù)據(jù)。

針對這些問題,AI學(xué)者們已經(jīng)在從各種方向上找解決路子了。

Meta斯坦福的學(xué)者們,最近想到了從數(shù)據(jù)集上切入。

他們提出,對數(shù)據(jù)集進(jìn)行知識蒸餾,使得數(shù)據(jù)集規(guī)模雖小,但還能保持模型性能不下降。

實驗驗證,在剪掉ImageNet 20%的數(shù)據(jù)量后,ResNets表現(xiàn)和使用原本數(shù)據(jù)時的正確率相差不大。

研究人員表示,這也為AGI實現(xiàn)找出了一條新路子。

b2845424-fecc-11ec-ba43-dac502259ad0.png

超大數(shù)據(jù)集的效率并不高

本文提出的辦法,其實就是對原本的數(shù)據(jù)集進(jìn)行優(yōu)化精簡。

研究人員表示,過去許多方法都表明,許多訓(xùn)練示例是高度冗余的,理論上可以把數(shù)據(jù)集“剪”得更小。

而且最近也有研究提出了一些指標(biāo),可以根據(jù)訓(xùn)練示例的難度或重要性對它們進(jìn)行排序,并通過保留其中一些難度高的示例,就能完成數(shù)據(jù)修剪。

基于前人的發(fā)現(xiàn)和研究,此次學(xué)者們進(jìn)一步提出了一些可具體操作的方法。

首先,他們提出了一種數(shù)據(jù)分析方法,可以讓模型只學(xué)習(xí)部分?jǐn)?shù)據(jù),就能實現(xiàn)同等的性能。

b2956eb2-fecc-11ec-ba43-dac502259ad0.png

通過數(shù)據(jù)分析,研究人員初步得出結(jié)論:

一個數(shù)據(jù)集怎樣修剪效果最好?這和它本身的規(guī)模有關(guān)。

初始數(shù)據(jù)量越多,越應(yīng)該保留難度高的示例;

初始數(shù)據(jù)量越少,則應(yīng)該保留難度低的示例。

b29f7cfe-fecc-11ec-ba43-dac502259ad0.png

而在保留困難示例進(jìn)行數(shù)據(jù)修剪后,模型和數(shù)據(jù)規(guī)模的對應(yīng)關(guān)系,可以打破冪律分布。

常被提起的二八定律就是基于冪律提出的。

即20%的數(shù)據(jù)會影響80%的結(jié)果。

同時在此情況下,還能找到一個處于帕累托最優(yōu)的下的極值。

這里所說的帕累托最優(yōu)是指資源分配的一種理想狀態(tài)。

它假設(shè)固定有一群人和可分配的資源,從一種分配狀態(tài)調(diào)整到另一種分配狀態(tài),在沒有使任何一個人變差的前提下,至少使得一個人變得更好。

在本文中,調(diào)整分配狀態(tài)即可理解為,修剪多少比例的數(shù)據(jù)集。

然后,研究人員進(jìn)行了實驗來驗證這一理論。

b2c326f4-fecc-11ec-ba43-dac502259ad0.png

從實驗結(jié)果來看,當(dāng)數(shù)據(jù)集越大,修剪后的效果就越明顯。

在SVHN、CIFAR-10、ImageNet幾個數(shù)據(jù)集上,ResNet的錯誤率總體和數(shù)據(jù)集修剪規(guī)模呈反比。

在ImageNet上可以看到,數(shù)據(jù)集規(guī)模保留80%的情況下,和原本數(shù)據(jù)集訓(xùn)練下的錯誤率基本相同。

這一曲線也逼近了帕累托最優(yōu)。

接下來,研究人員聚焦在ImageNet上,對10種不同情況進(jìn)行了大規(guī)?;鶞?zhǔn)測試。

結(jié)果表明,隨機修剪以及一些修剪指標(biāo),在ImageNet上的表現(xiàn)并不夠好。

b2d27fbe-fecc-11ec-ba43-dac502259ad0.png

所以更進(jìn)一步,研究人員還提出了一種自監(jiān)督方法來修剪數(shù)據(jù)。

也就是知識蒸餾(教師學(xué)生模型),這是模型壓縮的一種常見方法。

b2e464fe-fecc-11ec-ba43-dac502259ad0.png

結(jié)果顯示,在自監(jiān)督方法下,它在找數(shù)據(jù)集中簡單/困難示例上的表現(xiàn)都還不錯。

b2f3c05c-fecc-11ec-ba43-dac502259ad0.png

使用自監(jiān)督方法修剪數(shù)據(jù)后,正確率明顯提高(圖C中淺藍(lán)色線)。

b308ec34-fecc-11ec-ba43-dac502259ad0.png

還存在一些問題

不過在論文中,研究人員也提到,雖然通過如上方法可以在不犧牲性能的情況下修剪數(shù)據(jù)集,但是有些問題仍舊值得關(guān)注。

比如數(shù)據(jù)集縮小后,想要訓(xùn)練出同等性能的模型,需要的時間可能會更長。

因此,在進(jìn)行數(shù)據(jù)集修剪時,應(yīng)該平衡縮減規(guī)模和訓(xùn)練增長時間兩方面因素。

與此同時,對數(shù)據(jù)集進(jìn)行修剪,勢必會喪失一些群體的樣本,由此也可能造成模型在某一個方面出現(xiàn)弊端。

在這方面會容易引起道德倫理方面的問題。

研究團(tuán)隊

本文作者之一Surya Ganguli,是量子神經(jīng)網(wǎng)絡(luò)科學(xué)家。

論文地址: https://arxiv.org/abs/2206.14486

審核編輯 :李倩
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4814

    瀏覽量

    103539
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35065

    瀏覽量

    279379
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1224

    瀏覽量

    25434

原文標(biāo)題:剪掉ImageNet 20%數(shù)據(jù)量,模型性能不下降!Meta斯坦福等提出新方法,用知識蒸餾給數(shù)據(jù)集瘦身

文章出處:【微信號:CVSCHOOL,微信公眾號:OpenCV學(xué)堂】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    高光譜成像技術(shù):植物“看病”的新“眼睛”——作物病蟲害監(jiān)測新方法

    想象一下,不用走到田里一片片葉子檢查,也不用等作物明顯枯萎了才發(fā)現(xiàn)問題,而是通過“看”作物反射的光線,就能早期發(fā)現(xiàn)它是不是生病或長蟲了。這就是 光譜技術(shù)在作物病蟲害監(jiān)測 上的神奇應(yīng)用!它就像植物
    的頭像 發(fā)表于 07-11 17:39 ?180次閱讀
    高光譜成像技術(shù):<b class='flag-5'>給</b>植物“看病”的新“眼睛”——作物病蟲害監(jiān)測<b class='flag-5'>新方法</b>

    無刷直流電機反電勢過零檢測新方法

    新方法。在三相采樣等效電路上分別并聯(lián)一組三極管控制的電阻分壓開關(guān)電路,參考電機轉(zhuǎn)速線性調(diào)節(jié)控制信號占空比,以此控制三極管通斷,從而調(diào)節(jié)電阻分樂開關(guān)電路阻值,可以避免高速時反電勢幅值高于檢測電路供電電壓
    發(fā)表于 06-26 13:50

    數(shù)據(jù)下載失敗的原因?

    數(shù)據(jù)下載失敗什么原因太大了嗎,小的可以下載,想把大的下載去本地訓(xùn)練報錯網(wǎng)絡(luò)錯誤 大的數(shù)據(jù)多大?數(shù)據(jù)量有多少?
    發(fā)表于 06-18 07:04

    大連理工提出基于Wasserstein距離(WD)的知識蒸餾方法

    的機制,應(yīng)用于中間層蒸餾時存在問題,其無法處理不重疊的分布且無法感知底層流形的幾何結(jié)構(gòu)。 為了解決這些問題,大連理工大學(xué)的研究人員提出了一種基于 Wasserstein 距離(WD)的知識蒸餾
    的頭像 發(fā)表于 01-21 09:45 ?633次閱讀

    石墨烯制備的新方法

    盡管石墨烯和石墨烯相關(guān)的二維材料(GR2Ms)在各種應(yīng)用中具有很大的潛力,但目前大規(guī)模生產(chǎn)它們的方法嚴(yán)重依賴于石墨礦物和能源密集型技術(shù)。 浙江大學(xué)郭慶輝研究員(現(xiàn)入職清華大學(xué))、J. Fraser
    的頭像 發(fā)表于 12-30 17:55 ?685次閱讀
    石墨烯制備的<b class='flag-5'>新方法</b>

    大華股份榮獲中國創(chuàng)新方法大賽一等獎

    近日,備受矚目的2024年中國創(chuàng)新方法大賽全國總決賽在重慶圓滿落下帷幕。此次大賽由中國科協(xié)與重慶市人民政府聯(lián)合主辦,吸引了眾多創(chuàng)新企業(yè)和團(tuán)隊參與,共同展示創(chuàng)新成果,角逐榮譽獎項。 在這場創(chuàng)新盛宴中
    的頭像 發(fā)表于 12-27 14:50 ?550次閱讀

    基于遺傳算法的QD-SOA設(shè)計新方法

    了QD-SOA的設(shè)計,提出了一種基于遺傳算法的QD-SOA設(shè)計新方法。由于具有用于設(shè)計的模型是必不可少的,因此在第一步中獲得數(shù)值模型。然后,利用從數(shù)值模型中采樣的訓(xùn)練數(shù)據(jù)建立人工神經(jīng)網(wǎng)絡(luò)模型。實驗表明,該神經(jīng)模型具有較高的精度和較
    的頭像 發(fā)表于 12-17 09:58 ?452次閱讀
    基于遺傳算法的QD-SOA設(shè)計<b class='flag-5'>新方法</b>

    一種降低VIO/VSLAM系統(tǒng)漂移的新方法

    本文提出了一種新方法,通過使用點到平面匹配將VIO/VSLAM系統(tǒng)生成的稀疏3D點云與數(shù)字孿生體進(jìn)行對齊,從而實現(xiàn)精確且全球一致的定位,無需視覺數(shù)據(jù)關(guān)聯(lián)。所提方法為VIO/VSLAM系統(tǒng)提供了緊密
    的頭像 發(fā)表于 12-13 11:18 ?692次閱讀
    一種降低VIO/VSLAM系統(tǒng)漂移的<b class='flag-5'>新方法</b>

    大華股份榮獲2024年中國創(chuàng)新方法大賽一等獎

    近日,由中國科協(xié)、重慶市人民政府舉辦的2024年中國創(chuàng)新方法大賽全國總決賽在重慶落下帷幕。大華股份靈活運用創(chuàng)新方法、突破行業(yè)性技術(shù)難題,憑借“不懼強光,分毫必現(xiàn),基于TRIZ的強逆光銳捕技術(shù)”項目,斬獲全國一等獎。
    的頭像 發(fā)表于 12-04 17:19 ?751次閱讀

    長安汽車榮獲2024年中國創(chuàng)新方法大賽一等獎

    2024年由中國科學(xué)技術(shù)協(xié)會、重慶市人民政府共同主辦的中國創(chuàng)新方法大賽于近日在重慶落下帷幕。大賽以“發(fā)展新質(zhì)生產(chǎn)力,促進(jìn)高質(zhì)量發(fā)展”為主題,秉承“企業(yè)出題,帶題參賽,以賽促學(xué),以賽促”宗旨,致力于
    的頭像 發(fā)表于 11-25 16:28 ?665次閱讀

    利用全息技術(shù)在硅晶圓內(nèi)部制造納米結(jié)構(gòu)的新方法

    本文介紹了一種利用全息技術(shù)在硅晶圓內(nèi)部制造納米結(jié)構(gòu)的新方法。 研究人員提出了一種在硅晶圓內(nèi)部制造納米結(jié)構(gòu)的新方法。傳統(tǒng)上,晶圓上的微結(jié)構(gòu)加工,僅限于通過光刻技術(shù)在晶圓表面加工納米結(jié)構(gòu)。 然而,除了晶
    的頭像 發(fā)表于 11-18 11:45 ?734次閱讀

    上海光機所提出強激光產(chǎn)生高能量子渦旋態(tài)電子新方法

    近期,中國科學(xué)院上海光學(xué)精密機械研究所強場激光物理國家重點實驗室研究團(tuán)隊發(fā)展了包括軌道角動量量子數(shù)的QED散射理論,并提出強激光產(chǎn)生高能量子渦旋態(tài)電子的新方法。相關(guān)成果以“Generation
    的頭像 發(fā)表于 10-23 10:41 ?493次閱讀
    上海光機所提出強激光產(chǎn)生高能量子渦旋態(tài)電子<b class='flag-5'>新方法</b>

    保護(hù)4-20 mA,±20-mA模擬輸入的新方法

    電子發(fā)燒友網(wǎng)站提供《保護(hù)4-20 mA,±20-mA模擬輸入的新方法.pdf》資料免費下載
    發(fā)表于 09-24 09:27 ?0次下載
    保護(hù)4-20 mA,±20-mA模擬輸入的<b class='flag-5'>新方法</b>

    實踐JLink 7.62手動增加新MCU型號支持新方法

    大家好,我是痞子衡,是正經(jīng)搞技術(shù)的痞子。今天痞子衡大家分享的是實踐JLink 7.62手動增加新MCU型號支持新方法。
    的頭像 發(fā)表于 08-08 15:25 ?1373次閱讀
    實踐JLink 7.62手動增加新MCU型號支持<b class='flag-5'>新方法</b>

    一種無透鏡成像的新方法

    使用OAM-HHG EUV光束對高度周期性結(jié)構(gòu)進(jìn)行成像的EUV聚光顯微鏡 為了研究微電子或光子元件中的納米級圖案,一種基于無透鏡成像的新方法可以實現(xiàn)近乎完美的高分辨率顯微鏡。 層析成像是一種強大的無
    的頭像 發(fā)表于 07-19 06:20 ?762次閱讀
    一種無透鏡成像的<b class='flag-5'>新方法</b>