一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

梯度的獨特分布給量化訓練帶來了極大挑戰(zhàn)

lhl545545 ? 來源:商湯科技 ? 作者:商湯科技 ? 2020-06-15 14:32 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

商湯科技CVPR 2020錄用論文在多個領域實現(xiàn)突破,包括:對抗式生成模型、三維點云理解與分析、訓練加速與模型量化、視頻理解與分析、網(wǎng)絡結構搜索等。以下為商湯及商湯聯(lián)合實驗室入選CVPR 2020的代表性論文。

▎研究方向:對抗式生成模型

代表性論文:《對人臉生成模型的隱空間可解釋性分析》鏈接:https://arxiv.org/abs/1907.10786

近年來,對抗生成網(wǎng)絡(GAN)的快速發(fā)展極大地增強了圖像生成的質量,也因此得到了越來越廣泛的應用。越來越多基于GAN的模型被提出來提高生成質量以及訓練穩(wěn)定性,但是對于生成模型的可解釋性還鮮有研究。

本文以人臉生成模型為例,對GAN的隱空間進行了深入分析,目標在于理解GAN是如何將一個隨機噪聲轉化為一張高質量圖片的。本文提出了一種簡單而通用的技術InterFaceGAN,用于在潛在空間中進行語義人臉編輯,可控制姿勢以及其他面部屬性,例如性別、年齡、眼鏡等,還能夠糾正GAN造成的偽影。

代表性論文:《ACGPN:基于圖像的自適應生成保留虛擬換裝》鏈接:https://arxiv.org/abs/2003.05863

本文關注基于圖像的虛擬換裝任務。現(xiàn)有方法取得了很多突破但仍然存在很大問題:(1)人物的肢體仍然是模糊的;(2)對于下裝很難做到清楚的保留;(3)衣服的紋理容易產(chǎn)生過度形變。

為此本文利用一種語義敏感的方法,自適應的判斷哪部分圖像是應該保留的,解決了現(xiàn)有方法中無法對人物肢體與衣服有遮擋的情況的建模,極大程度地降低了生成結果中的偽影以及模糊細節(jié);并通過引入仿射變換的共線性等性質,對變形衣服中的薄板樣條插值變換起到約束,使得Logo和花紋不易扭曲變形。 ▎研究方向:三維點云理解與分析 代表性論文:《PV-RCNN: 基于Point-Voxel點云特征深度融合的3D物體檢測算法》鏈接:https://arxiv.org/abs/1912.13192

本文關注基于點云數(shù)據(jù)的三維物體檢測任務。文章提出了一個高性能的3D物體檢測框架PV-RCNN,其通過構造Set Abstraction特征抽象操作將基于Point與Voxel的點云特征提取算法分別在Voxel-to-Keypoint階段和Keypoint-to-RoIGrid 階段深度融合,使其同時擁有可變感受野、精確的點云位置信息以及高召回率,從而有效提升3D物體檢測的性能。

梯度的獨特分布給量化訓練帶來了極大挑戰(zhàn)

實驗部分,PV-RCNN分別在競爭激烈的自動駕駛數(shù)據(jù)集KITTI以及更大規(guī)模的Waymo數(shù)據(jù)集上得到了驗證。在KITTI數(shù)據(jù)集的3D物體檢測榜Car類別上,PV-RCNN大幅領先其他所有算法,在三個難度上均取得了第一名。在更大規(guī)模的Waymo數(shù)據(jù)集上,PV-RCNN同樣在所有難度以及不同距離上超越了現(xiàn)有算法,最高mAP增幅達近7個點。

▎研究方向:訓練加速與模型量化

代表性論文:《用于加速卷積神經(jīng)網(wǎng)絡訓練過程INT8訓練技術》鏈接//arxiv.org/abs/1912.12607

卷積神經(jīng)網(wǎng)絡訓練過程需要耗費大量的計算資源和時間,而各種深度學習硬件都提供非常高效的INT8計算支持。當把INT8計算應用到訓練中同時加速網(wǎng)絡的前傳和反傳過程時,梯度的獨特分布給量化訓練帶來了極大挑戰(zhàn)。

為了解決梯度量化帶來的精度損失,論文進行了量化訓練收斂穩(wěn)定性的理論分析并基于此提出了“誤差敏感的學習率調節(jié)”和“基于方向自適應的梯度截斷”方法,將兩個方法在圖像分類數(shù)據(jù)集ImageNet、CIFAR和目標檢測數(shù)據(jù)集PASCAL VOC、COCO上進行實驗,均取得了極少的精度損失。

梯度的獨特分布給量化訓練帶來了極大挑戰(zhàn)

實驗中也驗證了該方法對Inception、MobileNet等不同網(wǎng)絡結構的通用性。為了保證更高的加速比,論文還提出使用周期更新、量化卷積融合等技術來減少量化操作帶來的時間開銷。通過在GTX1080TI上實測,可以提升22%的訓練過程。

研究方向:視頻理解與分析 代表性論文:《TAPOS: 基于時序動作解析理解動作內(nèi)部和不同動作間的語義》

動作理解是計算機視覺領域的核心問題之一,也是許多其他任務的基石,如智能視頻檢索,基于視覺的機器人學等。本文發(fā)現(xiàn),人本身對于動作序列中子動作模式的轉換是比較敏感的。

在這篇工作中,本文提出了一種時域解析器,可以挖掘人體動作中的子動作模式,并根據(jù)挖掘出的子動作模式對較復雜的動作序列進行時域上的解析。這種時域解析器不但能對一個給定的動作序列進行子動作邊界劃分,還可以找尋大量不同動作序列中相同的子動作模式。本文發(fā)現(xiàn),對較復雜動作序列良好的時域解析可以幫助提升一些較為高層的任務的準確率,如動作識別等。

梯度的獨特分布給量化訓練帶來了極大挑戰(zhàn)

▎研究方向:網(wǎng)絡結構搜索 代表性論文:《最高加速400倍,探索更好的網(wǎng)絡評價方法EcoNas》鏈接:https://arxiv.org/abs/2001.01233 許多網(wǎng)絡搜索算法需要耗費大量的算力,而這些算力絕大多數(shù)集中在候選網(wǎng)絡(Candidate)的評估上。同樣地,由于算力的限制,候選網(wǎng)絡的評估往往需要在代理環(huán)境(Proxy)下進行,如較短的訓練周期數(shù)。雖然每個NAS算法都要用到代理環(huán)境,但是代理環(huán)境對子網(wǎng)絡評估的影響仍然是未知的。 本文的工作首次系統(tǒng)研究了不同代理參數(shù)對網(wǎng)絡評估的影響。作者發(fā)現(xiàn),使用更可靠的代理環(huán)境不僅可以極大壓縮計算量,也有助于搜到更好的模型?;趯Υ憝h(huán)境的研究,作者提出了一個層次化的搜索方法,EcoNAS在將進化算法加速400倍的同時,得到了更好的網(wǎng)絡結構。

梯度的獨特分布給量化訓練帶來了極大挑戰(zhàn)

同樣地,作者發(fā)現(xiàn)可靠的代理環(huán)境也可以被用于其他搜索算法中,例如權重共享算法,在不影響精度的同時,使得搜索效率進一步提升。
責任編輯:pj

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 3D
    3D
    +關注

    關注

    9

    文章

    2958

    瀏覽量

    110591
  • GaN
    GaN
    +關注

    關注

    19

    文章

    2194

    瀏覽量

    76612
  • 商湯科技
    +關注

    關注

    8

    文章

    562

    瀏覽量

    36769
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    瑞芯微模型量化文件構建

    模型是一張圖片輸入時,量化文件如上圖所示。但是我現(xiàn)在想量化deepprivacy人臉匿名模型,他的輸入是四個輸入。該模型訓練時數(shù)據(jù)集只標注了人臉框和關鍵點,該模型的預處理是放到模型外的,不在模型
    發(fā)表于 06-13 09:07

    OCR識別訓練完成后的是空壓縮包,為什么?

    OCR識別 一共弄了26張圖片,都標注好了,點擊開始訓練,顯示訓練成功了,也將壓縮包發(fā)到郵箱了,下載下來后,壓縮包里面是空的 OCR圖片20幾張圖太少了。麻煩您多添加點,參考我們的ocr識別訓練數(shù)據(jù)集 請問
    發(fā)表于 05-28 06:46

    是否可以輸入隨機數(shù)據(jù)集來生成INT8訓練量化模型?

    無法確定是否可以輸入隨機數(shù)據(jù)集來生成 INT8 訓練量化模型。
    發(fā)表于 03-06 06:45

    分布式 IO:礦山砂石裝備高效控制的新引擎

    在砂石與礦山行業(yè)這片充滿挑戰(zhàn)與機遇的領域,裝備的高效運行和精準控制一直是企業(yè)追求的核心目標。隨著科技的飛速發(fā)展,明達技術推出的MR30分布式 IO 模塊作為一種先進的控制技術,正逐漸嶄露頭角,為砂石、礦山裝備的升級改造帶來了新的
    的頭像 發(fā)表于 02-12 17:08 ?335次閱讀

    基于梯度下降算法的三元鋰電池循環(huán)壽命預測

    不同比例、范圍的訓練集與測試集劃分?;跈C器學習的梯度下降算法對訓練集進行模型訓練,以迭代后的權重值、偏置值進行結果預測并與試驗數(shù)據(jù)進行對比。結果表明:適宜參數(shù)下的
    的頭像 發(fā)表于 01-16 10:19 ?491次閱讀
    基于<b class='flag-5'>梯度</b>下降算法的三元鋰電池循環(huán)壽命預測

    大模型訓練框架(五)之Accelerate

    Hugging Face 的 Accelerate1是一個用于簡化和加速深度學習模型訓練的庫,它支持在多種硬件配置上進行分布訓練,包括 CPU、GPU、TPU 等。Accelerate 允許用戶
    的頭像 發(fā)表于 01-14 14:24 ?678次閱讀

    AI模型部署邊緣設備的奇妙之旅:如何實現(xiàn)手寫數(shù)字識別

    。 這種方法通常能保留更多的模型精度,因為模型已經(jīng)在訓練中學會了應對量化帶來的變化。 優(yōu)點: 顯著降低模型的存儲需求和計算復雜度。 在特定硬件(如GPU、NPU)上運行時,可以大幅提升推理速度。
    發(fā)表于 12-06 17:20

    協(xié)調控制器在分布式光伏領域如何發(fā)揮最優(yōu)控制策略進行調節(jié)控制?

    電力系統(tǒng)的穩(wěn)定運行帶來了挑戰(zhàn)。為了應對這些挑戰(zhàn),協(xié)調控制器在分布式光伏領域的應用顯得尤為重要。本文將深入探討協(xié)調控制器在
    的頭像 發(fā)表于 11-22 14:33 ?799次閱讀
    協(xié)調控制器在<b class='flag-5'>分布</b>式光伏領域如何發(fā)揮最優(yōu)控制策略進行調節(jié)控制?

    AI客戶服務帶來了哪些好處

    如今,各行各業(yè)的客戶服務部門都面臨著呼叫量增加、客服人員流失率高、人才短缺以及客戶期望不斷變化等挑戰(zhàn)。
    的頭像 發(fā)表于 11-20 09:22 ?904次閱讀

    分布式通信的原理和實現(xiàn)高效分布式通信背后的技術NVLink的演進

    大型模型的大小已經(jīng)超出了單個 GPU 的范圍。所以就需要實現(xiàn)跨多個 GPU 的模型訓練,這種訓練方式就涉及到了分布式通信和 NVLink。 當談及分布式通信和 NVLink 時,我們進
    的頭像 發(fā)表于 11-18 09:39 ?1256次閱讀
    <b class='flag-5'>分布</b>式通信的原理和實現(xiàn)高效<b class='flag-5'>分布</b>式通信背后的技術NVLink的演進

    訓練RNN時如何避免梯度消失

    有效的訓練。為了解決這個問題,可以采取以下幾種方法: 梯度裁剪(Gradient Clipping) 梯度裁剪是限制梯度大小的技術,通過設置梯度
    的頭像 發(fā)表于 11-15 10:01 ?1004次閱讀

    激光打靶射擊訓練系統(tǒng) DW-S602提供軍事訓練效率

    分析和反饋,幫助訓練者提高射擊技能和戰(zhàn)斗反應能力。 隨著現(xiàn)代科技的飛速發(fā)展,公安武警及新兵訓練領域也迎來了技術革新的浪潮。其中,模擬輕武器射擊訓練系統(tǒng)激光打靶設備以其
    的頭像 發(fā)表于 11-03 09:54 ?834次閱讀

    Meta發(fā)布Llama 3.2量化版模型

    近日,Meta在開源Llama 3.2的1B與3B模型后,再次為人工智能領域帶來了新進展。10月24日,Meta正式推出了這兩個模型的量化版本,旨在進一步優(yōu)化模型性能,拓寬其應用場景。
    的頭像 發(fā)表于 10-29 11:05 ?829次閱讀

    WBG 器件柵極驅動器電源帶來挑戰(zhàn)

    碳化硅 (SiC) 和氮化鎵 (GaN) 器件的柵極驅動器電源必須滿足這些寬帶隙半導體的獨特偏置要求。本文將討論在 SiC 和 GaN 應用中設計柵極驅動器電源時需要考慮的關鍵因素。 圖 1
    發(fā)表于 09-27 15:05 ?1059次閱讀
    WBG 器件<b class='flag-5'>給</b>柵極驅動器電源<b class='flag-5'>帶來</b>的<b class='flag-5'>挑戰(zhàn)</b>

    AI普及嵌入式設計人員帶來挑戰(zhàn)

    探討了人工智能(AI)的普及嵌入式設計人員帶來的新挑戰(zhàn)。在創(chuàng)建“邊緣機器學習(ML)”應用時,設計人員必須確保其能有效運行,同時最大限度地降低處理器和存儲開銷,以及物聯(lián)網(wǎng)(IoT)設備的功耗
    發(fā)表于 08-22 14:20 ?875次閱讀
    AI普及<b class='flag-5'>給</b>嵌入式設計人員<b class='flag-5'>帶來</b>新<b class='flag-5'>挑戰(zhàn)</b>