如何優(yōu)化深度學(xué)習(xí)模型?

【導(dǎo)讀】大家好，我是泳魚。本文匯總了深度學(xué)習(xí)煉丹的常見技巧，如超參數(shù)學(xué)習(xí)率選擇、權(quán)重初始化以及數(shù)據(jù)模型層面的優(yōu)化。

尋找合適的學(xué)習(xí)率(learning rate)

學(xué)習(xí)率是一個非常非常重要的超參數(shù)（關(guān)于超參數(shù)的系統(tǒng)性優(yōu)化可見：深度學(xué)習(xí)調(diào)參(煉丹)的權(quán)威指南?。。。@個參數(shù)呢，面對不同規(guī)模、不同batch-size、不同優(yōu)化方式、不同數(shù)據(jù)集，其最合適的值都是不確定的，我們無法光憑經(jīng)驗來準(zhǔn)確地確定lr的值，我們唯一可以做的，就是在訓(xùn)練中不斷尋找最合適當(dāng)前狀態(tài)的學(xué)習(xí)率。

比如下圖利用fastai中的lr_find()函數(shù)尋找合適的學(xué)習(xí)率，根據(jù)下方的學(xué)習(xí)率-損失曲線得到此時合適的學(xué)習(xí)率為1e-2。

推薦一篇fastai首席設(shè)計師「Sylvain Gugger」的一篇博客：How Do You Find A Good Learning Rate[1]

以及相關(guān)的論文Cyclical Learning Rates for Training Neural Networks[2]。

learning-rate與batch-size的關(guān)系

一般來說，越大的batch-size使用越大的學(xué)習(xí)率。

原理很簡單，越大的batch-size意味著我們學(xué)習(xí)的時候，收斂方向的confidence越大，我們前進的方向更加堅定，而小的batch-size則顯得比較雜亂，毫無規(guī)律性，因為相比批次大的時候，批次小的情況下無法照顧到更多的情況，所以需要小的學(xué)習(xí)率來保證不至于出錯。

可以看下圖損失Loss與學(xué)習(xí)率Lr的關(guān)系：

在顯存足夠的條件下，最好采用較大的batch-size進行訓(xùn)練，找到合適的學(xué)習(xí)率后，可以加快收斂速度。

另外，較大的batch-size可以避免batch normalization出現(xiàn)的一些小問題，參考如下Pytorch庫Issue[3]

權(quán)重初始化

權(quán)重初始化相比于其他的trick來說在平常使用并不是很頻繁。

因為大部分人使用的模型都是預(yù)訓(xùn)練模型，使用的權(quán)重都是在大型數(shù)據(jù)集上訓(xùn)練好的模型，當(dāng)然不需要自己去初始化權(quán)重了。只有沒有預(yù)訓(xùn)練模型的領(lǐng)域會自己初始化權(quán)重，或者在模型中去初始化神經(jīng)網(wǎng)絡(luò)最后那幾個全連接層的權(quán)重。

常用的權(quán)重初始化算法是「kaiming_normal」或者「xavier_normal」。

相關(guān)論文：

Delving deep into rectifiers: Surpassing human-level performance on ImageNet classification[4]

Understanding the difficulty of training deep feedforward neural networks[5]

Xavier初始化論文[6]

He初始化論文[7]

不初始化可能會減慢收斂速度，影響收斂效果。

以下??為網(wǎng)絡(luò)的輸入大小，?為網(wǎng)絡(luò)的輸出大小，?為??或

uniform均勻分布初始化：

Xavier初始法，適用于普通激活函數(shù)(tanh, sigmoid)：

He初始化，適用于ReLU：

normal高斯分布初始化，其中stdev為高斯分布的標(biāo)準(zhǔn)差，均值設(shè)為0：

Xavier初始法，適用于普通激活函數(shù) (tanh,sigmoid)：

He初始化，適用于ReLU：

svd初始化：對RNN有比較好的效果。參考論文：https://arxiv.org/abs/1312.6120[8]

dropout

dropout是指在深度學(xué)習(xí)網(wǎng)絡(luò)的訓(xùn)練過程中，對于神經(jīng)網(wǎng)絡(luò)單元，按照一定的概率將其暫時從網(wǎng)絡(luò)中丟棄。注意是「暫時」，對于隨機梯度下降來說，由于是隨機丟棄，故而每一個mini-batch都在訓(xùn)練不同的網(wǎng)絡(luò)。

Dropout類似于bagging ensemble減少variance。也就是投通過投票來減少可變性。通常我們在全連接層部分使用dropout，在卷積層則不使用。但「dropout」并不適合所有的情況，不要無腦上Dropout。

Dropout一般適合于全連接層部分，而卷積層由于其參數(shù)并不是很多，所以不需要dropout，加上的話對模型的泛化能力并沒有太大的影響。

我們一般在網(wǎng)絡(luò)的最開始和結(jié)束的時候使用全連接層，而hidden layers則是網(wǎng)絡(luò)中的卷積層。所以一般情況，在全連接層部分，采用較大概率的dropout而在卷積層采用低概率或者不采用dropout。

數(shù)據(jù)集處理

主要有「數(shù)據(jù)篩選」?以及?「數(shù)據(jù)增強」

fastai中的圖像增強技術(shù)為什么相對比較好[9]

難例挖掘 hard-negative-mining

分析模型難以預(yù)測正確的樣本，給出針對性方法。

多模型融合

Ensemble是論文刷結(jié)果的終極核武器,深度學(xué)習(xí)中一般有以下幾種方式

同樣的參數(shù),不同的初始化方式

不同的參數(shù),通過cross-validation,選取最好的幾組

同樣的參數(shù),模型訓(xùn)練的不同階段，即不同迭代次數(shù)的模型。

不同的模型,進行線性融合. 例如RNN和傳統(tǒng)模型.

提高模型性能和魯棒性大法：probs融合和投票法。

假設(shè)這里有model 1, model 2, model 3，可以這樣融合：

1. model1 probs + model2 probs + model3 probs ==> final label

2. model1 label , model2 label , model3 label ==> voting ==> final label

3. model1_1 probs + ... + model1_n probs ==> mode1 label, model2 label與model3獲取的label方式與1相同? ==> voting ==> final label

第三個方式的啟發(fā)來源于，如果一個model的隨機種子沒有固定，多次預(yù)測得到的結(jié)果可能不同。

以上方式的效果要根據(jù)label個數(shù)，數(shù)據(jù)集規(guī)模等特征具體問題具體分析，表現(xiàn)可能不同，方式無非是probs融合和投票法的單獨使用or結(jié)合。

差分學(xué)習(xí)率與遷移學(xué)習(xí)

首先說下遷移學(xué)習(xí)，遷移學(xué)習(xí)是一種很常見的深度學(xué)習(xí)技巧，我們利用很多預(yù)訓(xùn)練的經(jīng)典模型直接去訓(xùn)練我們自己的任務(wù)。雖然說領(lǐng)域不同，但是在學(xué)習(xí)權(quán)重的廣度方面，兩個任務(wù)之間還是有聯(lián)系的。

由上圖，我們拿來「model A」訓(xùn)練好的模型權(quán)重去訓(xùn)練我們自己的模型權(quán)重(「Model B」)，其中，modelA可能是ImageNet的預(yù)訓(xùn)練權(quán)重，而ModelB則是我們自己想要用來識別貓和狗的預(yù)訓(xùn)練權(quán)重。

那么差分學(xué)習(xí)率和遷移學(xué)習(xí)有什么關(guān)系呢？我們直接拿來其他任務(wù)的訓(xùn)練權(quán)重，在進行optimize的時候，如何選擇適當(dāng)?shù)膶W(xué)習(xí)率是一個很重要的問題。

一般地，我們設(shè)計的神經(jīng)網(wǎng)絡(luò)(如下圖)一般分為三個部分，輸入層，隱含層和輸出層，隨著層數(shù)的增加，神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)到的特征越抽象。因此，下圖中的卷積層和全連接層的學(xué)習(xí)率也應(yīng)該設(shè)置的不一樣，一般來說，卷積層設(shè)置的學(xué)習(xí)率應(yīng)該更低一些，而全連接層的學(xué)習(xí)率可以適當(dāng)提高。

這就是差分學(xué)習(xí)率的意思，在不同的層設(shè)置不同的學(xué)習(xí)率，可以提高神經(jīng)網(wǎng)絡(luò)的訓(xùn)練效果，具體的介紹可以查看下方的連接。

上面的示例圖來自：towardsdatascience.com/transfer-le…[10]

余弦退火(cosine annealing)和熱重啟的隨機梯度下降

「余弦」就是類似于余弦函數(shù)的曲線，「退火」就是下降，「余弦退火」就是學(xué)習(xí)率類似余弦函數(shù)慢慢下降。

「熱重啟」就是在學(xué)習(xí)的過程中，「學(xué)習(xí)率」慢慢下降然后突然再「回彈」(重啟)然后繼續(xù)慢慢下降。

兩個結(jié)合起來就是下方的學(xué)習(xí)率變化圖：

更多詳細的介紹可以查看知乎機器學(xué)習(xí)算法如何調(diào)參？這里有一份神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)速率設(shè)置指南[11]
以及相關(guān)論文SGDR: Stochastic Gradient Descent with Warm Restarts[12]

嘗試過擬合一個小數(shù)據(jù)集

這是一個經(jīng)典的小trick了，但是很多人并不這樣做，可以嘗試一下。

關(guān)閉正則化/隨機失活/數(shù)據(jù)擴充，使用訓(xùn)練集的一小部分，讓神經(jīng)網(wǎng)絡(luò)訓(xùn)練幾個周期。確?？梢詫崿F(xiàn)零損失，如果沒有，那么很可能什么地方出錯了。

多尺度訓(xùn)練

多尺度訓(xùn)練是一種「直接有效」的方法，通過輸入不同尺度的圖像數(shù)據(jù)集，因為神經(jīng)網(wǎng)絡(luò)卷積池化的特殊性，這樣可以讓神經(jīng)網(wǎng)絡(luò)充分地學(xué)習(xí)不同分辨率下圖像的特征，可以提高機器學(xué)習(xí)的性能。

也可以用來處理過擬合效應(yīng)，在圖像數(shù)據(jù)集不是特別充足的情況下，可以先訓(xùn)練小尺寸圖像，然后增大尺寸并再次訓(xùn)練相同模型，這樣的思想在Yolo-v2的論文中也提到過：

需要注意的是：多尺度訓(xùn)練并不是適合所有的深度學(xué)習(xí)應(yīng)用，多尺度訓(xùn)練可以算是特殊的數(shù)據(jù)增強方法，在圖像大小這一塊做了調(diào)整。如果有可能最好利用可視化代碼將多尺度后的圖像近距離觀察一下，「看看多尺度會對圖像的整體信息有沒有影響」，如果對圖像信息有影響的話，這樣直接訓(xùn)練的話會誤導(dǎo)算法導(dǎo)致得不到應(yīng)有的結(jié)果。

Cross Validation 交叉驗證

在李航的統(tǒng)計學(xué)方法中說到，交叉驗證往往是對實際應(yīng)用中「數(shù)據(jù)不充足」而采用的，基本目的就是重復(fù)使用數(shù)據(jù)。在平常中我們將所有的數(shù)據(jù)分為訓(xùn)練集和驗證集就已經(jīng)是簡單的交叉驗證了，可以稱為1折交叉驗證。「注意，交叉驗證和測試集沒關(guān)系，測試集是用來衡量我們的算法標(biāo)準(zhǔn)的，不參與到交叉驗證中來?！?/strong>

交叉驗證只針對訓(xùn)練集和驗證集。

交叉驗證是Kaggle比賽中特別推崇的一種技巧，我們經(jīng)常使用的是5-折(5-fold)交叉驗證，將訓(xùn)練集分成5份，隨機挑一份做驗證集其余為訓(xùn)練集，循環(huán)5次，這種比較常見計算量也不是很大。還有一種叫做leave-one-out cross validation留一交叉驗證，這種交叉驗證就是n-折交叉，n表示數(shù)據(jù)集的容量，這種方法只適合數(shù)據(jù)量比較小的情況，計算量非常大的情況很少用到這種方法。

吳恩達有一節(jié)課The nuts and bolts of building applications using deep learning[13]中也提到了。

優(yōu)化算法

按理說不同的優(yōu)化算法適合于不同的任務(wù)，不過我們大多數(shù)采用的優(yōu)化算法還是是adam和SGD+monmentum。

Adam 可以解決一堆奇奇怪怪的問題（有時 loss 降不下去，換 Adam 瞬間就好了），也可以帶來一堆奇奇怪怪的問題（比如單詞詞頻差異很大，當(dāng)前 batch 沒有的單詞的詞向量也被更新；再比如Adam和L2正則結(jié)合產(chǎn)生的復(fù)雜效果）。用的時候要膽大心細，萬一遇到問題找各種魔改 Adam（比如 MaskedAdam[14], AdamW 啥的）搶救。

但看一些博客說adam的相比SGD，收斂快，但泛化能力差，更優(yōu)結(jié)果似乎需要精調(diào)SGD。

adam,adadelta等, 在小數(shù)據(jù)上,我這里實驗的效果不如sgd, sgd收斂速度會慢一些，但是最終收斂后的結(jié)果，一般都比較好。

如果使用sgd的話,可以選擇從1.0或者0.1的學(xué)習(xí)率開始,隔一段時間,在驗證集上檢查一下,如果cost沒有下降,就對學(xué)習(xí)率減半. 我看過很多論文都這么搞,我自己實驗的結(jié)果也很好. 當(dāng)然,也可以先用ada系列先跑,最后快收斂的時候,更換成sgd繼續(xù)訓(xùn)練.同樣也會有提升.據(jù)說adadelta一般在分類問題上效果比較好，adam在生成問題上效果比較好。

adam收斂雖快但是得到的解往往沒有sgd+momentum得到的解更好，如果不考慮時間成本的話還是用sgd吧。

adam是不需要特別調(diào)lr，sgd要多花點時間調(diào)lr和initial weights。

數(shù)據(jù)預(yù)處理方式

zero-center ,這個挺常用的.

PCA whitening,這個用的比較少.

訓(xùn)練技巧

要做梯度歸一化,即算出來的梯度除以minibatch size

clip c(梯度裁剪): 限制最大梯度,其實是value = sqrt(w1^2+w2^2….),如果value超過了閾值,就算一個衰減系系數(shù),讓value的值等于閾值: 5,10,15

dropout對小數(shù)據(jù)防止過擬合有很好的效果,值一般設(shè)為0.5

小數(shù)據(jù)上dropout+sgd在我的大部分實驗中，效果提升都非常明顯.因此可能的話，建議一定要嘗試一下。

dropout的位置比較有講究, 對于RNN,建議放到輸入->RNN與RNN->輸出的位置.關(guān)于RNN如何用dropout,可以參考這篇論文//arxiv.org/abs/1409.2329[15]

除了gate之類的地方,需要把輸出限制成0-1之外,盡量不要用sigmoid,可以用tanh或者relu之類的激活函數(shù).

sigmoid函數(shù)在-4到4的區(qū)間里，才有較大的梯度。之外的區(qū)間，梯度接近0，很容易造成梯度消失問題。

輸入0均值，sigmoid函數(shù)的輸出不是0均值的。

rnn的dim和embdding size,一般從128上下開始調(diào)整. batch size,一般從128左右開始調(diào)整. batch size合適最重要,并不是越大越好.

word2vec初始化,在小數(shù)據(jù)上,不僅可以有效提高收斂速度,也可以可以提高結(jié)果.

盡量對數(shù)據(jù)做shuffle

LSTM 的forget gate的bias,用1.0或者更大的值做初始化,可以取得更好的結(jié)果,來自這篇論文//jmlr.org/proceedings/papers/v37/jozefowicz15.pdf[16], 我這里實驗設(shè)成1.0,可以提高收斂速度.實際使用中,不同的任務(wù),可能需要嘗試不同的值.

Batch Normalization據(jù)說可以提升效果，參考論文：Accelerating Deep Network Training by Reducing Internal Covariate Shift

如果你的模型包含全連接層（MLP），并且輸入和輸出大小一樣，可以考慮將MLP替換成Highway Network,我嘗試對結(jié)果有一點提升，建議作為最后提升模型的手段，原理很簡單，就是給輸出加了一個gate來控制信息的流動，詳細介紹請參考論文: http://arxiv.org/abs/1505.00387[17]

來自@張馨宇的技巧：一輪加正則，一輪不加正則，反復(fù)進行。

在數(shù)據(jù)集很大的情況下，一上來就跑全量數(shù)據(jù)。建議先用 1/100、1/10 的數(shù)據(jù)跑一跑，對模型性能和訓(xùn)練時間有個底，外推一下全量數(shù)據(jù)到底需要跑多久。在沒有足夠的信心前不做大規(guī)模實驗。

subword 總是會很穩(wěn)定地漲點，只管用就對了。

GPU 上報錯時盡量放在 CPU 上重跑，錯誤信息更友好。例如 GPU 報 "ERRORModel diverged with loss = NaN" 其實很有可能是輸入 ID 超出了 softmax 詞表的范圍。

在確定初始學(xué)習(xí)率的時候，從一個很小的值（例如 1e-7）開始，然后每一步指數(shù)增大學(xué)習(xí)率（例如擴大1.05 倍）進行訓(xùn)練。訓(xùn)練幾百步應(yīng)該能觀察到損失函數(shù)隨訓(xùn)練步數(shù)呈對勾形，選擇損失下降最快那一段的學(xué)習(xí)率即可。

補充一個rnn trick，仍然是不考慮時間成本的情況下，batch size=1是一個很不錯的regularizer, 起碼在某些task上,這也有可能是很多人無法復(fù)現(xiàn)alex graves實驗結(jié)果的原因之一，因為他總是把batch size設(shè)成1。

注意實驗的可復(fù)現(xiàn)性和一致性，注意養(yǎng)成良好的實驗記錄習(xí)慣 ==> 不然如何分析出實驗結(jié)論。

超參上，learning rate 最重要，推薦了解 cosine learning rate 和 cyclic learning rate，其次是 batchsize 和 weight decay。當(dāng)你的模型還不錯的時候，可以試著做數(shù)據(jù)增廣和改損失函數(shù)錦上添花了。

?

?

審核編輯：黃飛

?

?

?

閱讀全文

神經(jīng)網(wǎng)絡(luò)(98386) 神經(jīng)網(wǎng)絡(luò)(98386)

圖像增強(9955) 圖像增強(9955)

深度學(xué)習(xí)(119798) 深度學(xué)習(xí)(119798)

點贊收藏

掃一掃，分享給好友

復(fù)制鏈接分享

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

評論

查看更多

相關(guān)推薦

深度學(xué)習(xí)的硬件架構(gòu)解析
深度學(xué)習(xí)在這十年，甚至是未來幾十年內(nèi)都有可能是最熱門的話題。雖然深度學(xué)習(xí)已是廣為人知了，但它并不僅僅包含數(shù)學(xué)、建模、學(xué)習(xí)和優(yōu)化。算法必須在優(yōu)化后的硬件上運行，因為學(xué)習(xí)成千上萬的數(shù)據(jù)可能需要長達幾周的時間。因此，深度學(xué)習(xí)網(wǎng)絡(luò)亟需更快、更高效的硬件。接下來，讓我們重點來看深度學(xué)習(xí)的硬件架構(gòu)。
2016-11-18 16:00:375544
如何才能高效地進行深度學(xué)習(xí)模型訓(xùn)練？
分布式深度學(xué)習(xí)框架中，包括數(shù)據(jù)/模型切分、本地單機優(yōu)化算法訓(xùn)練、通信機制、和數(shù)據(jù)/模型聚合等模塊?，F(xiàn)有的算法一般采用隨機置亂切分的數(shù)據(jù)分配方式，隨機優(yōu)化算法（例如隨機梯度法）的本地訓(xùn)練算法，同步或者異步通信機制，以及參數(shù)平均的模型聚合方式。
2018-07-09 08:48:2213609
優(yōu)化模型與Lindo/Lingo優(yōu)化軟件
優(yōu)化模型與Lindo/Lingo優(yōu)化軟件 優(yōu)化模型簡介 LINDO公司的主要軟件產(chǎn)品及功能簡介 LINDO軟件的使用簡介 LINGO軟件的使用簡介  建模與求解實例（結(jié)合軟件使用）
2009-09-15 12:22:02
深度學(xué)習(xí)模型是如何創(chuàng)建的？
具有深度學(xué)習(xí)模型的嵌入式系統(tǒng)應(yīng)用程序帶來了巨大的好處。深度學(xué)習(xí)嵌入式系統(tǒng)已經(jīng)改變了各個行業(yè)的企業(yè)和組織。深度學(xué)習(xí)模型可以幫助實現(xiàn)工業(yè)流程自動化，進行實時分析以做出決策，甚至可以預(yù)測預(yù)警。這些AI
2021-10-27 06:34:15
深度學(xué)習(xí)中過擬合/欠擬合的問題及解決方案
的數(shù)據(jù)可以對未來的數(shù)據(jù)進行推測與模擬，因此都是使用歷史數(shù)據(jù)建立模型，即使用已經(jīng)產(chǎn)生的數(shù)據(jù)去訓(xùn)練，然后使用該模型去擬合未來的數(shù)據(jù)。在我們機器學(xué)習(xí)和深度學(xué)習(xí)的訓(xùn)練過程中，經(jīng)常會出現(xiàn)過擬合和欠擬合的現(xiàn)象。訓(xùn)練一開始，模型通常會欠擬合，所以會對模型進行優(yōu)化，然而等到訓(xùn)練到一定程度的時候，就需要解決過擬合的問題了。
2021-01-28 06:57:47
深度學(xué)習(xí)在預(yù)測和健康管理中的應(yīng)用
方法方面的最新進展，目的是發(fā)現(xiàn)研究差距并提出進一步的改進建議。在簡要介紹了幾種深度學(xué)習(xí)模型之后，我們回顧并分析了使用深度學(xué)習(xí)進行故障檢測，診斷和預(yù)后的應(yīng)用。該調(diào)查驗證了深度學(xué)習(xí)對PHM中各種類型的輸入
2021-07-12 06:46:47
深度學(xué)習(xí)存在哪些問題？
深度學(xué)習(xí)常用模型有哪些？深度學(xué)習(xí)常用軟件工具及平臺有哪些？深度學(xué)習(xí)存在哪些問題？
2021-10-14 08:20:47
深度學(xué)習(xí)技術(shù)的開發(fā)與應(yīng)用
時間安排大綱具體內(nèi)容實操案例三天關(guān)鍵點1.強化學(xué)習(xí)的發(fā)展歷程2.馬爾可夫決策過程3.動態(tài)規(guī)劃4.無模型預(yù)測學(xué)習(xí)5.無模型控制學(xué)習(xí)6.價值函數(shù)逼近7.策略梯度方法8.深度強化學(xué)習(xí)-DQN算法系列9.
2022-04-21 14:57:39
深度學(xué)習(xí)框架只為GPU?
CPU優(yōu)化深度學(xué)習(xí)框架和函數(shù)庫機器學(xué)***器
2021-02-22 06:01:02
深度融合模型的特點
深度融合模型的特點，背景深度學(xué)習(xí)模型在訓(xùn)練完成之后，部署并應(yīng)用在生產(chǎn)環(huán)境的這一步至關(guān)重要，畢竟訓(xùn)練出來的模型不能只接受一些公開數(shù)據(jù)集和榜單的檢驗，還需要在真正的業(yè)務(wù)場景下創(chuàng)造價值，不能只是為了PR而
2021-07-16 06:08:20
Mali GPU支持tensorflow或者caffe等深度學(xué)習(xí)模型嗎
Mali GPU 支持tensorflow或者caffe等深度學(xué)習(xí)模型嗎？好像caffe2go和tensorflow lit可以部署到ARM，但不知道是否支持在GPU運行？我希望把訓(xùn)練
2022-09-16 14:13:01
Nanopi深度學(xué)習(xí)之路(1)深度學(xué)習(xí)框架分析
著手，使用Nanopi2部署已訓(xùn)練好的檢測模型，例如硅谷電視劇的 Not Hotdog 檢測器應(yīng)用，會在復(fù)雜的深度學(xué)習(xí)歷程中有些成就感。目前已有幾十種流行的深度學(xué)習(xí)算法庫，參考網(wǎng)址：https
2018-06-04 22:32:12
SenseTime商湯科技全職/實習(xí)招聘！歡迎投遞（深圳、香港）
優(yōu)先分布式深度學(xué)習(xí)系統(tǒng)研究員（全職、實習(xí)）工作職責(zé)： 1、世界一流的超大規(guī)模分布式深度學(xué)習(xí)模型訓(xùn)練平臺搭建及優(yōu)化 2、分布式訓(xùn)練數(shù)據(jù)存儲平臺搭建及優(yōu)化，深度學(xué)習(xí)模型改進及訓(xùn)練任職要求： 1、工作地
2016-06-21 10:59:41
TDA4對深度學(xué)習(xí)的重要性
，這比較類似于人腦的運行方式，獲得更多數(shù)據(jù)后，準(zhǔn)確度也會越來越高。TIDL（TI Deep LearningLibrary）是TI平臺基于深度學(xué)習(xí)算法的軟件生態(tài)系統(tǒng)，可以將一些常見的深度學(xué)習(xí)算法模型
2022-11-03 06:53:11
labview+yolov4+tensorflow+openvion深度學(xué)習(xí)
缺陷檢測主要知識點：1Tensorflow-GPU環(huán)境的搭建Tensorflow object環(huán)境搭建學(xué)會如何標(biāo)注圖片如何labview快速通過遷移學(xué)習(xí)訓(xùn)練自己的模型如何利用labview生成優(yōu)化后的OPENVINO模型IR如何利用labview調(diào)用訓(xùn)練后的PB模型和IR模型進行目標(biāo)檢測
2021-05-10 22:33:46
labview實現(xiàn)深度學(xué)習(xí)，還在用python？
算法。其編程特點是上手快，開發(fā)效率高，兼容性強，能快速調(diào)用c++，c#等平臺的dll類庫。如何將labview與深度學(xué)習(xí)結(jié)合起來，來解決視覺行業(yè)越來越復(fù)雜的應(yīng)用場景所遇到的困難。下面以開關(guān)面板為例講解
2020-07-23 20:33:10
labview測試tensorflow深度學(xué)習(xí)SSD模型識別物體
安裝labview2019 vision，自帶深度學(xué)習(xí)推理工具，支持tensorflow模型。配置好python下tensorflow環(huán)境配置好object_detection API下載SSD模型
2020-08-16 17:21:38
labview調(diào)用深度學(xué)習(xí)tensorflow模型非常簡單，附上源碼和模型
本帖最后由 wcl86 于 2021-9-9 10:39 編輯 `labview調(diào)用深度學(xué)習(xí)tensorflow模型非常簡單，效果如下，附上源碼和訓(xùn)練過的模型：[hide][/hide
2021-06-03 16:38:25
labview調(diào)用yolo 目標(biāo)檢測速度太慢？yolov4：速度和精度的完美結(jié)合，性能和精度碾壓yolov3
gpu加速），labview調(diào)用openvino優(yōu)化深度學(xué)習(xí)模型（cpu加速），以及l(fā)abview調(diào)用yolov4深度學(xué)習(xí)模型（gpu加速）3個模塊的內(nèi)容，另外還有海量工業(yè)實際項目數(shù)據(jù)集提供給學(xué)員。如需
2021-01-05 09:22:02
　　華為云深度學(xué)習(xí)服務(wù)，讓企業(yè)智能從此不求人
，分布式訓(xùn)練線性加速比能達到0.8。這就意味著在億級圖片規(guī)模下的模型訓(xùn)練，華為深度學(xué)習(xí)的分布式模型訓(xùn)練時間可以從30天縮短至小時級。　　　　不同GPU數(shù)量下模型訓(xùn)練收斂時間　　　　神機妙算—算法優(yōu)化
2018-08-02 20:44:09
【NanoPi K1 Plus試用體驗】搭建深度學(xué)習(xí)框架
，非線性回歸，手寫數(shù)字分類模型開始講起。逐步講到一些深度學(xué)習(xí)網(wǎng)絡(luò)的應(yīng)用如CNN，LSTM。最后會帶著大家完成一些實際的應(yīng)用案例如圖像識別，圖片風(fēng)格轉(zhuǎn)換，seq2seq模型的應(yīng)用，情感分類，生成對抗網(wǎng)絡(luò)等。下面
2018-07-17 11:40:31
【詳解】FPGA：深度學(xué)習(xí)的未來？
的固定架構(gòu)之外進行模型優(yōu)化探究。同時，F(xiàn)PGA在單位能耗下性能更強，這對大規(guī)模服務(wù)器部署或資源有限的嵌入式應(yīng)用的研究而言至關(guān)重要。本文從硬件加速的視角考察深度學(xué)習(xí)與FPGA，指出有哪些趨勢和創(chuàng)新使得
2018-08-13 09:33:30
為什么說FPGA是機器深度學(xué)習(xí)的未來？
都出現(xiàn)了重大突破。深度學(xué)習(xí)是這些領(lǐng)域中所最常使用的技術(shù)，也被業(yè)界大為關(guān)注。然而，深度學(xué)習(xí)模型需要極為大量的數(shù)據(jù)和計算能力，只有更好的硬件加速條件，才能滿足現(xiàn)有數(shù)據(jù)和模型規(guī)模繼續(xù)擴大的需求。　　 FPGA
2019-10-10 06:45:41
什么是深度學(xué)習(xí)？
深度學(xué)習(xí)是什么意思
2020-11-11 06:58:03
什么是深度學(xué)習(xí)？使用FPGA進行深度學(xué)習(xí)的好處？
什么是深度學(xué)習(xí)為了解釋深度學(xué)習(xí)，有必要了解神經(jīng)網(wǎng)絡(luò)。神經(jīng)網(wǎng)絡(luò)是一種模擬人腦的神經(jīng)元和神經(jīng)網(wǎng)絡(luò)的計算模型。作為具體示例，讓我們考慮一個輸入圖像并識別圖像中對象類別的示例。這個例子對應(yīng)機器學(xué)習(xí)中的分類
2023-02-17 16:56:59
以MegCC為例介紹如何開發(fā)一個深度學(xué)習(xí)編譯器
，同時進行上述優(yōu)化。MegCC簡介MegCC 實現(xiàn)的原理是：深度學(xué)習(xí)模型在推理時候，每一個 Operator 都會對應(yīng)一個計算 kernel 并完成計算，所以整個深度學(xué)習(xí)模型在推理時就是一次執(zhí)行所有
2023-02-09 16:35:34
全網(wǎng)唯一一套labview深度學(xué)習(xí)教程：tensorflow+目標(biāo)檢測：龍哥教你學(xué)視覺—LabVIEW深度學(xué)習(xí)教程
進行學(xué)習(xí)3、該套課程不需要有很強的python語言編程基礎(chǔ)，小白學(xué)員即可進行學(xué)習(xí)4、labview對cpu上推理深度學(xué)習(xí)模型進行了優(yōu)化，其運行速度和效率優(yōu)于python平臺5、課程不僅講授了環(huán)境配置
2020-08-10 10:38:12
如何使用MATLAB幫助相關(guān)人員執(zhí)行深度學(xué)習(xí)任務(wù)
MATLAB支持的模型有哪些呢？如何使用MATLAB幫助相關(guān)人員執(zhí)行深度學(xué)習(xí)任務(wù)呢？
2021-11-22 07:48:19
超參數(shù)優(yōu)化是深度學(xué)習(xí)中的重要組成部分
超參數(shù)優(yōu)化是深度學(xué)習(xí)中的重要組成部分。其原因在于，神經(jīng)網(wǎng)絡(luò)是公認的難以配置，而又有很多參數(shù)需要設(shè)置。最重要的是，個別模型的訓(xùn)練非常緩慢。在這篇文章中，你會了解到如何使用scikit-learn
2017-09-30 16:22:162
基于深度學(xué)習(xí)的多尺幅深度網(wǎng)絡(luò)監(jiān)督模型
針對場景標(biāo)注中如何產(chǎn)生良好的內(nèi)部視覺信息表達和有效利用上下文語義信息兩個至關(guān)重要的問題，提出一種基于深度學(xué)習(xí)的多尺度深度網(wǎng)絡(luò)監(jiān)督模型。與傳統(tǒng)多尺度方法不同，模型主要由兩個深度卷積網(wǎng)絡(luò)組成：首先網(wǎng)絡(luò)
2017-11-28 14:22:100
模型驅(qū)動深度學(xué)習(xí)的標(biāo)準(zhǔn)流程與學(xué)習(xí)方法解析
模型驅(qū)動的深度學(xué)習(xí)方法近年來，深度學(xué)習(xí)在人工智能領(lǐng)域一系列困難問題上取得了突破性成功應(yīng)用。
2018-01-24 11:30:134608
一種新的目標(biāo)分類特征深度學(xué)習(xí)模型
為提高低配置計算環(huán)境中的視覺目標(biāo)實時在線分類特征提取的時效性和分類準(zhǔn)確率，提出一種新的目標(biāo)分類特征深度學(xué)習(xí)模型。根據(jù)高時效性要求，選用分類器模型離線深度學(xué)習(xí)的策略，以節(jié)約在線訓(xùn)練時間。針對網(wǎng)絡(luò)深度
2018-03-20 17:30:420
根據(jù)美團“猜你喜歡”來深度學(xué)習(xí)排序模型實踐
本文將主要介紹深度學(xué)習(xí)模型在美團平臺推薦排序場景下的應(yīng)用和探索。
2018-04-02 09:35:246070
關(guān)于如何從零開始構(gòu)建深度學(xué)習(xí)項目的詳細教程
第一部分：啟動一個深度學(xué)習(xí)項目第二部分：創(chuàng)建一個深度學(xué)習(xí)數(shù)據(jù)集第三部分：設(shè)計深度模型第四部分：可視化深度網(wǎng)絡(luò)模型及度量指標(biāo) 第五部分：深度學(xué)習(xí)網(wǎng)絡(luò)中的調(diào)試第六部分：改善深度學(xué)習(xí)模型性能及網(wǎng)絡(luò)調(diào)參
2018-04-19 15:21:233520
深讀解析反向傳播算法在解決模型優(yōu)化問題的方面應(yīng)用
反向傳播算法隸屬于深度學(xué)習(xí)，它在解決模型優(yōu)化問題的方面有著重要的地位。
2018-11-01 15:48:545183
如何使用英特爾深度學(xué)習(xí)SDK解決問題
了解如何使用英特爾?深度學(xué)習(xí)SDK輕松插入，訓(xùn)練和部署深度學(xué)習(xí)模型，以解決圖像和文本分析問題。
2018-11-08 06:25:002992
在可擴展的分布式深度學(xué)習(xí)中使用Python
學(xué)習(xí)使用neon?在本地實施深度學(xué)習(xí)模型
2018-11-05 06:46:002227
基于深度學(xué)習(xí)模型的點云目標(biāo)檢測及ROS實現(xiàn)
近年來，隨著深度學(xué)習(xí)在圖像視覺領(lǐng)域的發(fā)展，一類基于單純的深度學(xué)習(xí)模型的點云目標(biāo)檢測方法被提出和應(yīng)用，本文將詳細介紹其中一種模型——SqueezeSeg，并且使用ROS實現(xiàn)該模型的實時目標(biāo)檢測。
2018-11-05 16:47:2917181
深度學(xué)習(xí)優(yōu)化器方法及學(xué)習(xí)率衰減方式的詳細資料概述
深度學(xué)習(xí)作為現(xiàn)今機器學(xué)習(xí)領(lǐng)域中的重要的技術(shù)手段，在圖像識別、機器翻譯、自然語言處理等領(lǐng)域都已經(jīng)很成熟，并獲得了很好的成果。文中針對深度學(xué)習(xí)模型優(yōu)化器的發(fā)展進行了梳理，介紹了常用的梯度下降、動量的梯度
2018-12-18 16:47:509
快速了解神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)的教程資料免費下載
本文檔的詳細介紹的是快速了解神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)的教程資料免費下載主要內(nèi)容包括了：機器學(xué)習(xí)概述，線性模型，前饋神經(jīng)網(wǎng)絡(luò)，卷積神經(jīng)網(wǎng)絡(luò)，循環(huán)神經(jīng)網(wǎng)絡(luò)，網(wǎng)絡(luò)優(yōu)化與正則化，記憶與注意力機制，無監(jiān)督學(xué)習(xí)，概率圖模型，玻爾茲曼機，深度信念網(wǎng)絡(luò)，深度生成模型，深度強化學(xué)習(xí)
2019-02-11 08:00:0025
如何優(yōu)化深度學(xué)習(xí)模型
看過了各式各樣的教程之后，你現(xiàn)在已經(jīng)了解了神經(jīng)網(wǎng)絡(luò)的工作原理，并且也搭建了貓狗識別器。你嘗試做了了一個不錯的字符級RNN。
2019-04-29 15:31:362546
針對線性回歸模型和深度學(xué)習(xí)模型，介紹了確定訓(xùn)練數(shù)據(jù)集規(guī)模的方法
具體來看，對于傳統(tǒng)的機器學(xué)習(xí)算法，模型的表現(xiàn)先是遵循冪定律（power law），之后趨于平緩；而對于深度學(xué)習(xí)，該問題還在持續(xù)不斷地研究中，不過圖一為目前較為一致的結(jié)論，即隨著數(shù)據(jù)規(guī)模的增長，深度
2019-05-05 11:03:315747
深度學(xué)習(xí)模型壓縮與加速綜述
目前在深度學(xué)習(xí)領(lǐng)域分類兩個派別，一派為學(xué)院派，研究強大、復(fù)雜的模型網(wǎng)絡(luò)和實驗方法，為了追求更高的性能；另一派為工程派，旨在將算法更穩(wěn)定、高效的落地在硬件平臺上，效率是其追求的目標(biāo)。復(fù)雜的模型固然具有
2019-06-08 17:26:004836
回顧3年來的所有主流深度學(xué)習(xí)CTR模型
微軟于2016年提出的Deep Crossing可以說是深度學(xué)習(xí)CTR模型的最典型和基礎(chǔ)性的模型。如圖2的模型結(jié)構(gòu)圖所示，它涵蓋了深度CTR模型最典型的要素，即通過加入embedding層將稀疏特征轉(zhuǎn)化為低維稠密特征，用stacking layer
2019-07-18 14:33:165870
深度學(xué)習(xí)模型小型化處理的五種方法
現(xiàn)在深度學(xué)習(xí)模型開始走向應(yīng)用，因此我們需要把深度學(xué)習(xí)網(wǎng)絡(luò)和模型部署到一些硬件上，而現(xiàn)有一些模型的參數(shù)量由于過大，會導(dǎo)致在一些硬件上的運行速度很慢，所以我們需要對深度學(xué)習(xí)模型進行小型化處理。
2020-01-28 17:40:003658
晶心科技和Deeplite攜手合作高度優(yōu)化深度學(xué)習(xí)模型解決方案
晶心科技今日宣布將攜手合作，在基于AndeStar? V5架構(gòu)的晶心RISC-V CPU核心上配置高度優(yōu)化的深度學(xué)習(xí)模型，使AI深度學(xué)習(xí)模型變得更輕巧、快速和節(jié)能。
2019-12-31 16:30:111002
機器學(xué)習(xí)模型切實可行的優(yōu)化步驟
這篇文章提供了可以采取的切實可行的步驟來識別和修復(fù)機器學(xué)習(xí)模型的訓(xùn)練、泛化和優(yōu)化問題。
2020-05-04 12:08:002347
如何使用深度學(xué)習(xí)實現(xiàn)語音聲學(xué)模型的研究
的分析識別更是研究的重中之重。近年來深 10 度學(xué)習(xí)模型的廣泛發(fā)展和計算能力的大幅提升對語音識別技術(shù)的提升起到了關(guān)鍵作用。本文立足于語音識別與深度學(xué)習(xí)理論緊密結(jié)合，針對如何利用深度學(xué)習(xí)模型搭建區(qū)分能力更強魯棒性更
2020-05-09 08:00:0041
深度學(xué)習(xí)中多種優(yōu)化算法
在深度學(xué)習(xí)中，有很多種優(yōu)化算法，這些算法需要在極高維度（通常參數(shù)有數(shù)百萬個以上）也即數(shù)百萬維的空間進行梯度下降，從最開始的初始點開始，尋找最優(yōu)化的參數(shù)，通常這一過程可能會遇到多種的情況
2020-08-28 09:52:452268
什么是深度學(xué)習(xí)，深度學(xué)習(xí)能解決什么問題
深度學(xué)習(xí)是機器學(xué)習(xí)與神經(jīng)網(wǎng)絡(luò)、人工智能、圖形化建模、優(yōu)化、模式識別和信號處理等技術(shù)融合后產(chǎn)生的一個領(lǐng)域。
2020-11-05 09:31:194711
愛奇藝深度學(xué)習(xí)平臺對TF Serving毛刺問題的優(yōu)化
決這個問題，愛奇藝深度學(xué)習(xí)平臺團隊經(jīng)過多個階段的優(yōu)化實踐，最后對 TF Serving 和 TensorFlow 的源碼進行深入優(yōu)化，將模型熱更新時的毛刺現(xiàn)象解決，本文將分享 TensorFlow
2020-12-17 16:48:473930
深度主動學(xué)習(xí)的相關(guān)工作全面概述
Abstract 主動學(xué)習(xí)試圖通過標(biāo)記最少量的樣本使得模型的性能收益最大化。而深度學(xué)習(xí)則對數(shù)據(jù)比較貪婪，需要大量的數(shù)據(jù)供給來優(yōu)化海量的參數(shù)，從而使得模型學(xué)會如何提取高質(zhì)量的特征。近年來，由于互聯(lián)網(wǎng)
2021-02-17 11:55:003128
GPU引領(lǐng)的深度學(xué)習(xí)
早期的機器學(xué)習(xí)以搜索為基礎(chǔ)，主要依靠進行過一定優(yōu)化的暴力方法。但是隨著機器學(xué)習(xí)逐漸成熟，它開始專注于加速技術(shù)已經(jīng)很成熟的統(tǒng)計方法和優(yōu)化問題。同時深度學(xué)習(xí)的問世更是帶來原本可能無法實現(xiàn)的優(yōu)化方法。本文
2021-02-26 06:11:435
深度學(xué)習(xí)模型的對抗攻擊及防御措施
深度學(xué)習(xí)作為人工智能技術(shù)的重要組成部分，被廣泛應(yīng)用于計算機視覺和自然語言處理等領(lǐng)域。盡管深度學(xué)習(xí)在圖像分類和目標(biāo)檢測等任務(wù)中取得了較好性能，但是對抗攻擊的存在對深度學(xué)習(xí)模型的安全應(yīng)用構(gòu)成了潛在威脅
2021-03-12 13:45:5374
綜述深度學(xué)習(xí)的卷積神經(jīng)網(wǎng)絡(luò)模型應(yīng)用及發(fā)展
深度學(xué)習(xí)是機器學(xué)習(xí)和人工智能研究的最新趨勢，作為一個十余年來快速發(fā)展的嶄新領(lǐng)域，越來越受到研究者的關(guān)注。卷積神經(jīng)網(wǎng)絡(luò)（CNN）模型是深度學(xué)習(xí)模型中最重要的一種經(jīng)典結(jié)構(gòu)，其性能在近年來深度學(xué)習(xí)任務(wù)
2021-04-02 15:29:0420
深度模型中的優(yōu)化與學(xué)習(xí)課件下載
深度模型中的優(yōu)化與學(xué)習(xí)課件下載
2021-04-07 16:21:013
基于深度學(xué)習(xí)的圖像修復(fù)模型及實驗對比
深度學(xué)習(xí)技術(shù)在解決¨大面積缺失圖像修復(fù)”問題時具有重要作用并帶來了深遠影響，文中在簡要介紹傳統(tǒng)圖像修復(fù)方法的基礎(chǔ)上，重點介紹了基于深度學(xué)習(xí)的修復(fù)模型，主要包括模型分類、優(yōu)缺點對比、適用范圍和在常用數(shù)據(jù)集上的
2021-04-08 09:38:0020
如何理解泛化是深度學(xué)習(xí)領(lǐng)域尚未解決的基礎(chǔ)問題
如何理解泛化是深度學(xué)習(xí)領(lǐng)域尚未解決的基礎(chǔ)問題之一。為什么使用有限訓(xùn)練數(shù)據(jù)集優(yōu)化模型能使模型在預(yù)留測試集上取得良好表現(xiàn)？這一問題距今已有 50 多年的豐富歷史，并在機器學(xué)習(xí)中得到廣泛研究。
2021-04-08 17:56:172373
深度神經(jīng)網(wǎng)絡(luò)模型的壓縮和優(yōu)化綜述
數(shù)據(jù)集上的表現(xiàn)非常卓越。然而，由于其計算量大、存儲成本高、模型復(fù)雜等特性，使得深度學(xué)習(xí)無法有效地應(yīng)用于輕量級移動便攜設(shè)備。因此，壓縮、優(yōu)化深度學(xué)習(xí)模型成為目前硏究的熱點。當(dāng)前主要的模型壓縮方法有模型裁剪、輕
2021-04-12 10:26:5920
模型化深度強化學(xué)習(xí)應(yīng)用研究綜述
深度強化學(xué)習(xí)（DRL）作為機器學(xué)習(xí)的重要分攴，在 Alphago擊敗人類后受到了廣泛關(guān)注。DRL以種試錯機制與環(huán)境進行交互，并通過最大化累積獎賞最終得到最優(yōu)策略。強化學(xué)習(xí)可分為無模型強化學(xué)習(xí)和模型
2021-04-12 11:01:529
基于預(yù)訓(xùn)練模型和長短期記憶網(wǎng)絡(luò)的深度學(xué)習(xí)模型
作為模型的初始化詞向量。但是，隨機詞向量存在不具備語乂和語法信息的缺點;預(yù)訓(xùn)練詞向量存在¨一詞-乂”的缺點，無法為模型提供具備上下文依賴的詞向量。針對該問題，提岀了一種基于預(yù)訓(xùn)練模型BERT和長短期記憶網(wǎng)絡(luò)的深度學(xué)習(xí)
2021-04-20 14:29:0619
基于深度強化學(xué)習(xí)仿真集成的壓邊力控制模型
壓邊為改善板料拉深制造的成品質(zhì)量，釆用深度強化學(xué)習(xí)的方法進行拉深過程旳壓邊力優(yōu)化控制。提岀一種基于深度強化學(xué)習(xí)與有限元仿真集成的壓邊力控制模型，結(jié)合深度神經(jīng)網(wǎng)絡(luò)的感知能力與強化學(xué)習(xí)的決策能力，進行
2021-05-27 10:32:390
什么？不用GPU也能加速你的YOLOv3深度學(xué)習(xí)模型
你還在為神經(jīng)網(wǎng)絡(luò)模型里的冗余信息煩惱嗎？或者手上只有CPU，對一些只能用昂貴的GPU建立的深度學(xué)習(xí)模型“望眼欲穿”嗎？最近，創(chuàng)業(yè)公司Neural Magic帶來了一種名叫新的稀疏化方法，可以幫你
2021-06-10 15:33:021975
基于評分矩陣與評論文本的深度學(xué)習(xí)模型
基于評分矩陣與評論文本的深度學(xué)習(xí)模型
2021-06-24 11:20:3058
基于深度學(xué)習(xí)的文本主題模型研究綜述
基于深度學(xué)習(xí)的文本主題模型研究綜述
2021-06-24 11:49:1868
結(jié)合基擴展模型和深度學(xué)習(xí)的信道估計方法
結(jié)合基擴展模型和深度學(xué)習(xí)的信道估計方法
2021-06-30 10:43:3962
深度學(xué)習(xí)嵌入式系統(tǒng)
具有深度學(xué)習(xí)模型的嵌入式系統(tǒng)應(yīng)用程序帶來了巨大的好處。深度學(xué)習(xí)嵌入式系統(tǒng)已經(jīng)改變了各個行業(yè)的企業(yè)和組織。深度學(xué)習(xí)模型可以幫助實現(xiàn)工業(yè)流程自動化，進行實時分析以做出決策，甚至可以預(yù)測預(yù)警。這些AI
2021-10-20 19:05:5842
移植深度學(xué)習(xí)算法模型到海思AI芯片
本文大致介紹將深度學(xué)習(xí)算法模型移植到海思AI芯片的總體流程和一些需要注意的細節(jié)。海思芯片移植深度學(xué)習(xí)算法模型，大致分為模型轉(zhuǎn)換，...
2022-01-26 19:42:3511
如何為深度學(xué)習(xí)模型設(shè)計審計方案
　　在本文中，我們開發(fā)了一個深度學(xué)習(xí)（ DL ）模型審計框架。越來越多的人開始關(guān)注 DL 模型中的固有偏見，這些模型部署在廣泛的環(huán)境中，并且有多篇關(guān)于部署前審核 DL 模型的必要性的新聞文章。我們的框架將這個審計問題形式化，我們認為這是在部署期間提高 DL 模型的安全性和道德使用的一個步驟。
2022-04-19 14:50:241083
何時使用機器學(xué)習(xí)或深度學(xué)習(xí)
　　部署到嵌入式 GPU 也很受歡迎，因為它可以在部署的環(huán)境中提供快速的推理速度。GPU Coder 支持從 MATLAB 中的深度學(xué)習(xí)模型生成代碼，該模型利用來自 Intel、NVIDIA
2022-07-08 15:23:341304
深度學(xué)習(xí)并非“簡單的統(tǒng)計”
與此同時，Boaz Barak 通過展示擬合統(tǒng)計模型和學(xué)習(xí)數(shù)學(xué)這兩個不同的場景案例，探討其與深度學(xué)習(xí)的匹配性；他認為，雖然深度學(xué)習(xí)的數(shù)學(xué)和代碼與擬合統(tǒng)計模型幾乎相同，但在更深層次上，深度學(xué)習(xí)中的極大部分都可在“向?qū)W生傳授技能”場景中被捕獲。
2022-08-09 10:01:10956
超詳細配置教程：用Windows電腦訓(xùn)練深度學(xué)習(xí)模型
雖然大多數(shù)深度學(xué)習(xí)模型都是在 Linux 系統(tǒng)上訓(xùn)練的，但 Windows 也是一個非常重要的系統(tǒng)，也可能是很多機器學(xué)習(xí)初學(xué)者更為熟悉的系統(tǒng)。要在 Windows 上開發(fā)模型，首先當(dāng)然是配置開發(fā)環(huán)境
2022-11-08 10:57:441101
百度王海峰：深度學(xué)習(xí)平臺+大模型，產(chǎn)業(yè)智能化基座
及應(yīng)用國家工程研究中心技術(shù)委員會副主任、中國工程院丁文華院士受邀致辭，百度首席技術(shù)官、深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程研究中心主任王海峰發(fā)表題為《深度學(xué)習(xí)平臺加大模型，產(chǎn)業(yè)智能化基座》的主旨演講。（以下為發(fā)言全文）尊敬的各位專家、開發(fā)者
2022-12-01 18:03:32816
深度學(xué)習(xí)聚類的綜述
。 1. 什么是深度聚類？經(jīng)典聚類即數(shù)據(jù)通過各種表示學(xué)習(xí)技術(shù)以矢量化形式表示為特征。隨著數(shù)據(jù)變得越來越復(fù)雜和復(fù)雜，淺層（傳統(tǒng)）聚類方法已經(jīng)無法處理高維數(shù)據(jù)類型。為了解決該問題，深度聚類的概念被提出，即聯(lián)合優(yōu)化表示學(xué)習(xí)
2022-12-30 11:15:08649
什么是深度學(xué)習(xí)中優(yōu)化算法
先大致講一下什么是深度學(xué)習(xí)中優(yōu)化算法吧，我們可以把模型比作函數(shù)，一種很復(fù)雜的函數(shù)：h(f(g(k(x))))，函數(shù)有參數(shù)，這些參數(shù)是未知的，深度學(xué)習(xí)中的“學(xué)習(xí)”就是通過訓(xùn)練數(shù)據(jù)求解這些未知的參數(shù)。
2023-02-13 15:31:481019
大模型為什么是深度學(xué)習(xí)的未來？
與傳統(tǒng)機器學(xué)習(xí)相比，深度學(xué)習(xí)是從數(shù)據(jù)中學(xué)習(xí)，而大模型則是通過使用大量的模型來訓(xùn)練數(shù)據(jù)。深度學(xué)習(xí)可以處理任何類型的數(shù)據(jù)，例如圖片、文本等等；但是這些數(shù)據(jù)很難用機器完成。大模型可以訓(xùn)練更多類別、多個級別的模型，因此可以處理更廣泛的類型。另外：在使用大模型時，可能需要一個更全面或復(fù)雜的數(shù)學(xué)和數(shù)值計算的支持。
2023-02-16 11:32:371605
深度學(xué)習(xí)編譯器之Layerout Transform優(yōu)化
繼續(xù)深度學(xué)習(xí)編譯器的優(yōu)化工作解讀，本篇文章要介紹的是OneFlow系統(tǒng)中如何基于MLIR實現(xiàn)Layerout Transform。
2023-05-18 17:32:42389
為什么深度學(xué)習(xí)是非參數(shù)的？
今天我想要與大家分享的是深度神經(jīng)網(wǎng)絡(luò)的工作方式，以及深度神經(jīng)與“傳統(tǒng)”機器學(xué)習(xí)模型的不同之處。
2023-05-25 15:13:54268
PyTorch教程12.1之優(yōu)化和深度學(xué)習(xí)
電子發(fā)燒友網(wǎng)站提供《PyTorch教程12.1之優(yōu)化和深度學(xué)習(xí).pdf》資料免費下載
2023-06-05 15:08:410
PyTorch教程-12.1. 優(yōu)化和深度學(xué)習(xí)
12.1. 優(yōu)化和深度學(xué)習(xí)? Colab [火炬]在 Colab 中打開筆記本 Colab [mxnet] Open the notebook in Colab Colab [jax
2023-06-05 15:44:30327
從淺層到深層神經(jīng)網(wǎng)絡(luò)：概覽深度學(xué)習(xí)優(yōu)化算法
優(yōu)化算法一直以來是機器學(xué)習(xí)能根據(jù)數(shù)據(jù)學(xué)到知識的核心技術(shù)。而好的優(yōu)化算法可以大大提高學(xué)習(xí)速度，加快算法的收斂速度和效果。該論文從淺層模型到深度模型縱覽監(jiān)督學(xué)習(xí)中常用的優(yōu)化算法，并指出了每一種優(yōu)化算法
2023-06-15 11:20:22395
什么是深度學(xué)習(xí)算法？深度學(xué)習(xí)算法的應(yīng)用
什么是深度學(xué)習(xí)算法？深度學(xué)習(xí)算法的應(yīng)用深度學(xué)習(xí)算法被認為是人工智能的核心，它是一種模仿人類大腦神經(jīng)元的計算模型。深度學(xué)習(xí)是機器學(xué)習(xí)的一種變體，主要通過變換各種架構(gòu)來對大量數(shù)據(jù)進行學(xué)習(xí)以及分類處理
2023-08-17 16:03:041305
深度學(xué)習(xí)框架是什么？深度學(xué)習(xí)框架有哪些？
深度學(xué)習(xí)框架是什么？深度學(xué)習(xí)框架有哪些？? 深度學(xué)習(xí)框架是一種軟件工具，它可以幫助開發(fā)者輕松快速地構(gòu)建和訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)模型。與手動編寫代碼相比，深度學(xué)習(xí)框架可以大大減少開發(fā)和調(diào)試的時間和精力，并提
2023-08-17 16:03:091589
深度學(xué)習(xí)框架的作用是什么
的任務(wù)，需要使用深度學(xué)習(xí)框架。深度學(xué)習(xí)框架是對深度學(xué)習(xí)算法和神經(jīng)網(wǎng)絡(luò)模型進行構(gòu)建、調(diào)整和優(yōu)化的軟件工具集。這些框架不僅能夠提高深度學(xué)習(xí)的效率，還能使開發(fā)者更好地理解和操作深度學(xué)習(xí)。以下是深度學(xué)習(xí)框架的作用：
2023-08-17 16:10:571072
深度學(xué)習(xí)框架連接技術(shù)
深度學(xué)習(xí)框架連接技術(shù) 深度學(xué)習(xí)框架是一個能夠幫助機器學(xué)習(xí)和人工智能開發(fā)人員輕松進行模型訓(xùn)練、優(yōu)化及評估的軟件庫。深度學(xué)習(xí)框架連接技術(shù)則是需要使用深度學(xué)習(xí)模型的應(yīng)用程序必不可少的技術(shù)，通過連接技術(shù)
2023-08-17 16:11:16443
深度學(xué)習(xí)框架和深度學(xué)習(xí)算法教程
了基于神經(jīng)網(wǎng)絡(luò)的機器學(xué)習(xí)方法。深度學(xué)習(xí)算法可以分為兩大類：監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)。監(jiān)督學(xué)習(xí)的基本任務(wù)是訓(xùn)練模型去學(xué)習(xí)輸入數(shù)據(jù)的特征和其對應(yīng)的標(biāo)簽，然后用于新數(shù)據(jù)的預(yù)測。而無監(jiān)督學(xué)習(xí)通常用于聚類、降維和生成模型等任務(wù)中
2023-08-17 16:11:26638
深度學(xué)習(xí)服務(wù)器怎么做深度學(xué)習(xí)服務(wù)器diy 深度學(xué)習(xí)服務(wù)器主板用什么
。因此，深度學(xué)習(xí)服務(wù)器逐漸成為了人們進行深度學(xué)習(xí)實驗的必要工具。本文將介紹深度學(xué)習(xí)服務(wù)器的DIY，并討論如何選擇主板。一、深度學(xué)習(xí)服務(wù)器的DIY 1.選擇適合的處理器深度學(xué)習(xí)對處理器的要求非常高，因為訓(xùn)練一個深度學(xué)習(xí)模型需要進行
2023-08-17 16:11:29489
深度學(xué)習(xí)的定義和特點深度學(xué)習(xí)典型模型介紹
深度學(xué)習(xí)（Deep Learning）是一種基于人工神經(jīng)網(wǎng)絡(luò)的機器學(xué)習(xí)算法，其主要特點是模型由多個隱層組成，可以自動地學(xué)習(xí)特征，并進行預(yù)測或分類。該算法在計算機視覺、語音識別、自然語言處理、推薦系統(tǒng)和數(shù)據(jù)挖掘等領(lǐng)域被廣泛應(yīng)用，成為機器學(xué)習(xí)領(lǐng)域的一種重要分支。
2023-08-21 18:22:53929
機器學(xué)習(xí)和深度學(xué)習(xí)的區(qū)別
　　機器學(xué)習(xí)和深度學(xué)習(xí)是當(dāng)今最流行的人工智能(AI)技術(shù)之一。這兩種技術(shù)都有助于在不需要人類干預(yù)的情況下讓計算機自主學(xué)習(xí)和改進預(yù)測模型。本文將探討機器學(xué)習(xí)和深度學(xué)習(xí)的概念以及二者之間的區(qū)別。
2023-08-28 17:31:09891
深度學(xué)習(xí)模型部署與優(yōu)化：策略與實踐；L40S與A100、H100的對比分析
深度學(xué)習(xí)、機器學(xué)習(xí)、生成式AI、深度神經(jīng)網(wǎng)絡(luò)、抽象學(xué)習(xí)、Seq2Seq、VAE、GAN、GPT、BERT、預(yù)訓(xùn)練語言模型、Transformer、ChatGPT、GenAI、多模態(tài)大模型、視覺大模型
2023-09-22 14:13:09607
深度學(xué)習(xí)的由來深度學(xué)習(xí)的經(jīng)典算法有哪些
深度學(xué)習(xí)作為機器學(xué)習(xí)的一個分支，其學(xué)習(xí)方法可以分為監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)。兩種方法都具有其獨特的學(xué)習(xí)模型：多層感知機、卷積神經(jīng)網(wǎng)絡(luò)等屬于監(jiān) 督學(xué)習(xí)；深度置信網(wǎng) 、自動編碼器、去噪自動編碼器、稀疏編碼等屬于無監(jiān)督學(xué)習(xí)。
2023-10-09 10:23:42303
基于深度學(xué)習(xí)的情感語音識別模型優(yōu)化策略
基于深度學(xué)習(xí)的情感語音識別模型的優(yōu)化策略，包括數(shù)據(jù)預(yù)處理、模型結(jié)構(gòu)優(yōu)化、損失函數(shù)改進、訓(xùn)練策略調(diào)整以及集成學(xué)習(xí)等方面的內(nèi)容。
2023-11-09 16:34:14227
深度學(xué)習(xí)如何訓(xùn)練出好的模型
算法工程、數(shù)據(jù)派THU深度學(xué)習(xí)在近年來得到了廣泛的應(yīng)用，從圖像識別、語音識別到自然語言處理等領(lǐng)域都有了卓越的表現(xiàn)。但是，要訓(xùn)練出一個高效準(zhǔn)確的深度學(xué)習(xí)模型并不容易。不僅需要有高質(zhì)量的數(shù)據(jù)、合適的模型
2023-12-07 12:38:24547
如何基于深度學(xué)習(xí)模型訓(xùn)練實現(xiàn)圓檢測與圓心位置預(yù)測
Hello大家好，今天給大家分享一下如何基于深度學(xué)習(xí)模型訓(xùn)練實現(xiàn)圓檢測與圓心位置預(yù)測，主要是通過對YOLOv8姿態(tài)評估模型在自定義的數(shù)據(jù)集上訓(xùn)練，生成一個自定義的圓檢測與圓心定位預(yù)測模型
2023-12-21 10:50:05529
如何基于深度學(xué)習(xí)模型訓(xùn)練實現(xiàn)工件切割點位置預(yù)測
Hello大家好，今天給大家分享一下如何基于深度學(xué)習(xí)模型訓(xùn)練實現(xiàn)工件切割點位置預(yù)測，主要是通過對YOLOv8姿態(tài)評估模型在自定義的數(shù)據(jù)集上訓(xùn)練，生成一個工件切割分離點預(yù)測模型
2023-12-22 11:07:46259

已全部加載完成

搜索歷史

如何優(yōu)化深度學(xué)習(xí)模型?

評論