文章目標(biāo):神經(jīng)網(wǎng)絡(luò)特別是深層神經(jīng)網(wǎng)絡(luò)是黑盒的,通過閱讀本文可以讓大家了解神經(jīng)網(wǎng)絡(luò)的基本實現(xiàn)方法、基本數(shù)學(xué)原理、實現(xiàn)流程等,同時建議初學(xué)者從基礎(chǔ)學(xué)起,查詢更多的資料豐富認(rèn)知,有不明白的地方可以關(guān)注作者或留言。
人工神經(jīng)網(wǎng)絡(luò)起源于上世紀(jì)40~50年代,它是在基于人腦的基本單元-神經(jīng)元的建模與聯(lián)結(jié),模擬人腦神經(jīng)系統(tǒng),形成一種具有學(xué)習(xí)、聯(lián)想、記憶和模式識別等智能信息處理的人工系統(tǒng),稱為人工神經(jīng)網(wǎng)絡(luò)。1969年出版的轟動一時的《Perceptrons》一書指出簡單的線性感知器的功能是有限的,它無非解決線性不可分的而分類問題,如簡單的線性感知器不能實現(xiàn)“異或”的邏輯關(guān)系,加上神經(jīng)網(wǎng)絡(luò)就和黑夾子一樣,很多東西不透明,模型的解釋性不強,參數(shù)過多,容易出錯,容易過擬合,無法保證全局最優(yōu)等問題,同時70年代集成電路和微電子技術(shù)的迅猛發(fā)展,使得傳統(tǒng)的Von Neumenn計算機進(jìn)入全盛時期,基于邏輯符號處理方法的人工智能得到了迅速發(fā)展并取得了顯著的成果。
1982年,美國科學(xué)院發(fā)表了著名的Hopfield網(wǎng)絡(luò)模型的理論,不僅對ANN信息存儲和提取功能進(jìn)行了非線性數(shù)學(xué)概括,提出了動力方程和學(xué)習(xí)方程,使得ANN的構(gòu)造與學(xué)習(xí)有了理論指導(dǎo)。這一研究激發(fā)了ANN的研究熱情。
為了描述神經(jīng)網(wǎng)絡(luò),先從最簡單的神經(jīng)網(wǎng)絡(luò)講起,這個神經(jīng)網(wǎng)絡(luò)僅由一個“神經(jīng)元”構(gòu)成,“神經(jīng)元”的圖示如下:
那么想得到預(yù)測或者分類的結(jié)果,就需要了解激活函數(shù),激活函數(shù)的作用:能使得神經(jīng)網(wǎng)絡(luò)的每層輸出結(jié)果變得非線性化,進(jìn)行數(shù)值轉(zhuǎn)換,具有如下性質(zhì):
可微性:計算梯度時必須要有此性質(zhì);
非線性:保證數(shù)據(jù)非線性可分;
單調(diào)性:保證凸函數(shù);
輸出值與輸入值相差不會很大:保證神經(jīng)網(wǎng)絡(luò)訓(xùn)練和調(diào)參高效;
常用的激活函數(shù)有很多,本文列出3個:Sigmoid、TANH、ReLU,數(shù)據(jù)經(jīng)過激活函數(shù)進(jìn)行轉(zhuǎn)換:
經(jīng)過激活函數(shù)轉(zhuǎn)換后得到預(yù)測標(biāo)簽y,對于有監(jiān)督的分類問題來說,比如二分類label是0、1,那我們?nèi)绾斡嬎泐A(yù)測標(biāo)簽y與實際值的差距呢,就是我們要講的幾個概念了。
損失函數(shù):計算的是一個樣本的誤差;
代價函數(shù):是整個訓(xùn)練集上所有樣本誤差的平均;
目標(biāo)函數(shù):代價函數(shù) + 正則化項;
通過目標(biāo)函數(shù)我們就可以衡量訓(xùn)練集的損失,這種損失我們?nèi)绾螠p少到最小呢?就是神經(jīng)網(wǎng)絡(luò)的優(yōu)化器,常用優(yōu)化器如下:
SGD(Stochastic gradient descent)
Adagrad
RMSprop
Adam
作用:更新和計算影響模型訓(xùn)練和模型輸出的網(wǎng)絡(luò)參數(shù),使其逼近或達(dá)到最優(yōu)值,從而最小化(或最大化)損失函數(shù)E(x)
通過優(yōu)化器的多次優(yōu)化,我們就可以對模型進(jìn)行訓(xùn)練和模型優(yōu)化了,本文是個簡單的Demo,后續(xù)會詳細(xì)介紹,有問題可以留言及關(guān)注;
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4814瀏覽量
103574 -
人工智能
+關(guān)注
關(guān)注
1806文章
49011瀏覽量
249350
發(fā)布評論請先 登錄
無刷電機小波神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)子位置檢測方法的研究
BP神經(jīng)網(wǎng)絡(luò)與卷積神經(jīng)網(wǎng)絡(luò)的比較
BP神經(jīng)網(wǎng)絡(luò)的優(yōu)缺點分析
什么是BP神經(jīng)網(wǎng)絡(luò)的反向傳播算法
BP神經(jīng)網(wǎng)絡(luò)的基本原理
BP神經(jīng)網(wǎng)絡(luò)在圖像識別中的應(yīng)用
人工神經(jīng)網(wǎng)絡(luò)的原理和多種神經(jīng)網(wǎng)絡(luò)架構(gòu)方法

評論