亚洲欧美在线观看一区二区三区,青草伊人久久综合网

這是一份用于理解深度學(xué)習(xí)內(nèi)部運(yùn)作方式的初學(xué)者指南。作者根據(jù)自己從零開(kāi)始學(xué)習(xí)用 Python 構(gòu)建神經(jīng)網(wǎng)絡(luò)的經(jīng)驗(yàn)，編寫(xiě)了一份攻略。內(nèi)容涵蓋神經(jīng)網(wǎng)絡(luò)定義、損失函數(shù)、前向傳播、反向傳播、梯度下降算法，對(duì)于想要了解深度學(xué)習(xí)運(yùn)作原理的各位來(lái)說(shuō)，內(nèi)容精彩不可錯(cuò)過(guò)。

動(dòng)機(jī)：為了深入了解深度學(xué)習(xí)，我決定從零開(kāi)始構(gòu)建神經(jīng)網(wǎng)絡(luò)，并且不使用類(lèi)似 Tensorflow 的深度學(xué)習(xí)庫(kù)。我相信，對(duì)于任何有理想的數(shù)據(jù)科學(xué)家而言，理解神經(jīng)網(wǎng)絡(luò)內(nèi)部的運(yùn)作方式都非常重要。

本文涵蓋了我學(xué)到的所有東西，希望你也能從中獲益！

什么是神經(jīng)網(wǎng)絡(luò)？

許多有關(guān)神經(jīng)網(wǎng)絡(luò)的介紹資料會(huì)將神經(jīng)網(wǎng)絡(luò)與大腦進(jìn)行類(lèi)比。但我發(fā)現(xiàn)，將神經(jīng)網(wǎng)絡(luò)簡(jiǎn)單地描述為一個(gè)從輸入映射到輸出的數(shù)學(xué)函數(shù)理解起來(lái)更容易。

神經(jīng)網(wǎng)絡(luò)由以下部分組成：

一個(gè)輸入層，x

任意數(shù)量的隱藏層

一個(gè)輸出層，?

每?jī)蓪又g都有一組權(quán)重和偏置，W 和 b

每個(gè)隱藏層都要選擇一個(gè)激活函數(shù) σ。在本文中，我們選用 Sigmoid 激活函數(shù)。

下圖展示了 2 層神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)（請(qǐng)注意，在計(jì)算神經(jīng)網(wǎng)絡(luò)層數(shù)的時(shí)候，通常不計(jì)入輸入層）。

二層神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)

利用 Python 建立神經(jīng)網(wǎng)絡(luò)非常容易。

class NeuralNetwork: def __init__(self, x, y): self.input = x self.weights1 = np.random.rand(self.input.shape[1],4) self.weights2 = np.random.rand(4,1) self.y = y self.output = np.zeros(y.shape)

訓(xùn)練神經(jīng)網(wǎng)絡(luò)

一個(gè)簡(jiǎn)單 2 層神經(jīng)網(wǎng)絡(luò)的輸出 ? 可以表示為：

你可能注意到，在上面的等式當(dāng)中，權(quán)重 W 和偏置 b 是影響輸出 ? 的唯一變量。

自然，權(quán)重和偏差的正確值決定了預(yù)測(cè)的強(qiáng)度。根據(jù)輸入數(shù)據(jù)微調(diào)權(quán)重和偏置的過(guò)程稱(chēng)為神經(jīng)網(wǎng)絡(luò)訓(xùn)練。

訓(xùn)練過(guò)程的每一次迭代包含以下步驟：

計(jì)算預(yù)測(cè)的輸出 ?，稱(chēng)為前向傳播

更新權(quán)重和偏置，稱(chēng)為反向傳播

以下流程圖說(shuō)明了這個(gè)過(guò)程：

前向傳播

正如我們?cè)谏蠄D中所看到的，前向傳播只是一個(gè)簡(jiǎn)單的計(jì)算。對(duì)于一個(gè)基本的 2 層神經(jīng)網(wǎng)絡(luò)，神經(jīng)網(wǎng)絡(luò)的輸出計(jì)算如下：

我們可以在 Python 代碼中添加一個(gè)前向傳播函數(shù)來(lái)做到這一點(diǎn)。簡(jiǎn)單起見(jiàn)，我們假設(shè)偏置為 0。

然而，我們?nèi)匀恍枰环N方法來(lái)評(píng)估我們的預(yù)測(cè)的「優(yōu)秀程度」（即，我們的預(yù)測(cè)與真實(shí)值相差多少？）這就需要用到損失函數(shù)了。

損失函數(shù)

損失函數(shù)有很多種，而我們問(wèn)題的性質(zhì)會(huì)決定我們使用哪種損失函數(shù)。在本文中，我們將采用簡(jiǎn)單的誤差平方和。

誤差平方和，即每個(gè)預(yù)測(cè)值和真實(shí)值之間差值的平均值。這個(gè)差值是取了平方項(xiàng)的，所以我們測(cè)量的是差值的絕對(duì)值。

在訓(xùn)練過(guò)程中，我們的目標(biāo)是找到一組最佳的權(quán)重和偏置，使損失函數(shù)最小化。

反向傳播

現(xiàn)在，我們已經(jīng)找到了預(yù)測(cè)誤差的方法（損失函數(shù)），那么我們需要一種方法將錯(cuò)誤「?jìng)鞑ァ够厝ィ瑥亩聶?quán)重和偏置。

為了確定權(quán)重和偏置調(diào)整的適當(dāng)值，我們需要知道損失函數(shù)對(duì)權(quán)重和偏置的偏導(dǎo)數(shù)。

從微積分的角度來(lái)看，函數(shù)的偏導(dǎo)數(shù)也就是函數(shù)的斜率。

梯度下降算法

如果我們知道了偏導(dǎo)數(shù)，我們可以通過(guò)簡(jiǎn)單增加或減少偏導(dǎo)數(shù)（如上圖所示）的方式來(lái)更新權(quán)重和偏置。這就是所謂的梯度下降。

然而，由于損失函數(shù)的方程不包含權(quán)重和偏置，所以我們不能直接計(jì)算損失函數(shù)對(duì)權(quán)重和偏置的偏導(dǎo)數(shù)。因此，我們需要鏈?zhǔn)椒▌t來(lái)幫助計(jì)算。

以上是用于計(jì)算損失函數(shù)對(duì)權(quán)重偏導(dǎo)數(shù)的鏈?zhǔn)椒▌t。簡(jiǎn)單起見(jiàn)，我們只展示了一層神經(jīng)網(wǎng)絡(luò)的偏導(dǎo)數(shù)。

??！這看起來(lái)不大好看，但這能讓我們獲得所需——損失函數(shù)對(duì)權(quán)重的偏導(dǎo)數(shù)（斜率），以便相應(yīng)調(diào)整權(quán)重。

既然我們已經(jīng)有了鏈?zhǔn)椒▌t公式，接下來(lái)我們把反向傳播函數(shù)添加到 Python 代碼中。

class NeuralNetwork: def __init__(self, x, y): self.input = x self.weights1 = np.random.rand(self.input.shape[1],4) self.weights2 = np.random.rand(4,1) self.y = y self.output = np.zeros(self.y.shape) def feedforward(self): self.layer1 = sigmoid(np.dot(self.input, self.weights1)) self.output = sigmoid(np.dot(self.layer1, self.weights2)) def backprop(self): # application of the chain rule to find derivative of the loss function with respect to weights2 and weights1 d_weights2 = np.dot(self.layer1.T, (2*(self.y - self.output) * sigmoid_derivative(self.output))) d_weights1 = np.dot(self.input.T, (np.dot(2*(self.y - self.output) * sigmoid_derivative(self.output), self.weights2.T) * sigmoid_derivative(self.layer1))) # update the weights with the derivative (slope) of the loss function self.weights1 += d_weights1 self.weights2 += d_weights2

整合

既然我們已經(jīng)有了做前向傳播和反向傳播的完整 Python 代碼，我們可以將神經(jīng)網(wǎng)絡(luò)應(yīng)用到一個(gè)示例中，看看它的效果。

我們的神經(jīng)網(wǎng)絡(luò)應(yīng)該能夠習(xí)得理想的權(quán)重集合以表示這個(gè)函數(shù)。請(qǐng)注意，對(duì)于我們來(lái)說(shuō)，僅通過(guò)檢查來(lái)計(jì)算權(quán)重并非一件小事。

如果我們將神經(jīng)網(wǎng)絡(luò)進(jìn)行 1500 次迭代，看看會(huì)發(fā)生什么。下圖展示了每次迭代的損失函數(shù)值，我們可以清晰地發(fā)現(xiàn)損失函數(shù)單調(diào)下降到最小值。這與我們前面討論的梯度下降算法是一致的。

讓我們看看神經(jīng)網(wǎng)絡(luò)在進(jìn)行 1500 次迭代后的最終預(yù)測(cè)（輸出）：

進(jìn)行 1500 次迭代后的預(yù)測(cè)值

我們成功了！我們的前向傳播和反向傳播算法成功訓(xùn)練了神經(jīng)網(wǎng)絡(luò)，且預(yù)測(cè)值收斂到了真實(shí)值。

請(qǐng)注意，預(yù)測(cè)值和真實(shí)值之間還是有一些輕微差異的。這是可取的，因?yàn)樗乐沽诉^(guò)度擬合，并且使得神經(jīng)網(wǎng)絡(luò)具有更強(qiáng)的泛化能力。

下一步

幸運(yùn)的是，我們的探索還沒(méi)有結(jié)束。關(guān)于神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)還有很多需要學(xué)習(xí)的地方。例如：

除了 Sigmoid 函數(shù)之外，我們還可以使用哪些激活函數(shù)？

在訓(xùn)練神經(jīng)網(wǎng)絡(luò)時(shí)使用學(xué)習(xí)率

使用卷積進(jìn)行圖像分類(lèi)任務(wù)

最后一點(diǎn)想法

在撰寫(xiě)此文的過(guò)程中，我已經(jīng)學(xué)到了很多，希望本文也能對(duì)你有所幫助。

在沒(méi)有完全了解神經(jīng)網(wǎng)絡(luò)內(nèi)部工作原理的情況下，雖然使用諸如 TensorFlow 和 Keras 之類(lèi)的深度學(xué)習(xí)庫(kù)可以讓我們很容易地建立深度網(wǎng)絡(luò)，但我認(rèn)為對(duì)于有抱負(fù)的數(shù)據(jù)科學(xué)家而言，深入理解神經(jīng)網(wǎng)絡(luò)還是大有裨益的。

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

python

python

+關(guān)注

關(guān)注
56

文章
4827

瀏覽量
86701
深度學(xué)習(xí)

深度學(xué)習(xí)

+關(guān)注

關(guān)注
73

文章
5561

瀏覽量
122789

原文標(biāo)題：無(wú)需深度學(xué)習(xí)框架，如何從零開(kāi)始用Python構(gòu)建神經(jīng)網(wǎng)絡(luò)

文章出處：【微信號(hào)：gh_ecbcc3b6eabf，微信公眾號(hào)：人工智能和機(jī)器人研究院】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

搜索歷史

從零開(kāi)始學(xué)習(xí)用Python構(gòu)建神經(jīng)網(wǎng)絡(luò)

評(píng)論