深度學(xué)習(xí)(Deep Learning)是機(jī)器學(xué)習(xí)中一種基于對(duì)數(shù)據(jù)進(jìn)行表征學(xué)習(xí)的方法。近年來(lái),深度學(xué)習(xí)已經(jīng)在科技界、工業(yè)界日益廣泛地應(yīng)用。隨著全球各領(lǐng)域多樣化數(shù)據(jù)的極速積累和計(jì)算資源的成熟化商業(yè)服務(wù),深度學(xué)習(xí)已經(jīng)成為人工智能領(lǐng)域最有效的方法。
目前,深度學(xué)習(xí)技術(shù)在語(yǔ)音識(shí)別、圖像分類、商品推薦等各應(yīng)用領(lǐng)域不斷刷新著智能處理水平紀(jì)錄。但是與此同時(shí),深度學(xué)習(xí)模型難以解釋,參數(shù)調(diào)優(yōu)困難,參數(shù)規(guī)模大訓(xùn)練周期長(zhǎng)等問(wèn)題也困擾著研究和開(kāi)發(fā)人員。
當(dāng)下介紹深度學(xué)習(xí)的書(shū)籍很多,但是《深度學(xué)習(xí)實(shí)戰(zhàn)》一書(shū)視角不同,它重在實(shí)踐,內(nèi)容全面?!渡疃葘W(xué)習(xí)實(shí)戰(zhàn)》英文版由O'REILLY出版社出版,中文版由機(jī)械工業(yè)出版社出版,作者Douwe Osinga曾供職于Google公司,是深度學(xué)習(xí)研究及實(shí)踐方面的一位資深專家。
、
點(diǎn)擊封面查看書(shū)籍詳情
在書(shū)中,所有的例子都是用Python編寫(xiě)的,并且大部分代碼的實(shí)現(xiàn)都依賴于優(yōu)秀的Keras框架,每章的代碼存放在一個(gè)notebook中,可以從網(wǎng)站下載學(xué)習(xí)。在實(shí)例章節(jié),每章針對(duì)一種技術(shù)應(yīng)用場(chǎng)景,從數(shù)據(jù)獲取技巧開(kāi)始,接著是幾個(gè)完成本章目標(biāo)的技巧和一個(gè)數(shù)據(jù)可視化的技巧。
文本處理領(lǐng)域
詞嵌入是自然語(yǔ)言處理的基本方法,我們首先在第3章將使用預(yù)先訓(xùn)練好的詞嵌入模型計(jì)算單詞相似性,然后展示一些有趣的Word2vec數(shù)學(xué)特性,探索如何對(duì)高維空間進(jìn)行可視化,接下來(lái)利用Word2vec等詞嵌入的語(yǔ)義特性進(jìn)行特定領(lǐng)域中的排名。
推薦系統(tǒng)在商業(yè)領(lǐng)域應(yīng)用廣泛,它基于先前收集到的用戶評(píng)級(jí)數(shù)據(jù)進(jìn)行訓(xùn)練。我們?cè)诘?章會(huì)使用新訓(xùn)練的嵌入來(lái)預(yù)測(cè)電影的評(píng)論分?jǐn)?shù),基于維基百科傳出鏈接(outgoing link)構(gòu)建一個(gè)簡(jiǎn)單的電影推薦系統(tǒng)。
循環(huán)神經(jīng)網(wǎng)絡(luò)是一類善于處理時(shí)間或序列的重要神經(jīng)網(wǎng)絡(luò),在文本處理中應(yīng)用廣泛,我們?cè)诘?章使用RNN根據(jù)文本風(fēng)格生成類似莎士比亞風(fēng)格的文本,并對(duì)RNN的工作進(jìn)行可視化。
智能客服會(huì)應(yīng)用問(wèn)答系統(tǒng),其中關(guān)鍵一環(huán)是文本問(wèn)題匹配,在第6章我們使用來(lái)自Stack Exchange網(wǎng)站的數(shù)據(jù)來(lái)構(gòu)建整個(gè)問(wèn)題的詞嵌入,然后使用Pandas從這些嵌入來(lái)匹配查找類似的文檔或問(wèn)題。
在社交網(wǎng)絡(luò)中人們會(huì)為給定的一小段文本來(lái)推薦適用的表情符號(hào),在第7章我們使用Twitter API實(shí)現(xiàn)推文收集,用貝葉斯分類器來(lái)闡述基線性能,還介紹卷積模型以及組合模型及模型調(diào)優(yōu)方法。
之后,在第8章我們將介紹序列神經(jīng)網(wǎng)絡(luò)來(lái)學(xué)習(xí)文本片段之間的轉(zhuǎn)換,從古騰堡項(xiàng)目(Project Gutenberg)的19世紀(jì)小說(shuō)中提取對(duì)話,并利用seq2seq工具包來(lái)訓(xùn)練聊天機(jī)器人。
圖像處理領(lǐng)域
深度學(xué)習(xí)技術(shù)在圖像識(shí)別和計(jì)算機(jī)視覺(jué)領(lǐng)域產(chǎn)生了比較深遠(yuǎn)的影響。在圖像分類任務(wù)中,數(shù)十層(有時(shí)超過(guò)一百層)的神經(jīng)網(wǎng)絡(luò)已被證明十分有效,訓(xùn)練這樣的網(wǎng)絡(luò)需要極佳的處理能力和海量的訓(xùn)練圖像。
在第9章我們將介紹如何加載預(yù)訓(xùn)練網(wǎng)絡(luò)(該網(wǎng)絡(luò)是Keras提供的五個(gè)預(yù)訓(xùn)練網(wǎng)絡(luò)之一),研究圖像輸入網(wǎng)絡(luò)之前所需要預(yù)處理過(guò)程,展示如何運(yùn)行網(wǎng)絡(luò)的推理模式。針對(duì)其他任務(wù)的新數(shù)據(jù)進(jìn)行部分的重新訓(xùn)練也涵蓋了遷移學(xué)習(xí)(transfer learning)概念。
在網(wǎng)絡(luò)搜索中,可能有人會(huì)采取以圖搜圖模式。在第10章我們構(gòu)建通過(guò)實(shí)例圖片來(lái)搜索圖的搜索引擎,我們研究如何查詢維基數(shù)據(jù)(Wikidata),并從維基百科中獲取適合的基礎(chǔ)圖片集開(kāi)始著手。然后,我們將使用預(yù)訓(xùn)練網(wǎng)絡(luò)為每個(gè)圖片賦值,我們將研究主成分分析(principal components analysis,PCA)作為可視化展現(xiàn)圖與圖之間關(guān)系的一種方法。
在現(xiàn)實(shí)世界中,我們往往需要從一幅圖像中檢測(cè)提取多個(gè)目標(biāo)對(duì)象的信息,這是圖像處理中經(jīng)典任務(wù),也是一個(gè)十分活躍的研究領(lǐng)域,在Keras上的Python notebook中重現(xiàn)其中最先進(jìn)的算法較為棘手。
在第11章我們使用Faster RCNN進(jìn)行訓(xùn)練完成目標(biāo)檢測(cè)任務(wù),F(xiàn)aster RCNN在用于訓(xùn)練圖像分類器的同一個(gè)特征圖上并行訓(xùn)練區(qū)域建議模型,而不是單獨(dú)處理區(qū)域建議問(wèn)題。
使用計(jì)算機(jī)來(lái)“魔術(shù)”渲染圖像很有趣,在第12章我們將探討一些用于可視化展現(xiàn)卷積網(wǎng)絡(luò)進(jìn)行圖像分類時(shí)所見(jiàn)內(nèi)容的技術(shù)。
然后,我們將介紹尺度(octaves)、深度夢(mèng)想(deep dreaming)技術(shù)、格拉姆矩陣(gram matrices)等,之后,我們進(jìn)一步將這種技術(shù)應(yīng)用于現(xiàn)有圖像,并采用文森特·梵高的名畫(huà)《星空》的繪畫(huà)風(fēng)格渲染照片,使用兩種樣式的圖像渲染同一張圖片,從而獲得一個(gè)兩種風(fēng)格之間的渲染結(jié)果。
基于實(shí)例生成圖像是一個(gè)熱門的研究領(lǐng)域,在該領(lǐng)域中每月都會(huì)涌現(xiàn)出新想法和新突破。
在第13章,我們將研究一個(gè)略有局限性的領(lǐng)域:手繪草圖,從Google的Quick Draw數(shù)據(jù)集開(kāi)始著手,建立一個(gè)能夠?qū)W習(xí)“貓屬性”的自編碼器模型。我們還研究條件變分自編碼器(conditional variational autoencoders),它在訓(xùn)練時(shí)會(huì)考慮圖像標(biāo)簽,因此能夠以隨機(jī)樣式再現(xiàn)特定類的圖像。
在線搜索“免費(fèi)圖標(biāo)”可以得到很多搜索結(jié)果。但是,這些結(jié)果并不是真正免費(fèi)的(即沒(méi)有任何使用限制的免費(fèi)使用),大部分結(jié)果只是讓用戶感覺(jué)好像不需要花錢。此外,你還不能免費(fèi)地重用這些圖標(biāo),并且通常情況下網(wǎng)站會(huì)強(qiáng)烈建議你購(gòu)買它們。
因此,在第14章,我們使用條件變分自編碼器、生成式對(duì)抗網(wǎng)絡(luò)(generative adversarial network,GAN)、RNN三種深度網(wǎng)絡(luò)生成圖標(biāo),從如何下載、提取,并將圖標(biāo)處理成可使用的標(biāo)準(zhǔn)格式。
音樂(lè)處理
語(yǔ)音識(shí)別和語(yǔ)音合成技術(shù)使得亞馬遜Alexa和GoogleHome成為可能,然而,語(yǔ)音處理任務(wù)實(shí)際上是在亞馬遜、Google或蘋(píng)果的數(shù)據(jù)中心運(yùn)行的,因此我們還不認(rèn)為這些是真正的深度學(xué)習(xí)試驗(yàn)。盡管Mozilla的深度語(yǔ)音(Deep Speech)已取得了令人矚目的進(jìn)步,建立最先進(jìn)的語(yǔ)音識(shí)別系統(tǒng)還是十分困難的。
第15章關(guān)注的重點(diǎn)是音樂(lè),我們從訓(xùn)練音樂(lè)分類器模型開(kāi)始,該模型可以告訴我們正在聽(tīng)的是什么音樂(lè)。然后,我們使用模型結(jié)果建立本地MP3索引,使用Spotfy API建立公開(kāi)播放列表語(yǔ)料庫(kù),并用該庫(kù)建立音樂(lè)推薦系統(tǒng)。
最后,該書(shū)在第16章介紹了在實(shí)際生產(chǎn)系統(tǒng)中使用模型的內(nèi)容,讓模型在真實(shí)的服務(wù)器或移動(dòng)設(shè)備上運(yùn)行。
近年,全球人工智能研究機(jī)構(gòu)、研究院相繼成立,深度學(xué)習(xí)成為人工智能的核心必備工具。對(duì)于深度學(xué)習(xí)研究人員,特別是應(yīng)用開(kāi)發(fā)工程師而言,如何擺脫深度學(xué)習(xí)模型的“黑盒”困境、如何讓深度學(xué)習(xí)模型設(shè)計(jì)更加簡(jiǎn)潔高效、如何將深度學(xué)習(xí)快速地應(yīng)用到具體的業(yè)務(wù)領(lǐng)域,該書(shū)進(jìn)行了詳細(xì)的介紹及代碼示例,在每個(gè)實(shí)例場(chǎng)景,作者還提供具有重要價(jià)值的實(shí)踐經(jīng)驗(yàn)提點(diǎn)。讀者如果想要進(jìn)一步了解相關(guān)內(nèi)容,可以參閱該書(shū)相關(guān)部分。
-
代碼
+關(guān)注
關(guān)注
30文章
4900瀏覽量
70758 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5561瀏覽量
122800 -
數(shù)據(jù)可視化
+關(guān)注
關(guān)注
0文章
476瀏覽量
10804
原文標(biāo)題:從代碼設(shè)計(jì)到應(yīng)用開(kāi)發(fā),入坑深度學(xué)習(xí)看這本書(shū)就夠了
文章出處:【微信號(hào):rgznai100,微信公眾號(hào):rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
【「Yocto項(xiàng)目實(shí)戰(zhàn)教程:高效定制嵌入式Linux系統(tǒng)」閱讀體驗(yàn)】01初讀體驗(yàn)
【「零基礎(chǔ)開(kāi)發(fā)AI Agent」閱讀體驗(yàn)】+讀《零基礎(chǔ)開(kāi)發(fā)AI Agent》掌握扣子平臺(tái)開(kāi)發(fā)智能體方法
18個(gè)常用的強(qiáng)化學(xué)習(xí)算法整理:從基礎(chǔ)方法到高級(jí)模型的理論技術(shù)與代碼實(shí)現(xiàn)

學(xué)習(xí)智能體開(kāi)發(fā)
【「極速探索HarmonyOS NEXT 」閱讀體驗(yàn)】 一本書(shū)開(kāi)啟了鴻蒙開(kāi)發(fā)的整個(gè)生態(tài)資源
代碼+案例+生態(tài):武漢芯源半導(dǎo)體CW32嵌入式開(kāi)發(fā)實(shí)戰(zhàn)正式出版
【「大模型啟示錄」閱讀體驗(yàn)】對(duì)本書(shū)的初印象
《DNESP32S3使用指南-IDF版_V1.6》第一章 本書(shū)學(xué)習(xí)方法
在學(xué)習(xí)go語(yǔ)言的過(guò)程踩過(guò)的坑
FPGA做深度學(xué)習(xí)能走多遠(yuǎn)?
【「OpenHarmony開(kāi)發(fā)與實(shí)踐 | 基于紅莓RK2206開(kāi)發(fā)板」閱讀體驗(yàn)】一點(diǎn)小小的意見(jiàn)
新書(shū)推薦 | TSMaster開(kāi)發(fā)從入門到精通

評(píng)論