最近紅色石頭在瀏覽網(wǎng)頁的時候,偶然發(fā)現(xiàn)一份非常不錯的 AI 資源,就是這本《AI 算法工程師手冊》 。本文將給大家推薦這本優(yōu)秀教材,并作詳細的介紹。
這本《AI 算法工程師手冊》已正式開源,無需購買紙質書籍,可以直接在線閱讀,體驗感爆棚。在線閱讀地址為:
http://www.huaxiaozhuan.com/
作者簡介
首先不得不提一下本書的作者,作者華校專,曾經在阿里巴巴擔任資深算法工程師,現(xiàn)任智易科技首席算法研究員。他還是《Python 大戰(zhàn)機器學習》書籍的作者。
書籍介紹
這本《AI 算法工程師手冊》是作者多年以來學習總結的筆記,經整理之后開源于世。關于為什么將完整書籍開源,作者是這樣說的:曾有出版社約稿,但是考慮到出版時間周期較長,而且書本購買成本高不利于技術廣泛傳播,因此就采取開源的形式。
既然本書是 AI 算法工程師的手冊,因此內容非常豐富,基本涵蓋了機器學習、深度學習等領域的很多重要理論知識和實戰(zhàn)經驗,同時也介紹了工程應用中經常使用的 AI 工具和編程庫。
書籍整體包含了 5 大塊內容,分別是:
數(shù)學基礎
統(tǒng)計學習
深度學習
自然語言處理
工具
下面我們分別來看一下各模塊的內容。
1. 數(shù)學基礎
提升 AI 內功心法離不開扎實的數(shù)學基礎。本書數(shù)學基礎這部分,作者主要介紹了最重要的 4 點:
1. 線性代數(shù)基礎
2. 概率論基礎
3. 數(shù)值計算基礎
4. 蒙特卡洛方法與 MCMC 采樣
例如線性代數(shù)部分最基本的基礎知識:
2. 統(tǒng)計學習
這部分內容作者花了比較大的篇幅,主要介紹的是機器學習中一些常見的算法,包括線性回歸、感知機、支持向量機、決策樹、集成學習等。同時還包括模型評估、特征選擇、降維等。具體內容如下:
0. 機器學習簡介
1. 線性代數(shù)基礎
2. 支持向量機
3. 樸素貝葉斯
4. 決策樹
5. knn
6. 集成學習
7. 梯度提升樹
8. 特征工程
9. 模型評估
10. 降維
11. 聚類
12. 半監(jiān)督學習
13. EM算法
14. 最大熵算法
15. 隱馬爾可夫模型
16. 概率圖與條件隨機場
17. 邊際概率推斷
每個算法的理論介紹非常詳細、數(shù)學推導完整,例如支持向量機中關于對偶問題的推導:
3. 深度學習
這部分主要介紹深度學習神經網(wǎng)絡的基本知識和模型,包括前饋神經網(wǎng)絡、卷積神經網(wǎng)絡、循環(huán)神經網(wǎng)絡等。具體內容如下:
0. 深度學習簡介
2. 反向傳播算法
3. 正則化
4. 最優(yōu)化基礎
5. 卷積神經網(wǎng)絡
6. 循環(huán)神經網(wǎng)絡
7. 工程實踐指導原則
這部分詳細介紹了神經網(wǎng)絡模型的基本結構和訓練方法,例如列舉了經典 CNN 結構:LeNet、AlexNet、VGG-Net、Inception、ResNet、ResNet 變種、SENet、DenseNet。
1998 年 LeCun 推出的 LeNet 網(wǎng)絡
4. 自然語言處理
這部分作者主要介紹了自然語言處理領域的 2 個方面:
1. 主題模型
Unigram Model
pLSA Model
LDA Model
型討論
2. 詞向量
向量空間模型 VSM
LSA
Word2Vec
GloVe
5. 工具
這部分主要介紹了 AI 常用工具和函數(shù)庫,具體內容如下:
1. CRF
2. lightgbm
3. xgboost
4. scikit-learn
5. spark
6. numpy
7. scipy
8. matplotlib
9. pandas
這部分的內容更加側重于 AI 實戰(zhàn),包含很多具體函數(shù)庫的使用教程和代碼。例如 lightbgm 是一個快速的,分布式的,高性能的基于決策樹算法的梯度提升框架??捎糜谂判颍诸?,回歸以及很多其他的機器學習任務中。本書對 lightbgm 的安裝、各參數(shù)含義、調參、使用等都作了詳細的介紹,宛如一份優(yōu)秀的中文文檔!
這里附上 lightbgm 簡單的 pip 安裝方法:
pipinstall lightgbmpip install --no-binary :all: lightgbm#從源碼編譯安裝pip install lightgbm --install-option=--mpi#從源碼編譯安裝 MPI 版本pip install lightgbm --install-option=--gpu#從源碼編譯安裝 GPU 版本pip install lightgbm --install-option=--gpu --install-option="--opencl-include-dir=/usr/local/cuda/include/"--install-option="--opencl-library=/usr/local/cuda/lib64/libOpenCL.so"#從源碼編譯安裝,指定配置#可選的配置有:# boost-root# boost-dir# boost-include-dir# boost-librarydir# opencl-include-dir# opencl-library
同樣,像 xgboost、scikit-learn 等庫,書中也作了詳盡的解釋。除此之外,還有 spark 的內容哦,可以說是非常全面了。
最后
不得不說,這本《AI 算法工程師手冊》是一本比較完備的 AI 書籍,既包含了算法理論,也有實戰(zhàn) AI 算法庫的使用。作為一份參考手冊還是非常不錯的!
更重要的是本書完全開源,直接在線閱讀就好了。不過注意該書籍僅供個人學習使用,非作者同意不得應用于商業(yè)領域。
-
開源
+關注
關注
3文章
3689瀏覽量
43831 -
深度學習
+關注
關注
73文章
5561瀏覽量
122794 -
AI算法
+關注
關注
0文章
263瀏覽量
12698
原文標題:開源!《AI 算法工程師手冊》中文教程正式發(fā)布!
文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄


新編電氣工程師手冊
物聯(lián)網(wǎng)工程師為什么要學Linux?



電子工程師如何利用AI革新設計范式


GpuGeek云平臺正式上線,專注AI算法工程師需求
圖像算法工程師的利器——SpeedDP深度學習算法開發(fā)平臺


FPGA算法工程師、邏輯工程師、原型驗證工程師有什么區(qū)別?

評論