一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

自學(xué)機(jī)器學(xué)習(xí)的誤區(qū)和陷阱

8g3K_AI_Thinker ? 來源:未知 ? 作者:李倩 ? 2018-05-14 15:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

▌0. 背景

寫這篇文章的初衷是大部分私信我的朋友都想了解如何入門/轉(zhuǎn)行機(jī)器學(xué)習(xí),搭上人工智能這列二十一世紀(jì)的快車。再加上這個問題每隔一陣子就會在知乎時間線上出現(xiàn)一次,因此想寫一篇文章來“一勞永逸”的分享我的觀點。

文章的宗旨是:1. 指出一些自學(xué)的誤區(qū) 2. 不過多的推薦資料 3. 提供客觀可行的學(xué)習(xí)表 4. 給出進(jìn)階學(xué)習(xí)的建議。這篇文章的目標(biāo)讀者是計劃零基礎(chǔ)自學(xué)的朋友,對數(shù)學(xué)/統(tǒng)計基礎(chǔ)要求不高,比如:

在讀的學(xué)生朋友

非計算機(jī)行業(yè)的讀者

已經(jīng)工作但想將機(jī)器學(xué)習(xí)/數(shù)據(jù)分析和自己的本職工作相結(jié)合的朋友

因此,這篇文章對于已經(jīng)身處機(jī)器學(xué)習(xí)領(lǐng)域可能幫助不大。同時再次聲明這只是我的個人看法,請大家有選擇的性閱讀,探索適合自己的學(xué)習(xí)方法。

▌1. 自學(xué)機(jī)器學(xué)習(xí)的誤區(qū)和陷阱

1.1. 不要試圖掌握所有的相關(guān)數(shù)學(xué)知識再開始學(xué)習(xí)

在很多相關(guān)的回答中(https://www.zhihu.com/question/60064269/answer/172305599),我都一再強(qiáng)調(diào)不要試圖補(bǔ)足數(shù)學(xué)知識再開始學(xué)習(xí)機(jī)器學(xué)習(xí)。一般來說,大部分機(jī)器學(xué)習(xí)課程/書籍都要求:

線性代數(shù):矩陣/張量乘法、求逆,奇異值分解/特征值分解,行列式,范數(shù)等

統(tǒng)計與概率:概率分布,獨立性與貝葉斯,最大似然(MLE)和最大后驗估計(MAP)等

優(yōu)化:線性優(yōu)化,非線性優(yōu)化(凸優(yōu)化/非凸優(yōu)化)以及其衍生的求解方法如梯度下降、牛頓法、基因算法模擬退火等

微積分:偏微分,鏈?zhǔn)椒▌t,矩陣求導(dǎo)等

信息論、數(shù)值理論等

一般人如果想要把這些知識都補(bǔ)全再開始機(jī)器學(xué)習(xí)往往需要很長時間,容易半途而廢。而且這些知識是工具不是目的,我們的目標(biāo)又不是成為運籌學(xué)大師。建議在機(jī)器學(xué)習(xí)的過程中哪里不會補(bǔ)哪里,這樣更有目的性且耗時更低。

1.2. 不要把深度學(xué)習(xí)作為入門的第一門課

雖然很多人都是沖著深度學(xué)習(xí)來的,但把深度學(xué)習(xí)作為機(jī)器學(xué)習(xí)第一課不是個好主意。原因如下:

深度學(xué)習(xí)的黑箱性更加明顯,很容易學(xué)得囫圇吞棗

深度學(xué)習(xí)的理論/模型架構(gòu)/技巧還在一直變化當(dāng)中,并未塵埃落定

深度學(xué)習(xí)實驗對硬件要求高,不太適合自學(xué)或者使用個人電腦進(jìn)行學(xué)習(xí)

更多討論可以看我的回答:深度學(xué)習(xí)的教學(xué)和課程,與傳統(tǒng) CS 的教學(xué)和課程有什么區(qū)別?(https://www.zhihu.com/question/63883727/answer/225499427)

1.3. 不要收集過多的資料 & 分辨資料的時效性

機(jī)器學(xué)習(xí)的資料很多,動輒就有幾個G的材料可以下載或者觀看。而很多朋友都有“收集癖”,一下子購買十幾本書的人我也常常能夠看到。

機(jī)器學(xué)習(xí)的發(fā)展和變化速度很快。在入門期間,建議“小而精”的選擇資料,選擇近期出版的且口碑良好的書籍。我不止一次的提到這個例子:

在很多深度學(xué)習(xí)的教科書中,尤其是10年以前的教科書中都還依然把Sigmoid當(dāng)作默認(rèn)的激活函數(shù)。但事實上,整流函數(shù)(ReLu)以及其拓展變形函數(shù),如Leaky ReLu早就成為了主流的深度學(xué)習(xí)激活函數(shù)。但因為知識的滯后性,很多課程/書籍甚至都沒有介紹ReLu的章節(jié)。

一般來說,我比較推薦近5年內(nèi)出版的書籍,或者10年以后出版的書籍。有些書籍雖然是經(jīng)典,比如Tom Mitchell的《機(jī)器學(xué)習(xí)》,但因為其出版已經(jīng)超過20年,還是不建議大家購買。

在這篇文章中我所推薦的書籍和課程都相對比較經(jīng)典,同時屬于緊跟時代潮流的。入門階段我推薦了1門課程和2本書,進(jìn)階階段推薦了1本書,深度學(xué)習(xí)推薦了1門課程一本書,高級階段推薦了2本額外書籍。

▌2. 機(jī)器學(xué)習(xí)的一些前期準(zhǔn)備

2.1. 硬件選擇

另一個大家常問的問題是:是否可以用自己的筆記本電腦進(jìn)行機(jī)器學(xué)習(xí)。答案是肯定的,大部分市面上的數(shù)據(jù)集都可以放到你的內(nèi)存中運行。在入門階段,我們很少會用到非常大的數(shù)據(jù)集,一般最大也就是MNIST,完全可以使用個人筆記本電腦進(jìn)行運行。

請不要打著學(xué)習(xí)的名義重新購買機(jī)器...

2.2. 軟件選擇

如果要做深度學(xué)習(xí),Linux還是首選,因為其對很多學(xué)習(xí)模型支持比較好(主要是深度學(xué)習(xí)的Library)。但即使你使用的是Windows系統(tǒng),也可以用虛擬機(jī)裝Ubuntu來進(jìn)行學(xué)習(xí)。小型的深度學(xué)習(xí)模型足夠了,大型的深度學(xué)習(xí)我們很少在本地/個人計算機(jī)上運行。

至于編程語言,首推Python,因為其良好的拓展支持性,主流的工具包都有Python版本。在特定情況下,選擇R作為編程語言也是可以的。其他可能的語言還包括C++、JavaMatlab,但我個人不大推薦。

此處也想額外提一句,因為編程屬于機(jī)器學(xué)習(xí)基本要求之一,所以推薦大家可以自學(xué)一些基礎(chǔ)編程的知識(如Python),在文中不再贅述。

2.3. 語言能力

學(xué)好英語,至少打下閱讀和聽力的基礎(chǔ)。雖然人工智能領(lǐng)域中國現(xiàn)在已經(jīng)做得很不錯,但主流的書籍、期刊和會議,資料都是英文的。我們可以接受翻譯版,但最好的方法還是自己有能力直接閱讀。即使你將來不做機(jī)器學(xué)習(xí),英文閱讀能力還是會有很大的幫助。

▌3. 機(jī)器學(xué)習(xí)課程表

3.1. 第一階段:基礎(chǔ)入門(3-6個月)

入門的第一步是學(xué)習(xí)一些經(jīng)典課程并配套經(jīng)典書籍,一般來說這個過程在半年之內(nèi)比較合適。在這個部分我介紹的課程和書籍都屬于難度非常低的,對數(shù)學(xué)和編程都沒什么太大的要求。

3.1.1. 吳恩達(dá)Cousera機(jī)器學(xué)習(xí)課程

Andrew Ng的機(jī)器學(xué)習(xí)課程(Machine Learning | Coursera)是很多人的啟蒙課程,難度適中且完全免費。Coursera上總共有49285個人給出了評分,平均得分4.9分,滿分5分。據(jù)我個人觀察,大部分Coursera上的課程評分處于4-4.5分之間,能做到4.9分的課程寥寥無幾。另一個值得關(guān)注的是,這門課有接近五萬人給出評分,統(tǒng)計學(xué)知識告訴我們這個樣本較大所以評分應(yīng)該趨近于其真實值,比較可信。根據(jù)Freecodecamp的統(tǒng)計,這門課是所有在線Machine Learning課程中最受到大家好評的課程。另一個比較直接的觀察是如果大家在知乎上搜索“機(jī)器學(xué)習(xí)如何入門?”,大部分答案都提到了Andrew的這門入門課程,所以這是一門絕對的口碑課程。

3.1.2. Python機(jī)器學(xué)習(xí) & Introduction to Statistical Learning with R

在學(xué)習(xí)吳恩達(dá)的在線課程時,推薦同時閱讀相關(guān)的機(jī)器學(xué)習(xí)書籍補(bǔ)充理論知識。我再次推薦這兩本非常好的入門書籍,在我的專欄也有對于這兩本書的介紹。

Python機(jī)器學(xué)習(xí):這本書出版于2015年并多次再版,在亞馬遜中國上我們可以找到影印版和翻譯版。這本書去掉了大量的數(shù)學(xué)推導(dǎo)的部分,僅保留了機(jī)器學(xué)習(xí)的核心應(yīng)用。閱讀本書可以快速對如何使用Python機(jī)器學(xué)習(xí)框架Sklearn有一個基本的了解,可以很快上手開始工作。本書涉及的內(nèi)容很廣泛,雖然只有400多頁,但內(nèi)容涉及了數(shù)據(jù)預(yù)處理(Data Preprocessing), 維度壓縮和核函數(shù)(Dimension Reduction & Kernel),評估方法如交叉驗證,集成學(xué)習(xí),情感分析,聚類,甚至還包括了神經(jīng)網(wǎng)絡(luò)和Theano。更多介紹:帶你讀機(jī)器學(xué)習(xí)經(jīng)典(三): Python機(jī)器學(xué)習(xí)(Chapter 1&2)(https://zhuanlan.zhihu.com/p/28647608)

Introduction to Statistical Learning with R(ISL):相信正在機(jī)器學(xué)習(xí)苦海中遨游的朋友們肯定都聽過大名鼎鼎的The Element of Statistical Learning, 這本頻率學(xué)派的統(tǒng)計學(xué)習(xí)“圣經(jīng)”被大家叫做ESL。而ISL正是基于滿足更廣大閱讀人群的目的而推出的;ISL是ESL的入門版,不僅大量的去除了繁復(fù)的數(shù)學(xué)推導(dǎo),還加入了R編程的部分,方便大家可以盡快上手。這本書是我推薦書單第一名:ISL的電子版是免費的:點擊下載(http://www-bcf.usc.edu/~gareth/ISL/ISLR%20First%20Printing.pdf)。更多介紹:帶你讀機(jī)器學(xué)習(xí)經(jīng)典(一): An Introduction to Statistical Learning (Chapter 1&2)(https://zhuanlan.zhihu.com/p/27556007)

3.1.3. 周志華《機(jī)器學(xué)習(xí)》

周志華老師的《機(jī)器學(xué)習(xí)》也被大家親切的叫做“西瓜書”。雖然只有幾百頁,但內(nèi)容涵蓋比較廣泛。然而和其他人的看法不同,我建議把西瓜書作為參考書而不是主力閱讀書。西瓜書因為篇幅的限制,涵蓋了很多的內(nèi)容但無法詳細(xì)的展看來講,對于初學(xué)者自學(xué)來說實際閱讀難度很大。這本書更適合作為學(xué)校的教材或者中階讀者自學(xué)使用,入門時學(xué)習(xí)這本書籍難度稍微偏高了一些。

我個人建議的用法是在學(xué)習(xí)網(wǎng)課和閱讀ISL遇到疑惑時可以參考西瓜書的相關(guān)章節(jié),但入門階段沒有必要一章一章的閱讀,建議在這個階段只閱讀前十章即可。

3.2. 第二階段:進(jìn)階學(xué)習(xí)(3-6個月)

在這個階段,你已經(jīng)對機(jī)器學(xué)習(xí)有了基本的了解。如果你認(rèn)真的閱讀了ISL并上完了吳恩達(dá)的課程,我相信你已經(jīng)在理論上明白了什么是線性回歸,什么是數(shù)據(jù)壓縮,對特征工程以及簡單的回歸/預(yù)測問題有了理論上的基礎(chǔ)。這個時候最重要的就是進(jìn)行實踐!

3.2.1. Kaggle挑戰(zhàn)賽/練習(xí)

Kaggle(Your Home for Data Science)在數(shù)據(jù)分析領(lǐng)域早已大名鼎鼎,甚至可以說是數(shù)據(jù)分析第一社區(qū),前一陣子剛剛被谷歌收購。Kaggle上有很多很好的數(shù)據(jù)集和挑戰(zhàn)賽,你可以嘗試這些挑戰(zhàn)取得名次,甚至拿到獎金,對于將來找工作也非常有幫助。而且Kaggle的另一大優(yōu)勢是網(wǎng)友會分享他們的經(jīng)驗和看法,你也可以提出問題讓大家來幫你提出一些修正方法。

國內(nèi)也有類似的平臺,比如天池大數(shù)據(jù)競賽,其他類似的平臺還包括DataCastle。

使用Kaggle的目的主要是將技能落在實處,防止練就一身屠龍之技。機(jī)器學(xué)習(xí)最大的幻覺就是覺得自己什么都懂了,但等到真的使用時發(fā)現(xiàn)并不奏效,而Kaggle是一個低成本的應(yīng)用機(jī)器學(xué)習(xí)的機(jī)會。

3.2.2. Sklearn文檔學(xué)習(xí)

Sklearn(scikit-learn: machine learning in Python-http://scikit-learn.org/stable/)是Python上最流行的機(jī)器學(xué)習(xí)/數(shù)據(jù)科學(xué)工具包,上文介紹的Python Machine Learning書中就大量使用Sklearn的API。和使用Kaggle的目的一致,學(xué)習(xí)的Sklearn的文檔也是一種實踐過程。比較推薦的方法是把主流機(jī)器學(xué)習(xí)模型Sklearn中的例子都看一遍。

Sklearn的文檔是少數(shù)寫的跟教程一樣的技術(shù)文檔,很具有閱讀價值。舉個簡單的例子,假設(shè)你想學(xué)習(xí)Python中使用邏輯回歸,就可以參考: Logistic Regression 3-class Classifier(http://scikit-learn.org/stable/auto_examples/linear_model/plot_iris_logistic.html#sphx-glr-auto-examples-linear-model-plot-iris-logistic-py)

Sklearn的文檔不僅提供了練習(xí)數(shù)據(jù)、sklearn的相關(guān)代碼實例,還提供了可視化圖。

3.2.2. 周志華機(jī)器學(xué)習(xí)

再次提到周老師是因為西瓜書是值得常常翻看的一本書,在kaggle挑戰(zhàn)和閱讀Sklearn文檔的過程中你還會時不時的遇到一些新的名詞,比如流形學(xué)習(xí)(manifold learning)等。這個時候你會發(fā)現(xiàn)西瓜書真的是一本中級階段大而全的書籍:)

3.3. 第三階段(可選*):深度學(xué)習(xí)(3-6個月)

因為深度學(xué)習(xí)是當(dāng)下的熱點,很多公司都在尋找深度學(xué)習(xí)人才。雖然深度學(xué)習(xí)只是機(jī)器學(xué)習(xí)的一個子集,但有興趣朝這個方向發(fā)展的朋友可以在完成以上學(xué)習(xí)后單獨學(xué)習(xí)一下深度學(xué)習(xí)。

3.3.1. 吳恩達(dá)深度學(xué)習(xí)課程

吳恩達(dá)在八月份的時候通過Deeplearning.ai和Coursera平臺推出了最新系列的五門深度學(xué)習(xí)課程(deeplearning.ai)。有條件的朋友可以通過Coursera學(xué)習(xí)獲得證書,最近網(wǎng)易云課堂也上線了這門課的翻譯版。如果想要上其中的課程,需要先注冊報名「深度學(xué)習(xí)工程師微專業(yè)」 深度學(xué)習(xí)工程師微專業(yè) - 一線人工智能大師吳恩達(dá)親研-網(wǎng)易云課堂 - 網(wǎng)易云課堂(http://mooc.study.163.com/smartSpec/detail/1001319001.htm),之后就可以分別點開每門課單獨進(jìn)行學(xué)習(xí)。和Coursera上的DL同步,現(xiàn)在云課堂也上線了五門中的前三門課程,而卷積網(wǎng)絡(luò)(CNN)和循環(huán)網(wǎng)絡(luò)(RNN)還未開放。

更多關(guān)于網(wǎng)易云課堂上深度學(xué)習(xí)課程的介紹可以看:如何評價網(wǎng)易云課堂上線的吳恩達(dá)Deep Learning課程?(https://www.zhihu.com/question/64615398/answer/222596302)

3.3.2. Deep Learning - by IanGoodFellow

深度學(xué)習(xí)這本書是由當(dāng)下深度學(xué)習(xí)領(lǐng)域的幾位領(lǐng)軍人物所著,包含三大巨頭之一的Bengio,還有教父Hinton來作序推薦。這本書的中文本翻譯由張志華教授團(tuán)隊負(fù)責(zé),在github上免費放出了翻譯版本,印刷版也可以從亞馬遜中國上買到。

英文版:Deep Learning

http://www.deeplearningbook.org/

中文版:exacity/deeplearningbook-chinese

https://github.com/exacity/deeplearningbook-chinese

這本書的閱讀建議:

為了補(bǔ)充基礎(chǔ)可以閱讀第1-5章其中也包含了一些數(shù)學(xué)知識

只關(guān)注主流神經(jīng)網(wǎng)絡(luò)知識可以閱讀6-10章,介紹了DNN/CNN/RNN

需要進(jìn)一步了解一些調(diào)參和應(yīng)用技巧,推薦閱讀11和12章

第13-20章為進(jìn)階章節(jié),在入門階段沒有必要閱讀。其實比較實際的做法是吳恩達(dá)的課程講到什么概念,你到這本書里面可以閱讀一些深入的理論進(jìn)行概念加深,按章節(jié)閱讀還是比較耗時耗力的。

3.4. 第四階段:深入研究

恭喜你!如果你已經(jīng)完成了上面的計劃表,代表你已經(jīng)有了相當(dāng)?shù)臋C(jī)器學(xué)習(xí)能力。這個階段,最重要的就是不要貪多嚼不爛。如果你瀏覽知乎,會發(fā)現(xiàn)大家都說你必須讀Elements of Statistical Learning, MLAPP之類的大部頭。我承認(rèn)閱讀這樣的書會有幫助,但在你有了一定的基礎(chǔ)知識后,相信你已經(jīng)知道自己需要接著做什么了也有了志同道合的朋友,我希望把選擇權(quán)交還給你,而不是繼續(xù)推薦成堆的課程和書籍。當(dāng)然,如果你希望繼續(xù)深入的話,中文可以繼續(xù)閱讀周志華老師的《機(jī)器學(xué)習(xí)》和李航老師的《統(tǒng)計學(xué)習(xí)基礎(chǔ)》,英文可以入手《Elements of Statistical Learning》。在這個階段,重點要形成成體系的知識脈絡(luò),切記貪多嚼不爛,切記!

從閱讀論文角度來說,訂閱Arxiv,關(guān)注機(jī)器學(xué)習(xí)的頂級會議,如ICML/NIPS等,相關(guān)的方法在知乎上可以很容易搜索到,不在此贅述。

▌4. 實踐經(jīng)驗

4.1. 研究經(jīng)歷

如果你還是學(xué)生,嘗試盡早接觸科研,進(jìn)實驗室。一般來說,大三的時候你應(yīng)該已經(jīng)有了基本的機(jī)器學(xué)習(xí)知識,盡管還比較淺。這個時候可以向老師/學(xué)長/學(xué)姐毛遂自薦進(jìn)實驗室,即使是無償勞動和做基本的苦力活。進(jìn)實驗室有兩個明顯的好處:

對某個小方向會有比較深入的了解。一般實驗室做純理論的不大需要本科生,做機(jī)器視覺或者自然語言處理(NLP)等小方向的比較需要本科生,所以這是很好的深入了解一個方向的機(jī)會。

補(bǔ)充了研究經(jīng)歷也可以明白自己是否適合這個領(lǐng)域。如果運氣好的話,你也有可能成為論文的作者之一,甚至可以去開會(公款旅游順道見一下業(yè)內(nèi)大佬)。這對于繼續(xù)深造和去國外繼續(xù)學(xué)習(xí)都很有幫助,有科研經(jīng)歷和論文是很大的籌碼,對于找工作來說也絕對有利無害。

4.2. 企業(yè)實習(xí)

上文提到過,機(jī)器學(xué)習(xí)光說不練假把式,最好的方法還是要實踐。因此,應(yīng)該先試著做科研,再嘗試工業(yè)界實習(xí)。對待科研機(jī)會,有則就上,沒有也不是太大的遺憾。我建議大部分做機(jī)器學(xué)習(xí)的朋友盡早實習(xí),主要出于以下幾個考量:

打破幻想,了解工業(yè)界的主流模型。在其他很多答案中我都提到過,其實工業(yè)界用的大部分技術(shù)并不酷炫,你很少能看到深度強(qiáng)化學(xué)習(xí)那種AlphaGo一樣酷炫的模型。不夸張的說,廣義線性模型(generalized linear models)還是占據(jù)了大壁江山,這要歸功于其良好的解釋能力。從神經(jīng)網(wǎng)絡(luò)角度出發(fā),一般也逃不過普通任務(wù)深度網(wǎng)絡(luò)、視覺任務(wù)卷積網(wǎng)絡(luò)CNN、語音和文字任務(wù)LSTM的套路。

補(bǔ)上學(xué)術(shù)界忽視的內(nèi)容,比如可視化和數(shù)據(jù)清洗。工業(yè)界的最終目的是輸出商業(yè)價值,而獲得商業(yè)洞見的過程其實是非常痛苦的,比如第一步就是令人深惡痛絕的數(shù)據(jù)清洗。毫不夸張的說,工業(yè)界百分之六十的時間都在清理數(shù)據(jù),這和學(xué)術(shù)界干凈且規(guī)則化的現(xiàn)成數(shù)據(jù)完全不同。沒有在工業(yè)界體驗過的人,無法真的了解原來機(jī)器學(xué)習(xí)從頭到尾有那么多陷阱,泛化能力只是終極目標(biāo),而往往我們連規(guī)整的數(shù)據(jù)都無法得到。

了解技術(shù)商業(yè)化中的取舍,培養(yǎng)大局觀。做技術(shù)的人往往一頭扎進(jìn)技術(shù)里面,而忽視了從全局思考。舉個例子,模型A的準(zhǔn)確率95.5%,每次訓(xùn)練時間是3天,需要6臺有GPU的服務(wù)器。而模型B的準(zhǔn)確率是百分之95.2%,但只需要一臺普通的macbook訓(xùn)練4個小時就可以了。從學(xué)術(shù)角度出發(fā)我們往往追求更好的模型結(jié)果選A,而工業(yè)界還要考慮到訓(xùn)練開銷、模型可解釋性、模型穩(wěn)定度等。到工業(yè)界實習(xí)不僅可以培養(yǎng)大家的宏觀掌控能力,對將來自己帶學(xué)生控制開銷或者選題也大有幫助

4.3. 在本職工作中使用機(jī)器學(xué)習(xí)

對于大部分已經(jīng)工作的朋友來說,重新回到學(xué)校攻讀學(xué)位并不現(xiàn)實,進(jìn)研究室進(jìn)行學(xué)習(xí)更是缺少機(jī)會。那么這個時候,你就可以試著把機(jī)器學(xué)習(xí)應(yīng)用到你自己的工作當(dāng)中。

已經(jīng)有了工作/研究經(jīng)驗的朋友,要試著將自己的工作經(jīng)歷利用起來。舉例,不要做機(jī)器學(xué)習(xí)里面最擅長投資的人,而要做金融領(lǐng)域中最擅長機(jī)器學(xué)習(xí)的專家,這才是你的價值主張(value proposition)。最重要的是,機(jī)器學(xué)習(xí)的基本功沒有大家想的那么高不可攀,沒有必要放棄自己的本專業(yè)全職轉(zhuǎn)行,沉沒成本太高。通過跨領(lǐng)域完全可以做到曲線救國,化劣勢為優(yōu)勢,你們可能比只懂機(jī)器學(xué)習(xí)的人有更大的行業(yè)價值。

舉幾個我身邊的例子,我的一個朋友是做傳統(tǒng)軟件工程研究的,前年他和我商量如何使用機(jī)器學(xué)習(xí)以GitHub上的commit歷史來識別bug,這就是一個很好的結(jié)合領(lǐng)域的知識。如果你本身是做金融出身,在你補(bǔ)足上面基本功的同時,就可以把機(jī)器學(xué)習(xí)交叉運用于你自己擅長的領(lǐng)域,做策略研究,我已經(jīng)聽說了無數(shù)個“宣稱”使用機(jī)器學(xué)習(xí)實現(xiàn)了交易策略案例。雖不可盡信,但對特定領(lǐng)域的深刻理解往往就是捅破窗戶的那最后一層紙,只理解模型但不了解數(shù)據(jù)和數(shù)據(jù)背后的意義,導(dǎo)致很多機(jī)器學(xué)習(xí)模型只停留在好看而不實用的階段。

▌5. 寫在最后

雖然人們曾說二十一是生物的世紀(jì),但現(xiàn)在還是人工智能的世紀(jì)。歡迎大家來試試機(jī)器學(xué)習(xí),體驗數(shù)據(jù)分析的魅力。

就像我曾在很多回答中提到,機(jī)器學(xué)習(xí)領(lǐng)域應(yīng)該要敞開大門,讓每個人都可以嘗試將機(jī)器學(xué)習(xí)知識應(yīng)用于他們原本的領(lǐng)域,摒棄人為制造的知識壁壘。唯有這樣,機(jī)器學(xué)習(xí)技術(shù)才能在更多的不同領(lǐng)域落地,從而反哺機(jī)器學(xué)習(xí)研究本身。

科技日新月異,追逐熱點是好的。但在這個浮躁的時代,不管選擇什么方向最重要的就是獨立思考的能力,和去偽存真的勇氣。因此,看了這么多入門教程和經(jīng)驗分享后,我最希望的是你既不要急著全盤接受,也不要因為不對胃口全盤否定。慢下來,好好想想,制定適合自己的計劃,這大概才是做科學(xué)工作的正確態(tài)度。

在思考之后,拒絕外界的噪音,無論是鼓勵還是嘲笑。抱著“不撞南山不回頭”的信念,繼續(xù)朝機(jī)器學(xué)習(xí)的高峰攀登。

或許,科技領(lǐng)域正因為有了我們這群“書呆子”才顯得尤為可愛 ?????

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1807

    文章

    49028

    瀏覽量

    249551
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8503

    瀏覽量

    134625
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5561

    瀏覽量

    122796

原文標(biāo)題:如何用3個月零基礎(chǔ)入門機(jī)器學(xué)習(xí)?

文章出處:【微信號:AI_Thinker,微信公眾號:人工智能頭條】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    嵌入式系統(tǒng)的知識學(xué)習(xí)誤區(qū)

    本內(nèi)容介紹了嵌入式系統(tǒng)的知識學(xué)習(xí)誤區(qū),具體包括嵌入式系統(tǒng)的知識體系,嵌入式系統(tǒng)的學(xué)習(xí)誤區(qū),基礎(chǔ)階段的學(xué)習(xí)建議,非常適合嵌入式系統(tǒng)的
    發(fā)表于 11-03 16:32 ?2054次閱讀

    STM32之紅外遙控信號自學(xué)習(xí)實現(xiàn)

    STM32之紅外遙控信號自學(xué)習(xí)實現(xiàn)
    的頭像 發(fā)表于 09-18 15:52 ?3916次閱讀
    STM32之紅外遙控信號<b class='flag-5'>自學(xué)習(xí)</b>實現(xiàn)

    FPGA學(xué)習(xí)的一些誤區(qū)

    FPGA學(xué)習(xí)的一些誤區(qū)
    發(fā)表于 08-12 11:46

    新手學(xué)習(xí)PADS的三個誤區(qū)

    很多新手經(jīng)常糾結(jié)的一件事就是學(xué)習(xí)PADS是不是可以拿高薪,是不是可以成為一個工程師,其實這些都是很大的誤區(qū)誤區(qū)大致都是在以下幾種情況第一:我很熟練的掌握了PADS工具,其實PADS與AD以及
    發(fā)表于 07-30 17:10

    自學(xué)Linux有哪些階段?

    `自學(xué)Linux有哪些階段?作為一個新人在自學(xué)Linux的過程中,很容易陷入很多學(xué)習(xí)誤區(qū),這里給大家分享一個Linux學(xué)習(xí)路線,希望對大家有
    發(fā)表于 10-15 14:22

    pcb layout學(xué)習(xí)中用Allegro幾個誤區(qū)

    本內(nèi)容詳細(xì)介紹pcb layout學(xué)習(xí)中用Allegro幾個誤區(qū)
    發(fā)表于 11-23 13:49 ?4649次閱讀

    自學(xué)習(xí)差異進(jìn)化算法

    為解決動態(tài)環(huán)境下的多中心優(yōu)化問題,提出自學(xué)習(xí)差異進(jìn)化算法。通過評估特定個體檢測到環(huán)境變化,自學(xué)習(xí)算子將群體引至新的環(huán)境,并保持群體的拓?fù)浣Y(jié)構(gòu)不變,以繼續(xù)當(dāng)前的進(jìn)化趨勢。采用鄰域搜索機(jī)制加快算法的收斂
    發(fā)表于 03-13 16:46 ?0次下載

    機(jī)器學(xué)習(xí)必須避開的九大陷阱

    意識到可能會扭曲團(tuán)隊工作結(jié)果的常見問題。為了實現(xiàn)可靠的機(jī)器學(xué)習(xí)過程,以下是要避免的九個常見陷阱,以及可采用的最佳實踐方法。
    發(fā)表于 05-07 12:39 ?2677次閱讀

    淺析機(jī)器學(xué)習(xí)建模中常見的7個誤區(qū)

    Cheng-Tao Chu總結(jié)了機(jī)器學(xué)習(xí)建模中常見的誤區(qū),提醒讀者注意算法的假定未必適合手頭的數(shù)據(jù)。
    的頭像 發(fā)表于 07-28 09:27 ?3824次閱讀

    如何自學(xué)人工智能?機(jī)器學(xué)習(xí)詳細(xì)路徑規(guī)劃

    綜述,機(jī)器學(xué)習(xí)自學(xué)簡單來說分為三個步驟 前期:知識儲備包括數(shù)學(xué)知識,機(jī)器學(xué)習(xí)經(jīng)典算法知識,編程技術(shù)(python)的掌握 中期:算法的
    的頭像 發(fā)表于 08-04 11:36 ?9244次閱讀
    如何<b class='flag-5'>自學(xué)</b>人工智能?<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>詳細(xì)路徑規(guī)劃

    機(jī)器學(xué)習(xí)的12大經(jīng)驗總結(jié)

    本文整理了關(guān)于機(jī)器學(xué)習(xí)研究者和從業(yè)者的 12 個寶貴經(jīng)驗,包括需要避免的陷阱、需要關(guān)注的重點問題、常見問題的答案。希望這些經(jīng)驗對機(jī)器學(xué)習(xí)愛好
    的頭像 發(fā)表于 12-13 15:29 ?2954次閱讀

    機(jī)器學(xué)習(xí)存在哪些潛力與陷阱

    機(jī)器學(xué)習(xí)的變革性作用,以及為何它現(xiàn)在如此重要,是因為我們來到了數(shù)據(jù)、運算能力以及算法復(fù)雜度的轉(zhuǎn)折點。
    發(fā)表于 07-03 16:27 ?1418次閱讀

    自學(xué)機(jī)器學(xué)習(xí)怎么入門

    有很多小伙伴想自學(xué)機(jī)器學(xué)習(xí),但是無從下手,特意找來知乎高贊回答,感覺看了以下回答,會有所受益。
    的頭像 發(fā)表于 08-31 11:02 ?2613次閱讀

    自學(xué)嵌入式學(xué)習(xí)路線

    本人是自學(xué)嵌入式,按自己的心得,大概寫下學(xué)習(xí)路線
    發(fā)表于 10-20 11:36 ?20次下載
    <b class='flag-5'>自學(xué)</b>嵌入式<b class='flag-5'>學(xué)習(xí)</b>路線

    紅外遙控自學(xué)習(xí)實現(xiàn)原理詳解

    很早前就想實現(xiàn)這個紅外遙控自學(xué)習(xí)的這個實驗,用于來自己控制房子里如空調(diào)等紅外遙控設(shè)備的自動化,NEC的標(biāo)準(zhǔn)到具體的產(chǎn)品上可能就被廠家定義為不一樣了,所以自學(xué)習(xí)就應(yīng)該是接收到什么就發(fā)送什么,不用管內(nèi)容是什么!
    的頭像 發(fā)表于 04-24 16:16 ?7906次閱讀