一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

《機(jī)器學(xué)習(xí)訓(xùn)練秘籍》:書中選出了7條非常有用的建議

8g3K_AI_Thinker ? 來源:未知 ? 作者:李倩 ? 2018-05-15 18:45 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

機(jī)器學(xué)習(xí)訓(xùn)練秘籍》(Machine Learning Yearning)是吳恩達(dá)的新作,主要講的是如何應(yīng)用機(jī)器學(xué)習(xí)算法以及如何構(gòu)建機(jī)器學(xué)習(xí)項(xiàng)目。本文從這本書中選出了 7 條非常有用的建議。

近年來,人工智能、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)迅猛發(fā)展,給許多行業(yè)帶來了變革。吳恩達(dá)是業(yè)內(nèi)的領(lǐng)軍人物之一,他是在線課程項(xiàng)目 Coursera 的聯(lián)合創(chuàng)始人,前百度 AI Group 領(lǐng)導(dǎo)人,前 Google Brain 項(xiàng)目負(fù)責(zé)人。目前他正在編寫《機(jī)器學(xué)習(xí)訓(xùn)練秘籍》(http://www.mlyearning.org/)這本書,教讀者如何組織機(jī)器學(xué)習(xí)項(xiàng)目。

吳恩達(dá)在書中寫道:

這本書主要是教你如何應(yīng)用機(jī)器學(xué)習(xí)算法,而不是教你機(jī)器學(xué)習(xí)算法本身。一些AI技術(shù)課程會教你算法,而這本書旨在教你如何使用算法這個(gè)利器。如果你想成為 AI領(lǐng)域的技術(shù)領(lǐng)袖,并希望學(xué)習(xí)如何為你的團(tuán)隊(duì)設(shè)定方向,這本書會給你幫助。

我們在閱讀這本書的原稿后從中選出了 7 條有趣且實(shí)用的建議.

▌1. 選擇正確的評估指標(biāo)

在評估某個(gè)算法時(shí),不應(yīng)該只使用一個(gè)公式或指標(biāo),而應(yīng)使用多個(gè)評估指標(biāo)。其中一種方法就是使用“optimizing”和“satisfying”作為指標(biāo)。

以上圖為例,首先定義一個(gè)“acceptable”(可接受)的運(yùn)行時(shí)間(例如小于 100 毫秒),作為“satisfying”指標(biāo)。只要運(yùn)行時(shí)間低于這個(gè)指標(biāo),你的分類器就「很好」?!皽?zhǔn)確度”在這里作為“optimizing”指標(biāo)。這是一種非常有效且容易的算法評估方法。

▌2. 快速選擇開發(fā)/測試集——如果有必要不要害怕更換

當(dāng)開始一個(gè)新項(xiàng)目時(shí),吳恩達(dá)在書中解釋道他會很快選擇開發(fā)集/測試集,因?yàn)檫@樣可以給團(tuán)隊(duì)制定一個(gè)明確的目標(biāo)。開始時(shí)他會先制定第一周的目標(biāo),提出一個(gè)不太完美的方案并迅速行動(dòng)起來,比花過多時(shí)間思考更好。

如果你突然發(fā)現(xiàn)初始的開發(fā)/測試集不正確時(shí),不要害怕更改它們。以下是書中給出的開發(fā)/訓(xùn)練集不正確的三個(gè)可能原因:

要使用的實(shí)際數(shù)據(jù)分布和開發(fā)/測試集不同

開發(fā)/測試集過度擬合

評估指標(biāo)衡量的并不是項(xiàng)目所需要優(yōu)化的東西

請謹(jǐn)記,更改開發(fā)/測試集不是什么大問題。放心更改,讓你的團(tuán)隊(duì)知道你們的新方向。

▌3. 機(jī)器學(xué)習(xí)是一個(gè)迭代過程:不要指望第一次就成功

吳恩達(dá)寫道他開發(fā)機(jī)器學(xué)習(xí)軟件的過程分三步:

從一個(gè)想法開始

用代碼實(shí)現(xiàn)這個(gè)想法

通過實(shí)驗(yàn)判斷這個(gè)想法是否成功

這是一個(gè)不斷迭代的過程。循環(huán)得越快,進(jìn)展也就越快。這就是為什么提前確定開發(fā)/測試集很重要,因?yàn)檫@樣做可以在這個(gè)迭代過程中省下寶貴的時(shí)間。每嘗試一個(gè)新想法時(shí),在開發(fā)/測試集上衡量這個(gè)想法的表現(xiàn),這樣你就可以快速判斷你是否在朝著正確的方向前進(jìn)。

▌4. 快速構(gòu)建第一個(gè)系統(tǒng),然后迭代

在第三條建議中,我們提到構(gòu)建機(jī)器學(xué)習(xí)算法是一個(gè)迭代過程。吳恩達(dá)專門用一個(gè)章節(jié)解釋了快速構(gòu)建第一個(gè)系統(tǒng)然后迭代的好處:「不要試圖一開始就設(shè)計(jì)和構(gòu)建完美的系統(tǒng)。相反,應(yīng)該快速構(gòu)建和訓(xùn)練出一個(gè)基本系統(tǒng)——也許在短短的幾天內(nèi)。即使這個(gè)基本系統(tǒng)與您你構(gòu)建的“最佳”系統(tǒng)相差甚遠(yuǎn),研究基本系統(tǒng)的表現(xiàn)仍非常有參考價(jià)值:你很快就會找到線索,以此確定哪個(gè)方向最有希望獲得成功。」

▌5. 并行評估多個(gè)想法

當(dāng)你的團(tuán)隊(duì)針對如何改進(jìn)某一算法提出了很多想法,你可以高效地并行評估這些想法。舉例來說,構(gòu)建一個(gè)能識別貓照片的算法,吳恩達(dá)稱他通常會創(chuàng)建一個(gè)電子表格,瀏覽大約 100 張分類錯(cuò)誤的開發(fā)/測試集圖像并在表格上記錄。

在表格上記錄:對每張圖像的分析,造成算法分類錯(cuò)誤的原因,以及可能對未來反思有幫助的評論。填完后,你會得出哪種想法可以避免更多錯(cuò)誤,然后再去實(shí)現(xiàn)它。

▌6. 思考清理貼錯(cuò)標(biāo)簽的開發(fā)/測試集是否值得

在錯(cuò)誤分析期間,你可能會注意到開發(fā)/測試集中的一些樣本被錯(cuò)誤標(biāo)注(mislabeled)。也就是說,在用算法處理前之前,圖片已經(jīng)被人類標(biāo)注員貼上了錯(cuò)誤的標(biāo)簽。如果你懷疑有一小部分的圖片被錯(cuò)誤標(biāo)注是由于這個(gè)原因,那么可以在電子表格中添加再一個(gè)類別進(jìn)行記錄:

在完成后,你可以思考修正這些錯(cuò)誤是否值得。吳恩達(dá)給出了兩種可能的場景,讓讀者判斷修正錯(cuò)誤是否值得:

示例1:

開發(fā)集的整體準(zhǔn)確率……90%(整體錯(cuò)誤率為 10%)

貼錯(cuò)標(biāo)簽樣本導(dǎo)致的錯(cuò)誤……0.6%(占開發(fā)集錯(cuò)誤的 6%)

其他原因?qū)е碌腻e(cuò)誤……9.4%(占開發(fā)集錯(cuò)誤的 94%)

在這個(gè)例子中,相較于你可能改進(jìn)的 9.4% 的錯(cuò)誤,由于錯(cuò)誤標(biāo)注導(dǎo)致的 0.6% 的不準(zhǔn)確率就可能沒那么重要。手動(dòng)修正開發(fā)集中錯(cuò)誤標(biāo)注的圖像并沒有什么壞處,但這樣做并不是關(guān)鍵:不知道系統(tǒng)的整體錯(cuò)誤是 10% 還是 9.4% 可能沒什么大不了。

示例 2:

開發(fā)集整體準(zhǔn)確率……98.0%(整體錯(cuò)誤率為 2.0%)

貼錯(cuò)標(biāo)簽樣本導(dǎo)致的錯(cuò)誤……0.6%(占開發(fā)集錯(cuò)誤的 30%)

其他原因?qū)е碌腻e(cuò)誤……1.4%(占開發(fā)集錯(cuò)誤的 70%)

30% 的錯(cuò)誤是由于錯(cuò)誤標(biāo)注的開發(fā)集圖像造成的,這會讓準(zhǔn)確率的估計(jì)值有很大的誤差。這種情況下,改進(jìn)開發(fā)集的標(biāo)注質(zhì)量很值得。處理錯(cuò)誤標(biāo)注的樣本將幫助你算出分類器的錯(cuò)誤是接近 1.4% 還是 2%——這是一個(gè)相對明顯的差異。

▌7. 考慮將開發(fā)集分為多個(gè)子集

如果你的開發(fā)集很大,其中 20% 的樣本被算法錯(cuò)誤分類,那么你可以將這個(gè)開發(fā)集分為兩個(gè)獨(dú)立的子集:

比方說,你有一個(gè)包含 5000 個(gè)樣本的大開發(fā)集,其中 1000 個(gè)樣本被錯(cuò)誤分類。假設(shè)我們要手動(dòng)檢查約 100 個(gè)錯(cuò)誤樣本(錯(cuò)誤樣本的10%),進(jìn)行錯(cuò)誤分析。那么你應(yīng)該隨機(jī)選出 10% 的開發(fā)集,然后將其放入我們稱之為 Eyeball 的開發(fā)集(Eyeball dev set)中,以提醒自己你需要觀察這些數(shù)據(jù)。Eyeball 開發(fā)集有 500 個(gè)樣本,我們預(yù)計(jì)算法錯(cuò)誤分類的樣本約有 100 個(gè)。

開發(fā)集的第二個(gè)子集叫做 Blackbox 開發(fā)集(Blackbox dev set),它包含剩余的 4500 個(gè)樣本。你可以用 Blackbox 開發(fā)集測定圖像分類的錯(cuò)誤率,以此自動(dòng)評估分類器。你也可以使用它來選擇算法或調(diào)整超參數(shù)。我們將這個(gè)子集稱為 “Blackbox”,是因?yàn)槲覀冎皇褂脭?shù)據(jù)集的子集來取得對分類器的“Blackbox”(黑盒)評估。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1807

    文章

    49029

    瀏覽量

    249603
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8503

    瀏覽量

    134636

原文標(biāo)題:吳恩達(dá)《機(jī)器學(xué)習(xí)訓(xùn)練秘籍》:7 條關(guān)于項(xiàng)目實(shí)踐的實(shí)用建議

文章出處:【微信號:AI_Thinker,微信公眾號:人工智能頭條】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    【「時(shí)間序列與機(jī)器學(xué)習(xí)」閱讀體驗(yàn)】+ 簡單建議

    細(xì)微差異導(dǎo)致的錯(cuò)誤,這無疑增加了調(diào)試的難度。因此,我個(gè)人建議,書中若能在關(guān)鍵代碼段旁邊添加二維碼,鏈接到可在線運(yùn)行或驗(yàn)證的代碼環(huán)境,將極大地提升讀者的學(xué)習(xí)效率和體驗(yàn)。這樣一來,讀者不僅可以快速驗(yàn)證代碼的正確性,還能在互動(dòng)中加深對
    發(fā)表于 08-12 11:21

    對新手非常有用的電子器件基礎(chǔ)資料

    本帖最后由 eehome 于 2013-1-5 09:56 編輯 對新手非常有用的電子器件基礎(chǔ)資料PCB打樣找華強(qiáng) http://www.hqpcb.com/3 樣板2天出貨
    發(fā)表于 10-20 20:13

    03國賽控制類準(zhǔn)備步驟,非常有用

    這是關(guān)于國賽準(zhǔn)備的一些模塊原理圖以及相關(guān)PCB布線等的步驟,非常有用
    發(fā)表于 01-23 22:00

    吳恩達(dá)的7機(jī)器學(xué)習(xí)訓(xùn)練秘籍

    非常有用建議。吳恩達(dá)介紹道:本書的重點(diǎn)不在于教授機(jī)器學(xué)習(xí)算法,而在于如何使機(jī)器學(xué)習(xí)算法發(fā)揮作用
    發(fā)表于 09-20 11:41

    機(jī)器學(xué)習(xí)訓(xùn)練秘籍——吳恩達(dá)

    ,你正面臨著巨大的壓力。可你該怎么做呢?你的團(tuán)隊(duì)給出了許多建議,例如:● 獲取更多的數(shù)據(jù),即收集更多的貓咪圖片● 收集更加多樣化的訓(xùn)練數(shù)據(jù)集,圖片中貓的位置可能不常見,也有可能顏色奇異,或者拍攝時(shí)使用不
    發(fā)表于 11-30 16:45

    展示Python機(jī)器學(xué)習(xí)開源項(xiàng)目以及在分析過程中發(fā)現(xiàn)的非常有趣的見解和趨勢

    開源是技術(shù)創(chuàng)新和快速發(fā)展的核心。這篇文章向你展示Python機(jī)器學(xué)習(xí)開源項(xiàng)目以及在分析過程中發(fā)現(xiàn)的非常有趣的見解和趨勢。
    的頭像 發(fā)表于 01-04 11:51 ?4395次閱讀
    展示Python<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>開源項(xiàng)目以及在分析過程中發(fā)現(xiàn)的<b class='flag-5'>非常有</b>趣的見解和趨勢

    機(jī)器學(xué)習(xí)-8. 支持向量機(jī)(SVMs)概述和計(jì)算

    支持向量機(jī)(Support Vector Machine: SVM)是一種非常有用的監(jiān)督式機(jī)器學(xué)習(xí)算法
    的頭像 發(fā)表于 04-02 08:49 ?5502次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>-8. 支持向量機(jī)(SVMs)概述和計(jì)算

    17個(gè)非常有用的 Python 技巧

    實(shí)際上,很多人選擇學(xué)習(xí) Python 的首要原因是其編程的優(yōu)美性,用它編碼和表達(dá)想法非常自然。此外,Python 的編寫使用方式有多種,數(shù)據(jù)科學(xué)、網(wǎng)頁開發(fā)、機(jī)器學(xué)習(xí)皆可使用 Pytho
    的頭像 發(fā)表于 08-27 17:56 ?5184次閱讀
    17個(gè)<b class='flag-5'>非常有用</b>的 Python 技巧

    Vim中默認(rèn)未啟用但實(shí)際非常有用的選項(xiàng)

    Vim 作為一款功能強(qiáng)大、選項(xiàng)豐富的編輯器,為許多用戶所熱愛。本文介紹了一些在 Vim 中默認(rèn)未啟用但實(shí)際非常有用的選項(xiàng)。雖然可以在每個(gè) Vim 會話中單獨(dú)啟用,但為了創(chuàng)建一個(gè)開箱即用的高效編輯環(huán)境,還是建議在 Vim 的配置文件中配置這些命令。
    的頭像 發(fā)表于 09-25 17:54 ?5641次閱讀

    機(jī)器學(xué)習(xí)訓(xùn)練秘籍》中的六個(gè)概念

    吳恩達(dá)在該書中從頭到尾一直強(qiáng)調(diào):由于機(jī)器學(xué)習(xí)是一個(gè)迭代的過程,快速迭代至關(guān)重要。比起去思考如何為你的問題建造一個(gè)完美的機(jī)器學(xué)習(xí)系統(tǒng),不如先盡
    的頭像 發(fā)表于 03-05 13:44 ?3039次閱讀

    機(jī)器學(xué)習(xí)/人工智能領(lǐng)域一些非常有創(chuàng)意的突破

    本文介紹了近期在機(jī)器學(xué)習(xí)/人工智能領(lǐng)域一些非常有創(chuàng)意的突破,每一個(gè)都腦洞大開,不管是否是相關(guān)從業(yè)人員都值得一讀。并附上一些論文、視頻鏈接和簡要總結(jié)。
    的頭像 發(fā)表于 05-19 10:49 ?3691次閱讀

    機(jī)器學(xué)習(xí)對分析地理空間圖像非常有幫助

    機(jī)器學(xué)習(xí)對分析地理空間圖像非常有幫助。衛(wèi)星照片往往會創(chuàng)建大量數(shù)據(jù),而AI軟件可以比人類觀察者更快地標(biāo)記出感興趣的項(xiàng)目。例如,在澳大利亞,消防員定期分析衛(wèi)星圖像以監(jiān)測野火的蔓延,并努力保持領(lǐng)先地位。
    的頭像 發(fā)表于 03-22 16:23 ?2271次閱讀

    17個(gè)非常有用的Python技巧

    Python 是一門非常優(yōu)美的語言,其簡潔易用令人不得不感概人生苦短。在本文中,作者 Gautham Santhosh 帶我們回顧了 17 個(gè)非常有用的 Python 技巧,例如查找、分割和合并列表等。這 17 個(gè)技巧都非常簡單
    的頭像 發(fā)表于 04-10 14:28 ?792次閱讀

    一個(gè)簡單但非常有用的小前置放大器電路

    一個(gè)簡單但非常有用的小前置放大器電路可以通過連接幾個(gè)晶體管來構(gòu)建。該裝置可輕松將 1mV 信號提升至 100mV 甚至更高。因此,它非常方便放大不能直接與功率放大器一起使用的極小信號。
    的頭像 發(fā)表于 06-10 17:27 ?2014次閱讀
    一個(gè)簡單但<b class='flag-5'>非常有用</b>的小前置放大器電路

    沒有什么是完美的,但FPGA可能非常有用

    FPGA是非常有用的器件,通常與ADI公司的ADC或功率IC等一起設(shè)計(jì)到客戶的設(shè)計(jì)中。FPGA 可以實(shí)現(xiàn)微控制器和所需的任何膠水邏輯。在這篇博客中,我將討論一些與功能安全和FPGA相關(guān)的問題。
    的頭像 發(fā)表于 06-29 10:28 ?1824次閱讀
    沒有什么是完美的,但FPGA可能<b class='flag-5'>非常有用</b>