一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

詳談機器學習及其三大分類

如意 ? 來源:大數(shù)據(jù)DT ? 作者:小川雄太郎 ? 2020-08-14 12:24 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

01 術語整理

本節(jié)概述機器學習及其三個分類(監(jiān)督學習、非監(jiān)督學習和強化學習)。首先,與機器學習相關的術語有人工智能(Artificial Intelligence,AI)、機器學習(Machine Learning,ML)、強化學習、深度學習等,這里對這些術語進行簡單的整理。

AI意味著人工智能,其定義因研究人員而異。從廣義上講,它指“像人類一樣具有智能的系統(tǒng)和配備這種系統(tǒng)的機器人”。實現(xiàn)AI的方法之一是機器學習。

機器學習可以簡單地描述為“向系統(tǒng)提供數(shù)據(jù)(稱為訓練數(shù)據(jù)或學習數(shù)據(jù))并通過數(shù)據(jù)自動確定系統(tǒng)的參數(shù)(變量值)”。相反,基于規(guī)則的系統(tǒng)是非機器學習系統(tǒng)的一個例子。在基于規(guī)則的系統(tǒng)中,由人類來清楚地定義分支條件的參數(shù),例如實現(xiàn)代碼中所存在的if語句等。

另一方面,機器學習自動根據(jù)訓練數(shù)據(jù)確定代碼中的參數(shù),以使系統(tǒng)運行良好。之所以稱為機器學習,正是因為系統(tǒng)能根據(jù)訓練數(shù)據(jù)計算和確定系統(tǒng)運行所需的參數(shù)。

強化學習是機器學習中的一種。機器學習可分為三大類:監(jiān)督學習、非監(jiān)督學習和強化學習。我們稍后會討論這三個分類,這里只需要認識到強化學習是機器學習的一部分即可。

接下來是深度學習。深度學習是實現(xiàn)機器學習的算法之一。機器學習的算法包括邏輯回歸、支持向量機(Support Vector Machine,SVM)、決策樹、隨機森林和神經網絡等。深度學習是神經網絡中的一種。

最后是深度強化學習。深度強化學習是強化學習和深度學習的結合。

02 監(jiān)督學習、非監(jiān)督學習、強化學習

這里對三種機器學習(監(jiān)督學習、非監(jiān)督學習和強化學習)分別進行介紹。

首先說明監(jiān)督學習。

例如,“對郵政編碼中的手寫數(shù)字進行分類”是一種監(jiān)督學習。郵政編碼分類系統(tǒng)將每個數(shù)字的手寫圖像分類為0~9中的一個。諸如0到9的數(shù)據(jù)的分類目標被稱為標簽或類。這種系統(tǒng)被稱為監(jiān)督學習,因為給事先提供的訓練數(shù)據(jù)預先標記出了正確的標簽。換句話說,帶標簽的訓練數(shù)據(jù)成了系統(tǒng)的教師。

監(jiān)督學習包括學習階段和推理階段。我們將以圖為例來解釋手寫數(shù)字的分類(見圖1.1)。

詳談機器學習及其三大分類

▲圖1.1 使用監(jiān)督學習區(qū)分手寫數(shù)字的示例

在學習階段,準備許多0到9的手寫數(shù)字圖像數(shù)據(jù),這些數(shù)據(jù)作為訓練數(shù)據(jù)。訓練數(shù)據(jù)有一個標簽(0到9中的某個數(shù)值),根據(jù)標簽可以找到關于手寫數(shù)字圖像的正確答案信息,例如“此手寫數(shù)字圖像為1”。在學習階段,當將手寫數(shù)字圖像輸入系統(tǒng)時,調整(學習)系統(tǒng)的參數(shù)以盡量將輸入圖像分類為正確的標簽。

在應用階段,將無標簽的未知手寫數(shù)字圖像數(shù)據(jù)輸入系統(tǒng),圖像被分類為0到9中的某一個輸出標簽并給出結果。如果已經學習到正確的結果,當輸入未知的手寫數(shù)字圖像時,系統(tǒng)將輸出正確的數(shù)值標簽。除了手寫數(shù)字的分類之外,還可使用監(jiān)督學習來對圖像、聲音和文本數(shù)據(jù)進行分類。

此外,除了上面例子中提到的分類任務,監(jiān)督學習也用于回歸等任務。

接下來,介紹非監(jiān)督學習。用一個詞表達非監(jiān)督學習就是“分組”。它將大量數(shù)據(jù)中類似的數(shù)據(jù)分為一組(稱為聚類)。例如,“根據(jù)購買數(shù)據(jù)對客戶進行分組的系統(tǒng)”是非監(jiān)督學習。根據(jù)購買歷史記錄的特征對客戶進行分組,可以為每個組實施不同的銷售策略。

我們使用圖來說明購買數(shù)據(jù)分析的例子(見圖1.2)。假設存儲了每個客戶過去一年的購買數(shù)量和每次平均消費金額的數(shù)據(jù),并對此數(shù)據(jù)進行分析。根據(jù)這些數(shù)據(jù),客戶可以分為兩組。A組(左上角)是以較低頻次購買高價商品的組,B組(右下角)是多次重復但每次消費金額較低的組。

詳談機器學習及其三大分類

▲圖1.2 使用非監(jiān)督學習根據(jù)購買數(shù)據(jù)對客戶分組的示例

使用非監(jiān)督學習進行分組將有助于了解每個客戶所屬的組,并針對每個組實施最佳銷售策略(盡管部分業(yè)務還需要更詳細的分析)。除了本例中提到的分組(聚類)以外,非監(jiān)督學習也用于降維和推薦系統(tǒng)。

最后,我們討論強化學習。強化學習是一種主要用于“時變系統(tǒng)控制規(guī)則構建”和“對戰(zhàn)博弈策略構建”的方法。例如,強化學習用于機器人的步行控制和圍棋對戰(zhàn)程序。

在我們熟悉的例子中,可能更容易想象一個孩子學會騎自行車的情形。當一個孩子學習騎自行車時,并沒有人去教其諸如牛頓力學等力學法則以及如何騎車的詳細方法,也不必通過觀看視頻來學習騎自行車。事實上,自己嘗試騎自行車,在多次失敗的過程中找到一種騎自行車的方法。

強化學習正如學騎自行車的例子,它是一種學習方法,它在不知道控制對象的物理定律的情況下重復試錯,以學習到所希望的控制方法。

強化學習中沒有帶標簽的數(shù)據(jù)作為訓練數(shù)據(jù),但這并不意味著根本沒有監(jiān)督信息。系統(tǒng)根據(jù)強化學習程序運行,在獲得所需結果時給出稱為獎勵的信號。例如,在機器人的步行控制中,可以走的距離就是獎勵。在圍棋的比賽程序中,贏或輸?shù)慕Y果就是獎勵。失敗時的獎勵是負值,也稱為懲罰。

如果想通過監(jiān)督學習來學習機器人的步行控制,就需要盡可能多的“如果腿的關節(jié)處于這個角度并且速度是某值,那么就像這樣轉動電動機A”這樣的模式,并預先給出其正確的做法。然而,當機器人行走時,對于每個時刻變化的狀態(tài),很難預先給出控制該電動機的正確做法。

另一方面,在強化學習中,將行走距離作為獎勵提供給步行控制系統(tǒng),并且重復試驗多次。

這樣一來,強化學習系統(tǒng)會根據(jù)重復試驗和獲得的獎勵自行改變控制規(guī)則,以“如果之前的試驗中所做改變使我可以走得更遠,則這種改變是正確的”為基礎。因此,可以在不教導機器人如何行走的情況下讓機器人能漸漸行走更長的距離。

即使在像圍棋這樣的對戰(zhàn)游戲的策略構建中,也無須在每個階段將強者視為教師數(shù)據(jù)來進行教導,僅通過將成功或失敗作為獎勵來重復試驗即可。這樣做,強化學習系統(tǒng)會一點一點地改變游戲方式并變得更強。

學到的圍棋或將棋系統(tǒng)比設計者本人更強大,這一點通過強化學習可以很容易實現(xiàn)。只聽這個解釋,強化學習就像魔術,但在實踐中卻存在著種種困難。

強化學習主要適用于“時變系統(tǒng)控制規(guī)則構建”和“對戰(zhàn)博弈策略構建”,本書以前者“系統(tǒng)控制”為目標任務,通過編寫相關程序來學習強化學習。

關于作者:小川雄太郎,東京大學博士,曾在東京大學從事腦機能測量及計算論的神經科學研究?,F(xiàn)就職于株式會社電通國際信息服務技術開發(fā)部,從事機器學習相關技術的研究開發(fā)。

本文摘編自《邊做邊學深度強化學習:PyTorch程序設計實踐》,經出版方授權發(fā)布。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1806

    文章

    49014

    瀏覽量

    249405
  • 機器學習
    +關注

    關注

    66

    文章

    8503

    瀏覽量

    134598
  • 強化學習
    +關注

    關注

    4

    文章

    269

    瀏覽量

    11599
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    工業(yè)相機:機器視覺的“核心之眼”,四大分類詳解

    在智能制造和自動化生產中,工業(yè)相機作為機器視覺系統(tǒng)的核心組件,憑借其高精度、高穩(wěn)定性和快速響應能力,被廣泛應用于產品質量檢測、尺寸測量、定位識別等領域。它通常與工業(yè)鏡頭、機器視覺光源及圖像處理軟件協(xié)同工作,共同構成高效的視覺檢測系統(tǒng)。
    的頭像 發(fā)表于 05-13 16:30 ?565次閱讀
    工業(yè)相機:<b class='flag-5'>機器</b>視覺的“核心之眼”,四<b class='flag-5'>大分類</b>詳解

    機器學習模型市場前景如何

    當今,隨著算法的不斷優(yōu)化、數(shù)據(jù)量的爆炸式增長以及計算能力的飛速提升,機器學習模型的市場前景愈發(fā)廣闊。下面,AI部落小編將探討機器學習模型市場的未來發(fā)展。
    的頭像 發(fā)表于 02-13 09:39 ?359次閱讀

    xgboost在圖像分類中的應用

    和易用性,在各種機器學習任務中得到了廣泛應用,包括分類、回歸和排序問題。在圖像分類領域,盡管深度學習模型(如卷積神經網絡CNN)占據(jù)主導地位
    的頭像 發(fā)表于 01-19 11:16 ?1003次閱讀

    傳統(tǒng)機器學習方法和應用指導

    在上一篇文章中,我們介紹了機器學習的關鍵概念術語。在本文中,我們會介紹傳統(tǒng)機器學習的基礎知識和多種算法特征,供各位老師選擇。 01 傳統(tǒng)機器
    的頭像 發(fā)表于 12-30 09:16 ?1184次閱讀
    傳統(tǒng)<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法和應用指導

    如何選擇云原生機器學習平臺

    當今,云原生機器學習平臺因其彈性擴展、高效部署、低成本運營等優(yōu)勢,逐漸成為企業(yè)構建和部署機器學習應用的首選。然而,市場上的云原生機器
    的頭像 發(fā)表于 12-25 11:54 ?454次閱讀

    什么是機器學習?通過機器學習方法能解決哪些問題?

    來源:Master編程樹“機器學習”最初的研究動機是讓計算機系統(tǒng)具有人的學習能力以便實現(xiàn)人工智能。因為沒有學習能力的系統(tǒng)很難被認為是具有智能的。目前被廣泛采用的
    的頭像 發(fā)表于 11-16 01:07 ?963次閱讀
    什么是<b class='flag-5'>機器</b><b class='flag-5'>學習</b>?通過<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法能解決哪些問題?

    NPU與機器學習算法的關系

    在人工智能領域,機器學習算法是實現(xiàn)智能系統(tǒng)的核心。隨著數(shù)據(jù)量的激增和算法復雜度的提升,對計算資源的需求也在不斷增長。NPU作為一種專門為深度學習機器
    的頭像 發(fā)表于 11-15 09:19 ?1214次閱讀

    【每天學點AI】KNN算法:簡單有效的機器學習分類

    過程,其實就是一個簡單的分類問題,而KNN(K-NearestNeighbors)算法正是模仿這種人類決策過程的機器學習算法。|什么是KNN?KNN(K-NearestNeighbo
    的頭像 發(fā)表于 10-31 14:09 ?843次閱讀
    【每天學點AI】KNN算法:簡單有效的<b class='flag-5'>機器</b><b class='flag-5'>學習</b><b class='flag-5'>分類</b>器

    基于深度學習維點云分類方法

    近年來,點云表示已成為計算機視覺領域的研究熱點之一,并廣泛應用于自動駕駛、虛擬現(xiàn)實、機器人等許多領域。雖然深度學習技術在處理常規(guī)結構化的二維網格圖像數(shù)據(jù)方面取得了巨大成功,但在處理不規(guī)則、非結構化的點云數(shù)據(jù)方面仍面臨著巨大挑戰(zhàn)。
    的頭像 發(fā)表于 10-29 09:43 ?1575次閱讀
    基于深度<b class='flag-5'>學習</b>的<b class='flag-5'>三</b>維點云<b class='flag-5'>分類</b>方法

    相電機有哪些型號?該如何分類

    相電機,也稱為相交流電機,是一種常見的工業(yè)電機類型,廣泛應用于各種機械設備中。相電機的型號和分類可以根據(jù)多個標準進行,以下是一些常見的分類
    的頭像 發(fā)表于 10-22 09:21 ?2131次閱讀

    計算機存儲器的分類及其區(qū)別

    計算機存儲器是計算機系統(tǒng)中不可或缺的重要部分,用于存放程序和數(shù)據(jù)。隨著科技的進步,存儲器的種類越來越多,功能和性能也日益豐富。一般來說,計算機存儲器可以按照不同的分類標準進行分類,以下是詳細的分類
    的頭像 發(fā)表于 09-05 10:40 ?3990次閱讀

    【「時間序列與機器學習」閱讀體驗】+ 簡單建議

    這本書以其系統(tǒng)性的框架和深入淺出的講解,為讀者繪制了一幅時間序列分析與機器學習融合應用的宏偉藍圖。作者不僅扎實地構建了時間序列分析的基礎知識,更巧妙地展示了機器學習如何在這一領域發(fā)揮巨
    發(fā)表于 08-12 11:21

    【「時間序列與機器學習」閱讀體驗】全書概覽與時間序列概述

    的應用也很廣泛,用機器學習為時間分析帶來新的可能性。人們往往可以通過過往的時間序列數(shù)據(jù)來預測未來,在各行各業(yè)中都有很好的應用與發(fā)展前景。 時間序列分類: 1.單維時間序列 單維時間序列指的是一組有順序
    發(fā)表于 08-07 23:03

    求助,關于運算放大器分類的問題求解

    LT1013AM的失調電壓和失調電壓溫漂系數(shù)都足以滿足精密運放的標準,但為什么就劃分到通用運放了呢? 運放的五大分類難道不是只依據(jù)相關參數(shù)的數(shù)據(jù)來劃分的嗎?
    發(fā)表于 08-07 07:10

    pcb金屬基板分類及其優(yōu)點分析

    一站式PCBA智造廠家今天為大家講講PCB金屬基板分類及其優(yōu)點都有哪些?PCB金屬基板分類及其優(yōu)點。金屬基板是一種特殊類型的印制電路板(PCB),其基底材料主要是金屬而非傳統(tǒng)的玻璃纖維
    的頭像 發(fā)表于 07-18 09:18 ?1007次閱讀