機器學(xué)習(xí)綜述——機器學(xué)習(xí)理論基礎(chǔ)與發(fā)展脈絡(luò) - 全文

本文主要參考中科院自動化研究所復(fù)雜系統(tǒng)與智能科學(xué)實驗室王玨研究員《關(guān)于機器學(xué)習(xí)的討論》，討論機器學(xué)習(xí)的描述，理論基礎(chǔ)，發(fā)展歷史以及研究現(xiàn)狀。

0引言

20世紀(jì)90年代初，當(dāng)時的美國副總統(tǒng)提出了一個重要的計劃——國家信息基本設(shè)施計劃(NationalInformation Infrastructure,NII)。這個計劃的技術(shù)含義包含了四個方面的內(nèi)容：

(1)不分時間與地域，可以方便地獲得信息。

(2)不分時間與地域，可以有效地利用信息。

(3)不分時間與地域，可以有效地利用軟硬件資源。

(4)保證信息安全。

本文主要討論解決“信息有效利用”問題，其本質(zhì)是：如何根據(jù)用戶的特定需求從海量數(shù)據(jù)中建立模型或發(fā)現(xiàn)有用的知識。對計算機科學(xué)來說，這就是機器學(xué)習(xí)。

計算機科學(xué)，特別是人工智能的研究者一般公認(rèn)Simon對學(xué)習(xí)的論述：“如果一個系統(tǒng)能夠通過執(zhí)行某個過程改進它的性能，這就是學(xué)習(xí)?！边@是一個相當(dāng)廣泛的說明, 其要點是“系統(tǒng)”, 它涵蓋了計算系統(tǒng)、控制系統(tǒng)以及人系統(tǒng)等, 對這些不同系統(tǒng)的學(xué)習(xí), 顯然屬于不同的科學(xué)領(lǐng)域。即使計算系統(tǒng), 由于目標(biāo)不同, 也分為了“從有限觀察概括特定問題世界模型的機器學(xué)習(xí)”、“發(fā)現(xiàn)觀測數(shù)據(jù)中暗含的各種關(guān)系的數(shù)據(jù)分析”,以及“從觀測數(shù)據(jù)挖掘有用知識的數(shù)據(jù)挖掘”等不同分支。由于這些分支發(fā)展的各種方法的共同目標(biāo)都是“從大量無序的信息到簡潔有序的知識”,因此,它們都可以理解為Simon 意義下的“過程”,也就都是“學(xué)習(xí)”。

1 機器學(xué)習(xí)描述

本文將討論限制在“從有限觀察概括特定問題世界模型的機器學(xué)習(xí)”與“從有限觀察發(fā)現(xiàn)觀測數(shù)據(jù)中暗含的各種關(guān)系的數(shù)據(jù)分析”的方法上, 并統(tǒng)稱其為機器學(xué)習(xí)。

我們描述機器學(xué)習(xí)如下:

令W是給定世界的有限或無限的所有觀測對象的集合, 由于我們觀察能力的限制, 我們只能獲得這個世界的一個有限的子集Q W, 稱為樣本集。機器學(xué)習(xí)就是根據(jù)這個樣本集, 推算這個世界的模型, 使它對這個世界(盡可能地)為真。

這個描述隱含了三個需要解決的問題:

(1) 一致: 假設(shè)世界W與樣本集Q有相同的性質(zhì)。例如,如果學(xué)習(xí)過程基于統(tǒng)計原理,獨立同分布( i. i. d )就是一類一致條件。

(2) 劃分: 將樣本集放到n維空間,尋找一個定義在這個空間上的決策分界面(等價關(guān)系),使得問題決定的不同對象分在不相交的區(qū)域。

(3) 泛化: 泛化能力是這個模型對世界為真程度的指標(biāo)。從有限樣本集合, 計算一個模型,使得這個指標(biāo)最大(最小)。

這些問題對觀測數(shù)據(jù)提出了相當(dāng)嚴(yán)厲的條件,首先需要人們根據(jù)一致假設(shè)采集數(shù)據(jù),由此構(gòu)成機器學(xué)習(xí)算法需要的樣本集; 其次, 需要尋找一個空間, 表示這個問題; 最后, 模型的泛化指標(biāo)需要滿足一致假設(shè), 并能夠指導(dǎo)算法設(shè)計。這些條件限制了機器學(xué)習(xí)的應(yīng)用范圍。

2 機器學(xué)習(xí)的發(fā)展歷史

2.1 機器學(xué)習(xí)與人工智能

機器學(xué)習(xí)是人工智能研究的核心內(nèi)容。它的應(yīng)用已遍及人工智能的各個分支，如專家系統(tǒng)、自動推理、自然語言理解、模式識別、計算機視覺、智能機器人等領(lǐng)域。

人工智能涉及到諸如意識（consciousness）、自我（self）、心靈（mind）（包括無意識的精神（unconscious_mind））等等問題。人唯一了解的智能是人本身的智能，這是普遍認(rèn)同的觀點。但是我們對我們自身智能的理解都非常有限，對構(gòu)成人的智能的必要元素也了解有限，所以就很難定義什么是“人工”制造的“智能”了。因此人工智能的研究往往涉及對人的智能本身的研究。其它關(guān)于動物或其它人造系統(tǒng)的智能也普遍被認(rèn)為是人工智能相關(guān)的研究課題。下圖展示了人工智能的發(fā)展路線：

機器學(xué)習(xí)是人工智能研究發(fā)展到一定階段的必然產(chǎn)物。從 20 世紀(jì)50 年代到 70 年代初，人工智能研究處于“推理期”，人們認(rèn)為只要給機器賦予邏輯推理能力，機器就能具有智能。這一階段的代表性工作主要有 A. Newell 和 H. Simon 的“邏輯理論家”程序以及此后的“通用問題求解”程序等，這些工作在當(dāng)時取得了令人振奮的成果。例如，“邏輯理論家”程序在 1952 年證明了著名數(shù)學(xué)家羅素和懷特海的名著《數(shù)學(xué)原理》中的 38 條定理，在1963年證明了全部的52 條定理，而且定理 2.85甚至比羅素和懷特海證明得更巧妙。A. Newell和 H. Simon因此獲得了 1975 年圖靈獎。然而，隨著研究向前發(fā)展，人們逐漸認(rèn)識到，僅具有邏輯推理能力是遠(yuǎn)遠(yuǎn)實現(xiàn)不了人工智能的。E.A. Feigenbaum等人認(rèn)為，要使機器具有智能，就必須設(shè)法使機器擁有知識。在他們的倡導(dǎo)下，20 世紀(jì) 70 年代中期開始，人工智能進入了“知識期”。在這一時期，大量專家系統(tǒng)問世，在很多領(lǐng)域做出了巨大貢獻(xiàn)。E.A. Feigenbaum 作為“知識工程”之父在 1994 年獲得了圖靈獎。但是，專家系統(tǒng)面臨“知識工程瓶頸”，簡單地說，就是由人來把知識總結(jié)出來再教給計算機是相當(dāng)困難的。于是，一些學(xué)者想到，如果機器自己能夠?qū)W習(xí)知識該多好！實際上，圖靈在1950年提出圖靈測試的文章中，就已經(jīng)提到了機器學(xué)習(xí)的可能，而20世紀(jì)50年代其實已經(jīng)開始有機器學(xué)習(xí)相關(guān)的研究工作，主要集中在基于神經(jīng)網(wǎng)絡(luò)的連接主義學(xué)習(xí)方面，代表性工作主要有 F. Rosenblatt 的感知機、B. Widrow 的 Adaline 等。在 20 世紀(jì) 6、70 年代，多種學(xué)習(xí)技術(shù)得到了初步發(fā)展，例如以決策理論為基礎(chǔ)的統(tǒng)計學(xué)習(xí)技術(shù)以及強化學(xué)習(xí)技術(shù)等，代表性工作主要有 A.L. Samuel 的跳棋程序以及 N.J. Nilson 的“學(xué)習(xí)機器”等，20 多年后紅極一時的統(tǒng)計學(xué)習(xí)理論的一些重要結(jié)果也是在這個時期取得的。在這一時期，基于邏輯或圖結(jié)構(gòu)表示的符號學(xué)習(xí)技術(shù)也開始出現(xiàn)，代表性工作有 P. Winston的“結(jié)構(gòu)學(xué)習(xí)系統(tǒng)”、R.S. Michalski等人的“基于邏輯的歸納學(xué)習(xí)系統(tǒng)”、E.B. Hunt 等人的“概念學(xué)習(xí)系統(tǒng)”等。1980 年夏天，在美國卡內(nèi)基梅隆大學(xué)舉行了第一屆機器學(xué)習(xí)研討會；同年，《策略分析與信息系統(tǒng)》連出三期機器學(xué)習(xí)專輯；1983年，Tioga出版社出版了R.S. Michalski、J.G. Carbonell和T.M. Mitchell主編的《機器學(xué)習(xí)：一種人工智能途徑》，書中匯集了 20 位學(xué)者撰寫的 16 篇文章，對當(dāng)時的機器學(xué)習(xí)研究工作進行了總結(jié)，產(chǎn)生了很大反響；1986 年，《Machine Learning》創(chuàng)刊；1989 年，《Artificial Intelligence》出版了機器學(xué)習(xí)專輯，刊發(fā)了一些當(dāng)時比較活躍的研究工作，其內(nèi)容后來出現(xiàn)在J.G. Carbonell主編、MIT出版社 1990 年出版的《機器學(xué)習(xí)：風(fēng)范與方法》一書中?？偟膩砜矗?0 世紀(jì) 80 年代是機器學(xué)習(xí)成為一個獨立的學(xué)科領(lǐng)域并開始快速發(fā)展、各種機器學(xué)習(xí)技術(shù)百花齊放的時期。R.S. Michalski等人中把機器學(xué)習(xí)研究劃分成“從例子中學(xué)習(xí)”、“在問題求解和規(guī)劃中學(xué)習(xí)”、“通過觀察和發(fā)現(xiàn)學(xué)習(xí)”、“從指令中學(xué)習(xí)”等范疇；而 E.A. Feigenbaum在著名的《人工智能手冊》中，則把機器學(xué)習(xí)技術(shù)劃分為四大類，即“機械學(xué)習(xí)”、“示教學(xué)習(xí)”、“類比學(xué)習(xí)”、“歸納學(xué)習(xí)”。

2.2 機器學(xué)習(xí)的理論基礎(chǔ)

機器學(xué)習(xí)的科學(xué)基礎(chǔ)之一是神經(jīng)科學(xué), 然而, 對機器學(xué)習(xí)進展產(chǎn)生重要影響的是以下三個發(fā)現(xiàn), 分別是:

(1) James關(guān)于神經(jīng)元是相互連接的發(fā)現(xiàn)。

(2) McCulloch 與Pitts 關(guān)于神經(jīng)元工作方式是“興奮”和“抑制”的發(fā)現(xiàn)。

(3) Hebb 的學(xué)習(xí)律(神經(jīng)元相互連接強度的變化)。

其中, McCulloch 與Pitts 的發(fā)現(xiàn)對近代信息科學(xué)產(chǎn)生了巨大的影響。對機器學(xué)習(xí), 這項成果給出了近代機器學(xué)習(xí)的基本模型, 加上指導(dǎo)改變連接神經(jīng)元之間權(quán)值的Hebb學(xué)習(xí)律,成為目前大多數(shù)流行的機器學(xué)習(xí)算法的基礎(chǔ)。

1954年, Barlow 與Hebb 在研究視覺感知學(xué)習(xí)時,分別提出了不同假設(shè): Barlow 倡導(dǎo)單細(xì)胞學(xué)說, 假設(shè)從初級階段而來的輸入集中到具有專一性響應(yīng)特點的單細(xì)胞, 并使用這個神經(jīng)單細(xì)胞來表象視覺客體。這個考慮暗示, 神經(jīng)細(xì)胞可能具有較復(fù)雜的結(jié)構(gòu); 而Hebb主張視覺客體是由相互關(guān)聯(lián)的神經(jīng)細(xì)胞集合體來表象, 并稱其為ensemble。在神經(jīng)科學(xué)的研究中, 盡管這兩個假設(shè)均有生物學(xué)證據(jù)的支持, 但是, 這個爭論至今沒有生物學(xué)的定論。這個生物學(xué)的現(xiàn)實, 為我們計算機科學(xué)家留下了想象的空間, 由于在機器學(xué)習(xí)中一直存在著兩種相互補充的不同研究路線, 這兩個假設(shè)對機器學(xué)習(xí)研究有重要的啟示作用。

在機器學(xué)習(xí)劃分的研究中, 基于這兩個假設(shè), 可以清晰地將機器學(xué)習(xí)發(fā)展歷程總結(jié)為: 以感知機、BP與SVM 等為一類；以樣條理論、k-近鄰、Madalin e、符號機器學(xué)習(xí)、集群機器學(xué)習(xí)與流形機器學(xué)習(xí)等為另一類。

在McCulloch 與Pitts 模型的基礎(chǔ)上, 1957 年, Rosenblatt 首先提出了感知機算法,這是第一個具有重要學(xué)術(shù)意義的機器學(xué)習(xí)算法。這個思想發(fā)展的坎坷歷程, 正是機器學(xué)習(xí)研究發(fā)展歷史的真實寫照。感知機算法主要貢獻(xiàn)是: 首先, 借用最簡單的McCulloch與Pitts模型作為神經(jīng)細(xì)胞模型; 然后,根據(jù)Hebb集群的考慮, 將多個這樣的神經(jīng)細(xì)胞模型根據(jù)特定規(guī)則集群起來,形成神經(jīng)網(wǎng)絡(luò), 并將其轉(zhuǎn)變?yōu)橄率鰴C器學(xué)習(xí)問題: 計算一個超平面, 將在空間上不同類別標(biāo)號的點劃分到不同區(qū)域。在優(yōu)化理論的基礎(chǔ)上, Rosenblatt 說明, 如果一個樣本集合是線性可分, 則這個算法一定可以以任何精度收斂。由此導(dǎo)致的問題是, 對線性不可分問題如何處理。

1969年,Minsky 與Paper出版了對機器學(xué)習(xí)研究具有深遠(yuǎn)影響的著作Perceptron(《感知機》)。目前, 人們一般的認(rèn)識是, 由于這本著作中提出了XOR 問題, 從而扼殺了感知機的研究方向。然而, 在這本著作中對機器學(xué)習(xí)研究提出的基本思想, 至今還是正確的, 其思想的核心是兩條:

(1) 算法能力: 只能解決線性問題的算法是不夠的, 需要能夠解決非線性問題的算法。

(2) 計算復(fù)雜性: 只能解決玩具世界問題的算法是沒有意義的, 需要能夠解決實際世界問題的算法。

在1986 年, Rumelhart 等人的BP 算法解決了XOR 問題, 沉寂近二十年的感知機研究方向重新獲得認(rèn)可,人們自此重新開始關(guān)注這個研究方向, 這是Rumelhart等人的重要貢獻(xiàn)。

在20 世紀(jì)60 年代的另一個重要研究成果來自Widrow。1960 年,Widrow 推出了Madaline 模型, 在算法上,對線性不可分問題, 其本質(zhì)是放棄劃分樣本集的決策分界面連續(xù)且光滑的條件, 代之分段的平面。從近代的觀點來看, 這項研究與感知機的神經(jīng)科學(xué)假設(shè)的主要區(qū)別是: 它是確認(rèn)Barlow 假設(shè)中神經(jīng)細(xì)胞具有較復(fù)雜結(jié)構(gòu)的思想,由此,將線性模型(例如, 感知機)考慮為神經(jīng)細(xì)胞模型( 而不是簡單的McCulloch與Pitts模型) ,然后, 再基于Hebb 神經(jīng)元集合體假設(shè), 將這些局部模型集群為對問題世界的表征, 由此解決線性不可分問題。但是, 這項研究遠(yuǎn)不如感知機著名, 其原因是: 其一, 盡管Madaline可以解決線性不可分問題, 但是, 其解答可能是平凡的; 其二,Widrow 沒有給出其理論基礎(chǔ), 事實上,其理論基礎(chǔ)遠(yuǎn)比感知機復(fù)雜, 直到1990 年, Schapire根據(jù)Valiant 的“概率近似正確(PAC)”理論證明了“弱可學(xué)習(xí)定理”之后, 才真正引起人們的重視。

進一步比較機器學(xué)習(xí)中兩個不同路線的神經(jīng)科學(xué)啟示是有趣的: 對機器學(xué)習(xí)來說, 它們最顯著的差別是對神經(jīng)細(xì)胞模型的假設(shè), 例如, 感知機是以最簡單的McCulloch與Pitts 模型作為神經(jīng)細(xì)胞模型, 而Madaline 是以問題世界的局部模型作為神經(jīng)細(xì)胞模型,兩種方法都需要根據(jù)Hebb 思想集群。因此, 對機器學(xué)習(xí)研究, 兩個神經(jīng)科學(xué)的啟示是互補的。但是, 兩者還有區(qū)別: 前者強調(diào)模型的整體性, 這與Barlow“表征客體的單一細(xì)胞論”一致, 因此, 我們稱其為Barlow 路線; 而后者則強調(diào)對世界的表征需要多個神經(jīng)細(xì)胞集群, 這與Hebb“表征客體的多細(xì)胞論”一致, 我們稱其為Hebb 路線。鑒于整體模型與局部模型之間在計算上有本質(zhì)差別, 盡管根據(jù)Barlow 與Hebb 假設(shè)區(qū)分機器學(xué)習(xí)的方法。

在這一節(jié)的最后, 將1989 年Carbonell對機器學(xué)習(xí)以后十年的展望與十年后Diet terich 的展望作一個對比, 可能是有趣的, 我們希望以此說明機器學(xué)習(xí)研究由于面臨問題的改變所發(fā)生的變遷(表1) 。

3 統(tǒng)計機器學(xué)習(xí)

統(tǒng)計機器學(xué)習(xí)是近幾年被廣泛應(yīng)用的機器學(xué)習(xí)方法,事實上,這是一類相當(dāng)廣泛的方法。更為廣義地說, 這是一類方法學(xué)。當(dāng)我們獲得一組對問題世界的觀測數(shù)據(jù), 如果我們不能或者沒有必要對其建立嚴(yán)格物理模型,我們可以使用數(shù)學(xué)的方法, 從這組數(shù)據(jù)推算問題世界的數(shù)學(xué)模型, 這類模型一般沒有對問題世界的物理解釋, 但是, 在輸入輸出之間的關(guān)系上反映了問題世界的實際, 這就是“黑箱”原理。一般來說,“黑箱”原理是基于統(tǒng)計方法的(假設(shè)問題世界滿足一種統(tǒng)計分布) , 統(tǒng)計機器學(xué)習(xí)本質(zhì)上就是“黑箱”原理的延續(xù)。與感知機時代不同, 由于這類機器學(xué)習(xí)科學(xué)基礎(chǔ)是感知機的延續(xù), 因此,神經(jīng)科學(xué)基礎(chǔ)不是近代統(tǒng)計機器學(xué)習(xí)關(guān)注的主要問題, 數(shù)學(xué)方法成為研究的焦點。

3.1 統(tǒng)計機器學(xué)習(xí)概述

統(tǒng)計機器學(xué)習(xí)方法的基本假設(shè)是同類數(shù)據(jù)具有一定的統(tǒng)計規(guī)律性。其目標(biāo)是從假設(shè)空間（也即模型空間，從輸入空間到輸出空間的映射函數(shù)空間）中尋找一個最優(yōu)的模型。

通過對統(tǒng)計機器學(xué)習(xí)目標(biāo)的描述，我們可以發(fā)現(xiàn)統(tǒng)計機器學(xué)習(xí)方法主要研究三個問題：

(1)模型假設(shè)：這個問題解決的是如何將樣本從輸入空間轉(zhuǎn)化到輸出空間的，它往往是一個后驗概率或者是一個映射函數(shù)。

(2)模型選擇：模型所在空間也就是假設(shè)空間，往往包含無窮多個滿足假設(shè)的可選模型，如何從假設(shè)空間中選擇一個最優(yōu)模型，應(yīng)該采用怎樣的選擇標(biāo)準(zhǔn)？這就是模型選擇應(yīng)該解決的問題。一般采用損失函數(shù)來制定模型選擇策略，將模型選擇轉(zhuǎn)化為一個最優(yōu)化問題來求解。常用的損失函數(shù)包括0-1損失、平方誤差損失、絕對損失、對數(shù)損失等等。通常我們也會在損失函數(shù)中加上正則化項，從而降低模型的復(fù)雜性，提高模型的泛化能力，拒絕Overfitting。

(3)學(xué)習(xí)算法：學(xué)習(xí)算法是用來解決最優(yōu)化問題的方法。在給定損失函數(shù)后，如何快速找到損失函數(shù)約定條件下的最優(yōu)解就是學(xué)習(xí)算法需要解決的問題。常用的學(xué)習(xí)算法包括梯度下降、擬牛頓法等等。

統(tǒng)計機器學(xué)習(xí)方法的三個問題都是非常值得研究的，對于模型假設(shè)這個問題，如果模型都選擇錯誤，無論后面如何選擇模型，也都難以反映數(shù)據(jù)集的正確分布。因此，首先需要選擇對模型做出正確假設(shè)，如何選擇模型的假設(shè)空間是一個學(xué)問，除掉交叉驗證的方法之外還有不少其他方法。模型選擇的關(guān)鍵在于如何設(shè)計損失函數(shù)，而損失函數(shù)通常包括損失項和正則化項，不同的模型選擇策略通常選出的模型也非常不同，從而導(dǎo)致模型的預(yù)測效果也大大不同。學(xué)習(xí)算法比較定式，不同的學(xué)習(xí)算法不僅學(xué)習(xí)的效率不同，而且學(xué)習(xí)出來的效果也不一樣。

3.2 統(tǒng)計機器學(xué)習(xí)的理論基礎(chǔ)

機器學(xué)習(xí)早期研究的特點是以劃分為主要研究課題, 這個考慮一直延續(xù)到Vapnik 在20 世紀(jì)70 年代發(fā)展的關(guān)于有限樣本統(tǒng)計理論, 并于20 世紀(jì)80 年代末流傳到西方之后,在泛化能力意義下指導(dǎo)算法設(shè)計才成為人們關(guān)注的主要問題, 這是本文需要進一步討論的問題。

盡管以O(shè)pen 問題驅(qū)動的BP 算法研究大大推動了感知機研究方向的發(fā)展, 然而, 近十年計算機科學(xué)與技術(shù)的快速發(fā)展,使得人們獲得數(shù)據(jù)的能力大大提高, BP 這類算法已不能完全適應(yīng)這種需求, 同時,Minsky 的算法設(shè)計原則愈顯重要。

然而,沿著Barlow 路線的機器學(xué)習(xí)研究并沒有終止,自1992年開始,Vapnik 將有限樣本統(tǒng)計理論介紹給全世界, 并出版了統(tǒng)計機器學(xué)習(xí)理論的著作盡管這部著作更多地是從科學(xué)、哲學(xué)上討論了機器學(xué)習(xí)的諸多問題, 但是, 其暗示的算法設(shè)計思想對以后機器學(xué)習(xí)算法研究產(chǎn)生了重要的影響。

Vapnik 的研究主要涉及機器學(xué)習(xí)中兩個相互關(guān)聯(lián)的問題, 泛化問題與表示問題。前者包含兩個方面的內(nèi)容: 其一, 有限樣本集合的統(tǒng)計理論; 其二, 概率近似正確的泛化描述。而后者則主要集中在核函數(shù), 由此, 將算法設(shè)計建立在線性優(yōu)化理論之上。

Valiant的“概率近似正確”學(xué)習(xí)的考慮在機器學(xué)習(xí)的發(fā)展中扮演了一個重要的角色。1984 年,Valiant 提出了機器學(xué)習(xí)的一個重要考慮, 他建議評價機器學(xué)習(xí)算法應(yīng)該以“概率近似正確(PAC)”為基礎(chǔ),而不是以傳統(tǒng)模式識別理論中以概率為1 成立為基礎(chǔ),由此, 他引入了類似在數(shù)學(xué)分析中的ε-δ語言來描述PAC, 這個考慮對近代機器學(xué)習(xí)研究產(chǎn)生了重要的影響。首先, 統(tǒng)計機器學(xué)習(xí)理論中泛化不等式的推導(dǎo)均以這個假設(shè)為基礎(chǔ);其次, 基于這個考慮的“弱可學(xué)習(xí)理論”,為研究基于Hebb 路線的學(xué)習(xí)算法設(shè)計奠定了理論基礎(chǔ), 并產(chǎn)生被廣泛應(yīng)用的集群機器學(xué)習(xí)理念( ensemble )。

3.3 統(tǒng)計機器學(xué)習(xí)的研究現(xiàn)狀

3.3.1SVM與Deep Learning的競爭

當(dāng)前統(tǒng)計學(xué)習(xí)領(lǐng)域最熱門方法主要有deep learning和SVM（supportvector machine），它們是統(tǒng)計學(xué)習(xí)的代表方法。

可以認(rèn)為神經(jīng)網(wǎng)絡(luò)與支持向量機都源自于感知機（Perceptron）。感知機是由Rosenblatt發(fā)明的線性分類模型（1958年）。感知機對線性分類有效，但現(xiàn)實中的分類問題通常是非線性的。

神經(jīng)網(wǎng)絡(luò)與支持向量機（包含核方法）都是非線性分類模型。1986年，Rummelhart與McClelland發(fā)明了神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)算法Back Propagation。后來，Vapnik等人于1992年提出了支持向量機。神經(jīng)網(wǎng)絡(luò)是多層（通常是三層）的非線性模型，支持向量機利用核技巧把非線性問題轉(zhuǎn)換成線性問題。

神經(jīng)網(wǎng)絡(luò)與支持向量機一直處于“競爭”關(guān)系。SVM應(yīng)用核函數(shù)的展開定理，無需知道非線性映射的顯式表達(dá)式；由于是在高維特征空間中建立線性學(xué)習(xí)機，所以與線性模型相比，不但幾乎不增加計算的復(fù)雜性，而且在某種程度上避免了“維數(shù)災(zāi)難”。而早先的神經(jīng)網(wǎng)絡(luò)算法比較容易過訓(xùn)練，大量的經(jīng)驗參數(shù)需要設(shè)置；訓(xùn)練速度比較慢，在層次比較少(小于等于3)的情況下效果并不比其它方法更優(yōu)。

神經(jīng)網(wǎng)絡(luò)研究領(lǐng)域領(lǐng)軍者Hinton在2006年提出了神經(jīng)網(wǎng)絡(luò)Deep Learning算法，使神經(jīng)網(wǎng)絡(luò)的能力大大提高，向支持向量機發(fā)出挑戰(zhàn)。Deep Learning假設(shè)神經(jīng)網(wǎng)絡(luò)是多層的，首先用RestrictedBoltzmann Machine（非監(jiān)督學(xué)習(xí)）學(xué)習(xí)網(wǎng)絡(luò)的結(jié)構(gòu)，然后再通過Back Propagation（監(jiān)督學(xué)習(xí)）學(xué)習(xí)網(wǎng)絡(luò)的權(quán)值。

3.3.2 支持向量機SVM

SVM方法是通過一個非線性映射p，把樣本空間映射到一個高維乃至無窮維的特征空間中（Hilber空間），使得在原來的樣本空間中非線性可分的問題轉(zhuǎn)化為在特征空間中的線性可分的問題。升維，就是把樣本向高維空間做映射，一般情況下這會增加計算的復(fù)雜性，甚至?xí)稹熬S數(shù)災(zāi)難”，因而人們很少問津。但是作為分類、回歸等問題來說，很可能在低維樣本空間無法線性處理的樣本集，在高維特征空間中卻可以通過一個線性超平面實現(xiàn)線性劃分（或回歸）。一般的升維都會帶來計算的復(fù)雜化，SVM方法巧妙地解決了這個難題：應(yīng)用核函數(shù)的展開定理，就不需要知道非線性映射的顯式表達(dá)式；由于是在高維特征空間中建立線性學(xué)習(xí)機，所以與線性模型相比，不但幾乎不增加計算的復(fù)雜性，而且在某種程度上避免了“維數(shù)災(zāi)難”．這一切要歸功于核函數(shù)的展開和計算理論．

選擇不同的核函數(shù)，可以生成不同的SVM，常用的核函數(shù)有以下4種：

⑴ 性核函數(shù)K(x,y)=x·y；

⑵多項式核函數(shù)K(x,y)=[(x·y)+1]d；

⑵ 向基函數(shù)K(x,y)=exp(-|x-y|^2/d^2）

⑶ 層神經(jīng)網(wǎng)絡(luò)核函數(shù)K(x,y)=tanh(a(x·y)+b）．

3.3.2.1 SVM有如下主要幾個特點：

(1)非線性映射是SVM方法的理論基礎(chǔ),SVM利用內(nèi)積核函數(shù)代替向高維空間的非線性映射；

(2)對特征空間劃分的最優(yōu)超平面是SVM的目標(biāo),最大化分類邊際的思想是SVM方法的核心；

(3)支持向量是SVM的訓(xùn)練結(jié)果,在SVM分類決策中起決定作用的是支持向量。(4)SVM 是一種有堅實理論基礎(chǔ)的新穎的小樣本學(xué)習(xí)方法。它基本上不涉及概率測度及大數(shù)定律等,因此不同于現(xiàn)有的統(tǒng)計方法。從本質(zhì)上看,它避開了從歸納到演繹的傳統(tǒng)過程,實現(xiàn)了高效的從訓(xùn)練樣本到預(yù)報樣本的“轉(zhuǎn)導(dǎo)推理”,大大簡化了通常的分類和回歸等問題。

(5)SVM 的最終決策函數(shù)只由少數(shù)的支持向量所確定,計算的復(fù)雜性取決于支持向量的數(shù)目,而不是樣本空間的維數(shù),這在某種意義上避免了“維數(shù)災(zāi)難”。

(6)少數(shù)支持向量決定了最終結(jié)果,這不但可以幫助我們抓住關(guān)鍵樣本、“剔除”大量冗余樣本,而且注定了該方法不但算法簡單,而且具有較好的“魯棒”性。這種“魯棒”性主要體現(xiàn)在:

①增、刪非支持向量樣本對模型沒有影響;

②支持向量樣本集具有一定的魯棒性;

③有些成功的應(yīng)用中,SVM 方法對核的選取不敏感

3.3.2.2 SVM的兩個不足：

(1) SVM算法對大規(guī)模訓(xùn)練樣本難以實施

由于SVM是借助二次規(guī)劃來求解支持向量，而求解二次規(guī)劃將涉及m階矩陣的計算（m為樣本的個數(shù)），當(dāng)m數(shù)目很大時該矩陣的存儲和計算將耗費大量的機器內(nèi)存和運算時間。針對以上問題的主要改進有有J.Platt的SMO算法、T.Joachims的SVM、C.J.C.Burges等的PCGC、張學(xué)工的 CSVM以及O.L.Mangasarian等的SOR算法。

(2) 用SVM解決多分類問題存在困難

經(jīng)典的支持向量機算法只給出了二類分類的算法，而在數(shù)據(jù)挖掘的實際應(yīng)用中，一般要解決多類的分類問題?？梢酝ㄟ^多個二類支持向量機的組合來解決。主要有一對多組合模式、一對一組合模式和SVM決策樹；再就是通過構(gòu)造多個分類器的組合來解決。主要原理是克服SVM固有的缺點，結(jié)合其他算法的優(yōu)勢，解決多類問題的分類精度。如：與粗集理論結(jié)合，形成一種優(yōu)勢互補的多類問題的組合分類器。

3.3.2 DeepLearning

DeepLearning本身算是MachineLearning的一個分支，簡單可以理解為Neural Network的發(fā)展。大約二三十年前，Neural Network曾經(jīng)是ML領(lǐng)域特別火熱的一個方向，但是后來確慢慢淡出了，原因包括以下幾個方面：

(1) 比較容易過訓(xùn)練，參數(shù)比較難確定；

(2) 訓(xùn)練速度比較慢，在層次比較少(小于等于3)的情況下效果并不比其它方法更優(yōu)；

所以中間有大約20多年的時間，神經(jīng)網(wǎng)絡(luò)被關(guān)注很少，這段時間基本上由SVM和Boosting算法主導(dǎo)。但是，Hinton堅持下來并最終（和Bengio、Yann.lecun等）提成了一個實際可行的Deep Learning框架。

3.3.3.1 Deep Learning與傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)異同

Deep Learning與傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)的相同在于Deep Learning采用了神經(jīng)網(wǎng)絡(luò)相似的分層結(jié)構(gòu)，系統(tǒng)由包括輸入層、隱層（多層）、輸出層組成的多層網(wǎng)絡(luò)，只有相鄰層節(jié)點之間有連接，同一層以及跨層節(jié)點之間相互無連接，每一層可以看作是一個Logistic Regression模型；這種分層結(jié)構(gòu)，是比較接近人類大腦的結(jié)構(gòu)的。

而為了克服神經(jīng)網(wǎng)絡(luò)訓(xùn)練中的問題，DL采用了與神經(jīng)網(wǎng)絡(luò)很不同的訓(xùn)練機制。傳統(tǒng)神經(jīng)網(wǎng)絡(luò)中，采用的是Back Propagation的方式進行，簡單來講就是采用迭代的算法來訓(xùn)練整個網(wǎng)絡(luò)，隨機設(shè)定初值，計算當(dāng)前網(wǎng)絡(luò)的輸出，然后根據(jù)當(dāng)前輸出和label之間的差去改變前面各層的參數(shù)，直到收斂（整體是一個梯度下降法）。而DeepLearning整體上是一個Layer-Wise的訓(xùn)練機制。這樣做的原因是因為，如果采用Back Propagation的機制，對于一個Deep Network（7層以上），殘差傳播到最前面的層已經(jīng)變得太小，出現(xiàn)所謂的Gradient Diffusion。

3.3.3.2 Deep Learning訓(xùn)練過程

(1)采用無標(biāo)定數(shù)據(jù)（有標(biāo)定數(shù)據(jù)也可）分層訓(xùn)練各層參數(shù)，這一步可以看作是一個無監(jiān)督訓(xùn)練過程，是和傳統(tǒng)神經(jīng)網(wǎng)絡(luò)區(qū)別最大的部分（這個過程可以看作是feature learning過程）：具體的，先用無標(biāo)定數(shù)據(jù)訓(xùn)練第一層，訓(xùn)練時可以采用auto-encoder來學(xué)習(xí)第一層的參數(shù)（這一層可以看作是得到一個使得輸出和輸入差別最小的三層神經(jīng)網(wǎng)絡(luò)的隱層），由于模型capacity的限制以及稀疏性約束，使得得到的模型能夠?qū)W習(xí)到數(shù)據(jù)本身的結(jié)構(gòu)，從而得到比輸入更具有表示能力的特征；在學(xué)習(xí)得到第n-1層后，將n-1層的輸出作為第n層的輸入，訓(xùn)練第n層，由此分別得到各層的參數(shù)；這里面需要重點理解auto-encoder以及sparse的機制的原理和作用?？梢詤⒖歼@篇文章。

(2)基于第一步得到的各層參數(shù)進一步fine-tune整個多層模型的參數(shù)，這一步是一個有監(jiān)督訓(xùn)練過程；第一步類似神經(jīng)網(wǎng)絡(luò)的隨機初始化初值過程，由于DL 的第一步不是隨機初始化，而是通過學(xué)習(xí)輸入數(shù)據(jù)的結(jié)構(gòu)得到的，因而這個初值更接近全局最優(yōu)，從而能夠取得更好的效果；所以deep learning效果好很大程度上歸功于第一步的feature learning過程。

總之，deep learning能夠得到更好地表示數(shù)據(jù)的feature，同時由于模型的層次、參數(shù)很多，capacity足夠，因此，模型有能力表示大規(guī)模數(shù)據(jù)，所以對于圖像、語音這種特征不明顯（需要手工設(shè)計且很多沒有直觀物理含義）的問題，能夠在大規(guī)模訓(xùn)練數(shù)據(jù)上取得更好的效果。此外，從模式識別特征和分類器的角度，deep learning框架將feature和分類器結(jié)合到一個框架中，用數(shù)據(jù)去學(xué)習(xí)feature，在使用中減少了手工設(shè)計feature的巨大工作量（這是目前工業(yè)界工程師付出努力最多的方面），因此，不僅僅效果可以更好，而且，使用起來也有很多方便之處。

4 集群機器學(xué)習(xí)

4.1 弱可學(xué)習(xí)定理

1990 年, Schapire 證明了一個有趣的定理: 如果一個概念是弱可學(xué)習(xí)的, 充要條件是它是強可學(xué)習(xí)的。這個定理的證明是構(gòu)造性的, 證明過程暗示了弱分類器的思想。所謂弱分類器就是比隨機猜想稍好的分類器, 這意味著, 如果我們可以設(shè)計這樣一組弱分類器, 并將它們集群起來, 就可以成為一個強分類器, 這就是集群機器學(xué)習(xí)。由于弱分類器包含“比隨機猜想稍好”的條件, 從而, 避免了對Madaline 平凡解的批評。另外, 由于Schapire 定理的證明基于PAC的弱可學(xué)習(xí)理論, 因此, 這種方法又具有泛化理論的支持。這樣, 自Widrow 提出Madaline近30 年之后, 人們終于獲得了基于Hebb 路線下的機器學(xué)習(xí)算法設(shè)計的理論基礎(chǔ)。這個學(xué)習(xí)理念立即獲得人們的廣泛關(guān)注, 其原因不言自明,弱分類器的設(shè)計總比強分類器設(shè)計容易, 特別是對線性不可分問題更是如此。由此,Madaline 與感知機一樣, 成為機器學(xué)習(xí)最重要的經(jīng)典。

4.2 經(jīng)典算法

Boosting 是一種用來提高學(xué)習(xí)算法準(zhǔn)確度的方法, 這種方法通過構(gòu)造一個預(yù)測函數(shù)系列, 然后以一定的方式將它們組合成一個預(yù)測函數(shù), 達(dá)到把一弱學(xué)習(xí)算法提升為強學(xué)習(xí)算法的目的。1989 年Schapire 提出了第一個可證明的多項式時間Boosting 算法, 對這個問題作出了肯定的回答。一年后,Freund 設(shè)計了一個高效得多的通過重取樣或過濾運作的Boosting- by-Majority 算法。這個算法盡管在某種意義上是優(yōu)化的, 但卻有一些實踐上的缺陷。1995 年Freund 和Schapire介紹了通過調(diào)整權(quán)重而運作的AdaBoost 算法解決了早期Boosting算法很多實踐上的困難。

AdaBoost 是Boosting 家族中的基礎(chǔ)算法。Boosting家族中的大部分?jǐn)U展( 算法) 都由它得來,對AdaBoost 的分析結(jié)論也適用于其它的Boosting。下面簡要地介紹一下它的思想。

AdaBoost 算法的主要思想是給定一弱學(xué)習(xí)算法和訓(xùn)練集( x1, y1) , , , ( xn, yn ) 。這里xi 為一向量, yi 對于分類問題為一類別標(biāo)志, 對于回歸問題為一數(shù)值。初始化時對每一個訓(xùn)練例賦相等的權(quán)重1/ n , 然后用該學(xué)習(xí)算法對訓(xùn)練集訓(xùn)練t 輪, 每次訓(xùn)練后, 對訓(xùn)練失敗的訓(xùn)練例賦以較大的權(quán)重, 也就是讓學(xué)習(xí)算法在后續(xù)的學(xué)習(xí)中集中對比較難的訓(xùn)練例進行學(xué)習(xí), 從而得到一個預(yù)測函數(shù)序列h1, , , ht ,其中hj 也有一定的權(quán)重, 預(yù)測效果好的預(yù)測函數(shù)權(quán)重較大, 反之較小。最終的預(yù)測函數(shù)H 對分類問題采用有權(quán)重的投票方式, 對回歸問題采用加權(quán)平均的方法對新示例進行判別。

Boosting 算法是一種基于其他機器學(xué)習(xí)算法之上的用來提高算法精度和性能的方法。當(dāng)用于回歸分析時, 不需要構(gòu)造一個擬合精度高、預(yù)測能力好的回歸算法, 只要一個效果只比隨機猜測略好的粗糙算法即可, 稱之為基礎(chǔ)算法。通過不斷地調(diào)用這個基礎(chǔ)算法就可以獲得一個擬合和預(yù)測誤差都相當(dāng)好的組合回歸模型。Boosting 算法可以應(yīng)用于任何的基礎(chǔ)回歸算法, 無論是線性回歸、神經(jīng)網(wǎng)絡(luò)、還是SVM 方法, 都可以有效地提高精度。因此, Boosting可以被視為一種通用的增強基礎(chǔ)算法性能的回歸分析算法。

Bagging(Bootstrap Aggregating) 又被稱為自舉聚合, 是Breiman 提出的與Boosting 相似的技術(shù)。[ 11]Bagging 技術(shù)的主要思想是給定一弱學(xué)習(xí)算法和一訓(xùn)練集( x 1, y1), , ( xn , yn ) 。讓該學(xué)習(xí)算法訓(xùn)練多輪, 每輪的訓(xùn)練集由從初始的訓(xùn)練集中隨機取出的n 個訓(xùn)練例組成, 初始訓(xùn)練例在某輪訓(xùn)練集中可以出現(xiàn)多次或根本不出現(xiàn)。訓(xùn)練之后可得到一個預(yù)測函數(shù)序列: h1, , , ht , 最終的預(yù)測函數(shù)H 對分類問題采用投票方式, 對回歸問題采用簡單平均。

Bagging 與Boosting 的區(qū)別在于Bagging 的訓(xùn)練集的選擇是隨機的, 各輪訓(xùn)練集之間相互獨立, 而Boosting的訓(xùn)練集的選擇不是獨立的, 各輪訓(xùn)練集的選擇與前面各輪的學(xué)習(xí)結(jié)果有關(guān); Bagging 的各個預(yù)測函數(shù)沒有權(quán)重, 可以并行生成, 而Boosting 是有權(quán)重的, 只能依次順序生成; Boosting 往往從一些弱的學(xué)習(xí)器開始, 組合形成一個集成學(xué)習(xí)器, 從而給出一個好的學(xué)習(xí)結(jié)果, 而Bagging學(xué)習(xí)效果的好壞往往取決于集成學(xué)習(xí)器中每個學(xué)習(xí)器的相關(guān)性和各個學(xué)習(xí)器的學(xué)習(xí)效果。對于神經(jīng)網(wǎng)絡(luò)這類極為耗時的學(xué)習(xí)方法, Bagging 可通過并行訓(xùn)練節(jié)省大量時間開銷。

5 符號機器學(xué)習(xí)

自1969 年Minsky 出版Perceptron(《感知機》)一書以后, 感知機的研究方向被終止,到1986 年Rumelhart 等發(fā)表BP 算法, 近20 年間, 機器學(xué)習(xí)研究者在做什么事情呢? 這段時間正是基于符號處理的人工智能的黃金時期, 由于專家系統(tǒng)研究的推動, 符號機器學(xué)習(xí)得到發(fā)展, 事實上, 這類研究方法除了建立在符號的基礎(chǔ)上之外, 從學(xué)習(xí)的機理來看, 如果將學(xué)習(xí)結(jié)果考慮為規(guī)則, 每個規(guī)則將是一個分類器, 盡管這些分類器中有些不一定滿足弱分類器的條件, 但是, 它應(yīng)該是Hebb 路線的延續(xù)。

符號機器學(xué)習(xí)的最大優(yōu)點是歸納的解答與歸納的過程是可解釋的, 換句話說, 數(shù)據(jù)集合中的每個觀測(樣本或?qū)ο?對用戶都是透明的, 它在解答以及計算過程中所扮演的角色, 用戶都是可以顯現(xiàn)了解的。然而, 它的缺陷同樣突出, 就是泛化能力。由于學(xué)習(xí)結(jié)果是符號表述, 因此, 只可能取“真”與“假”, 這樣大大減低了對具有一定噪音數(shù)據(jù)的分析能力, 需要其他技術(shù)來補充: 其一, 觀測世界的數(shù)據(jù)到符號域的映射, 其二, 不確定推理機制。但是, 這兩種方法與符號機器學(xué)習(xí)方法本身并沒有必然的關(guān)系。

近幾年, 由于數(shù)據(jù)挖掘的提出, 符號機器學(xué)習(xí)原理有了新的用途, 這就是符號數(shù)據(jù)分析, 在數(shù)據(jù)挖掘中稱為數(shù)據(jù)描述, 以便與數(shù)據(jù)預(yù)測類型的任務(wù)相區(qū)別(從任務(wù)來說, 這類任務(wù)與機器學(xué)習(xí)是一致的)。

與機器學(xué)習(xí)的目標(biāo)不同, 數(shù)據(jù)分析不是以所有用戶具有相同需求為假設(shè), 相反, 強調(diào)不同用戶具有不同的需求。另外, 數(shù)據(jù)分析強調(diào), 分析結(jié)果是為用戶提供可閱讀的參考文本, 決策將依賴人的洞察。如何根據(jù)用戶的特定需求將觀測數(shù)據(jù)集合變換為簡潔的、可為用戶理解的表示成為關(guān)鍵。這是符號機器學(xué)習(xí)的另一個可以考慮的應(yīng)用領(lǐng)域。由于符號機器學(xué)習(xí)在泛化能力上的欠缺, 這也是它在與基于統(tǒng)計的機器學(xué)習(xí)方法競爭中避免遭到淘汰的出路。

6 增強機器學(xué)習(xí)方法

增強機器學(xué)習(xí)( reinfo rcementlearning )的本質(zhì)是對變化的環(huán)境的適應(yīng)。應(yīng)該說,這是一種“古老”的機器學(xué)習(xí)思想.在1948年, Wiener的著作“控制論”中,就討論了這個問題,而在以后的控制理論的研究中,這發(fā)展成為重要的研究課題—— 自適應(yīng)控制。由于控制理論研究這個問題的焦點在于控制品質(zhì),且其使用的數(shù)學(xué)工具是微分方程,因此,對非線性問題,使用計算機進行數(shù)值求解存在著本質(zhì)性的困難。這是這類機器學(xué)習(xí)長期未得到計算機科學(xué)家注意的原因。

直到20世紀(jì)70年代, Holland在討論進化計算時,需要考慮控制物種群體的染色體數(shù)量,以便淘汰對變化環(huán)境不適應(yīng)的個體,為此,提出使用桶隊算法解決這個問題。桶隊算法在Holland提出的分類器系統(tǒng)中扮演著對變換環(huán)境適應(yīng)的角色。

以后,在20世紀(jì)90年代初, Sutton提出將這類機器學(xué)習(xí)建立在Markov 過程上,并稱其為增強機器學(xué)習(xí)方法。這個方法是根據(jù)環(huán)境變化對系統(tǒng)的刺激,并作為系統(tǒng)輸入,然后,利用基于統(tǒng)計的方法優(yōu)化轉(zhuǎn)移概率,并使系統(tǒng)適應(yīng)新的環(huán)境。

一般地說,增強機器學(xué)習(xí)應(yīng)該屬于無教師學(xué)習(xí),但是,如果考慮環(huán)境就是教師,這類機器學(xué)習(xí)也可以認(rèn)為是一類特殊有教師的機器學(xué)習(xí),與一般有教師機器學(xué)習(xí)的區(qū)別在于: 教師是環(huán)境,且是變化的環(huán)境。這意味著,不像傳統(tǒng)意義下的有教師學(xué)習(xí),教師教授的知識不是事先給定的,而是采用更靈活方法,在問題求解的過程中獲得的。

7 總結(jié)

本文從機器學(xué)習(xí)的起源，發(fā)展依據(jù)，歷史上的重要事件角度討論了機器學(xué)習(xí)發(fā)展脈絡(luò)。通過“對神經(jīng)細(xì)胞模型假設(shè)的差別”將機器學(xué)習(xí)領(lǐng)域劃分為兩大支系——強調(diào)模型的整體性，基于Barlow“表征客體的單一細(xì)胞論”的Barlow路線；強調(diào)對世界的表征需要多個神經(jīng)細(xì)胞集群，基于Hebb“表征客體的多細(xì)胞論”的Hebb路線。這一劃分可以清晰地將機器學(xué)習(xí)發(fā)展歷程總結(jié)為：以感知機、BP與SVM等為一類的Barlow路線；以樣條理論、k-緊鄰、Madaline、符號機器學(xué)習(xí)，集群機器學(xué)習(xí)與流行機器學(xué)習(xí)等為一類的Hebb路線。

其中，又重點關(guān)注了目前發(fā)展良好的統(tǒng)計機器學(xué)習(xí)與集群學(xué)習(xí)。討論了SVM與神經(jīng)網(wǎng)絡(luò)的關(guān)系與優(yōu)缺點，以及將弱學(xué)習(xí)算法提升為強學(xué)習(xí)算法的Boosting算法。

本文提倡研究者需要重視這樣一個問題：我們探討機器學(xué)習(xí)在理念、理論、與技術(shù)上發(fā)展的各種方法所遵循的假設(shè)，是否能夠適應(yīng)當(dāng)前任務(wù)的需要？如果問題是否定的,那么，我們是修補這些已被普遍認(rèn)可的理念、理論與方法(打補丁)，以適應(yīng)當(dāng)前的需要，還是從根本上清理原有假設(shè)，提出新的假設(shè)，從而發(fā)展新的理念、理論和方法？這是一個需要仔細(xì)分析已有理論與方法，并權(quán)衡各種利弊才能決定的事情。綜上所述，討論機器學(xué)習(xí)發(fā)展脈絡(luò)，以從這個脈絡(luò)發(fā)現(xiàn)有趣的經(jīng)驗和教訓(xùn)，對回答這個問題是重要的，這必須考慮機器學(xué)習(xí)發(fā)展的科學(xué)依據(jù)，歷史上的重要事件，以及理論研究中的重要結(jié)論。這就是我們本文的討論集中在動機和理論的原因。

閱讀全文

上一頁 1 2 3全文

本文導(dǎo)航

第 1 頁：機器學(xué)習(xí)綜述——機器學(xué)習(xí)理論基礎(chǔ)與發(fā)展脈絡(luò)
第 2 頁：3 統(tǒng)計機器學(xué)習(xí)
第 3 頁：4 集群機器學(xué)習(xí)

人工智能(229980) 人工智能(229980)
機器學(xué)習(xí)(130422) 機器學(xué)習(xí)(130422)

機器學(xué)習(xí)與軟件平臺的融合

本文將探討機器學(xué)習(xí)與軟件平臺的融合。

2021-01-28 06:36:35

機器學(xué)習(xí)入門篇：一個完整的機器學(xué)習(xí)項目

機器學(xué)習(xí)項目入門篇：一個完整的機器學(xué)習(xí)項目

2020-05-11 14:47:49

機器學(xué)習(xí)在醫(yī)療保健中有哪些應(yīng)用？

的發(fā)展這項技術(shù)進步為行業(yè)利益相關(guān)者之間更緊密的合作，負(fù)擔(dān)得起且侵入性較小的手術(shù)選擇，整體療法以及新的護理模式奠定了基礎(chǔ)。以下是當(dāng)前和新興機器學(xué)習(xí)創(chuàng)新的五個

2020-11-24 07:15:44

機器學(xué)習(xí)對中文的理解

機器學(xué)習(xí)基礎(chǔ)教程實踐(一)——中文的向量化

2019-08-27 14:19:29

機器學(xué)習(xí)小白的總結(jié)

機器學(xué)習(xí)小白第一周自我總結(jié)

2020-07-08 08:27:34

機器學(xué)習(xí)的創(chuàng)新/開發(fā)和應(yīng)用能力

機器學(xué)習(xí)的未來在工業(yè)領(lǐng)域采用機器學(xué)習(xí)機器學(xué)習(xí)和大數(shù)據(jù)工業(yè)人工智能生態(tài)系統(tǒng)

2020-12-16 07:47:35

機器學(xué)習(xí)的基礎(chǔ)內(nèi)容

文檔文章目錄系列文章目錄前言一、pandas是什么？二、使用步驟1.引入庫2.讀入數(shù)據(jù)總結(jié)前言提示：這里可以添加本文要記錄的大概內(nèi)容：例如：隨著人工智能的不斷發(fā)展，機器學(xué)習(xí)這門技術(shù)也越來越重要，很多人都開啟了學(xué)習(xí)機器學(xué)習(xí)，本文就介紹了機器學(xué)習(xí)的基礎(chǔ)內(nèi)容。提示：以下是本篇文章正文內(nèi)容，下面案例

2022-02-09 06:47:38

機器學(xué)習(xí)的基礎(chǔ)內(nèi)容

文章目錄前言一、pandas是什么？二、使用步驟1.引入庫2.讀入數(shù)據(jù)總結(jié)前言提示：這里可以添加本文要記錄的大概內(nèi)容：例如：隨著人工智能的不斷發(fā)展，機器學(xué)習(xí)這門技術(shù)也越來越重要，很多人都開啟了學(xué)習(xí)機器

2021-08-20 08:07:49

機器學(xué)習(xí)的基礎(chǔ)內(nèi)容

：隨著人工智能的不斷發(fā)展，機器學(xué)習(xí)這門技術(shù)也越來越重要，很多人都開啟了學(xué)習(xí)機器學(xué)習(xí)，本文就介紹了機器學(xué)習(xí)的基礎(chǔ)內(nèi)容。提示：以下是本篇文章正文內(nèi)容，下面案例可供參考一、hc6800-es v2.0示例：pandas 是基于NumPy 的一種工具，該工具是為了解決數(shù)據(jù)分析任務(wù)而創(chuàng)建的。二、使用步

2021-11-24 06:00:24

機器學(xué)習(xí)的基礎(chǔ)內(nèi)容介紹

2022-01-12 08:12:18

機器學(xué)習(xí)的基礎(chǔ)內(nèi)容大合集

，機器學(xué)習(xí)這門技術(shù)也越來越重要，很多人都開啟了學(xué)習(xí)機器學(xué)習(xí)，本文就介紹了機器學(xué)習(xí)的基礎(chǔ)內(nèi)容。提示：以下是本篇文章正文內(nèi)容，下面案例可供參考一、位帶操作二、使用步驟1.引入庫代碼如下（示例）：import numpy as npimport pandas as pdimport

2022-01-07 06:35:58

機器學(xué)習(xí)的基礎(chǔ)內(nèi)容匯總

人工智能的不斷發(fā)展，機器學(xué)習(xí)這門技術(shù)也越來越重要，很多人都開啟了學(xué)習(xí)機器學(xué)習(xí)，本文就介紹了機器學(xué)習(xí)的基礎(chǔ)內(nèi)容。提示：以下是本篇文章正文內(nèi)容，下面案例可供參考一、pandas是什么？示例：pandas 是基于NumPy 的一種工具，該工具是為了解決數(shù)據(jù)分析任務(wù)而創(chuàng)建的。二、使用步驟1.引入庫代碼

2022-02-28 06:12:58

機器學(xué)習(xí)的未來

機器學(xué)習(xí)的未來在工業(yè)領(lǐng)域采用機器學(xué)習(xí)機器學(xué)習(xí)和大數(shù)據(jù)

2021-01-27 06:02:18

機器學(xué)習(xí)的相關(guān)資料下載

https://www.toutiao.com/a6712245202418926083/機器學(xué)習(xí)最重要的應(yīng)用之一是嵌入式機器視覺領(lǐng)域，各類系統(tǒng)正在從視覺使能系統(tǒng)演進為視覺引導(dǎo)自動化系統(tǒng)。嵌入式視覺

2021-12-14 07:03:28

機器學(xué)習(xí)的資源分享

機器學(xué)習(xí)資源分享

2020-06-09 16:31:04

機器學(xué)習(xí)簡介與經(jīng)典機器學(xué)習(xí)算法人才培養(yǎng)

上課時間安排：2022年05月27日 — 2022年05月30日No.1 第一天一、機器學(xué)習(xí)簡介與經(jīng)典機器學(xué)習(xí)算法介紹什么是機器學(xué)習(xí)？機器學(xué)習(xí)框架與基本組成機器學(xué)習(xí)的訓(xùn)練步驟機器學(xué)習(xí)問題的分類

2022-04-28 18:56:07

機器學(xué)習(xí)算法分享

機器學(xué)習(xí)算法（1）——Logistic Regression

2020-06-09 13:30:03

機器學(xué)習(xí)算法如何用于制造無人駕駛汽車？

機器學(xué)習(xí)算法如何用于制造無人駕駛汽車

2021-03-18 06:27:18

機器人技術(shù)和機器學(xué)習(xí)

機器人技術(shù)和機器學(xué)習(xí)正成為嵌入式系統(tǒng)硬件和軟件供應(yīng)商的下一個重大事件。嵌入式系統(tǒng)可以通過網(wǎng)絡(luò)連接和物聯(lián)網(wǎng)（IoT）來傳遞信息、共享資源。無論是智能，低能耗，邊緣設(shè)備，中間網(wǎng)關(guān)還是計算節(jié)點，都需要

2021-12-20 06:03:10

機器人工程師學(xué)習(xí)計劃

如何定義機器人？機器人工程師學(xué)習(xí)計劃分享

2021-12-20 06:11:57

Labview機器學(xué)習(xí)

請問Labview機器學(xué)習(xí)工具箱里有SVM，BP等工具，如果自己用SVR做了一個回歸，可以用Labview實現(xiàn)嗎？這方面的小白，跟各位老師請教一下

2019-10-28 11:11:09

MATLAB圖像處理及機器學(xué)習(xí) 入門交流

深度學(xué)習(xí)交流大群： 372526178 （課件資料共享，加群備注楊春嬌邀請）MATLAB與機器學(xué)習(xí)大群: 626611806 （加群備注楊春嬌邀請）

2018-09-12 10:44:56

Microchip的機器學(xué)習(xí)開發(fā)工具有哪些

Microchip的機器學(xué)習(xí)開發(fā)工具

2020-11-25 07:58:55

Python機器學(xué)習(xí)入門之pandas的使用提示

2021-08-13 07:36:45

tensorflow機器學(xué)習(xí)日志

tensorflow學(xué)習(xí)日志(四)機器學(xué)習(xí)（泛化,過擬合, 數(shù)據(jù)集，驗證集，測試集）

2020-04-14 06:32:33

【下載】《機器學(xué)習(xí)》+《機器學(xué)習(xí)實戰(zhàn)》

方法（決策樹、神經(jīng)網(wǎng)絡(luò)、支持向量機、貝葉斯分類器、集成學(xué)習(xí)、聚類、降維與度量學(xué)習(xí)）；第3 部分（第11～16 章）為進階知識，內(nèi)容涉及特征選擇與稀疏學(xué)習(xí)、計算學(xué)習(xí)理論、半監(jiān)督學(xué)習(xí)、概率圖模型、規(guī)則學(xué)習(xí)以及

2017-06-01 15:49:24

【阿里云大學(xué)免費精品課】機器學(xué)習(xí)入門：概念原理及常用算法

學(xué)習(xí)與人工智能技術(shù)的強大之處。你是不是也想學(xué)機器學(xué)習(xí)了？機器學(xué)習(xí)是人工智能的一個分支。人工智能的研究是從以“推理”為重點到以“知識”為重點，再到以“學(xué)習(xí)”為重點，一條自然、清晰的脈絡(luò)。顯然，機器學(xué)習(xí)

2017-06-23 13:51:15

人工智能和機器學(xué)習(xí)技術(shù)在2021年的五個發(fā)展趨勢

人工智能和機器學(xué)習(xí)如今一直在改變著我們的世界，2020年發(fā)生的冠狀病毒疫情為這兩種技術(shù)帶來了新的機會和緊迫性，預(yù)計在2021年將會有更大的發(fā)展。疫情顯然已經(jīng)成為一種催化劑，從產(chǎn)品創(chuàng)新到消費者偏好

2021-01-27 06:10:12

人工智能和機器學(xué)習(xí)的前世今生

摘要：閱讀本文以了解更多關(guān)于人工智能、機器學(xué)習(xí)和深度學(xué)習(xí)方面的知識，以及它們對商業(yè)化意味著什么。如果正確的利用模式識別進行商業(yè)預(yù)測和決策，那么會為企業(yè)帶來巨大的利益。機器學(xué)習(xí)（ML）研究這些模式

2018-08-27 10:16:55

什么是機器學(xué)習(xí)? 機器學(xué)習(xí)基礎(chǔ)入門

本文旨在為硬件和嵌入式工程師提供機器學(xué)習(xí)(ML)的背景，它是什么，它是如何工作的，它為什么重要，以及 TinyML 是如何適應(yīng)的機器學(xué)習(xí)是一個始終存在并經(jīng)常被誤解的技術(shù)概念。數(shù)十年來，使用復(fù)雜

2022-06-21 11:06:37

什么是TinyML？微型機器學(xué)習(xí)

了解一個叫做微型機器學(xué)習(xí)(Tiny Machine Learning，TinyML)的機器學(xué)習(xí)分部，它是什么，它的應(yīng)用，硬件和軟件需求，以及它的好處。機器學(xué)習(xí)(ML)是計算機科學(xué)中一個動態(tài)而強大

2022-04-12 10:20:35

介紹機器學(xué)習(xí)的基礎(chǔ)內(nèi)容

參考右邊的幫助文檔文章目錄嵌入式系統(tǒng)之硬件總復(fù)習(xí)前言一、pandas是什么？二、使用步驟1.引入庫2.讀入數(shù)據(jù)總結(jié)前言提示：這里可以添加本文要記錄的大概內(nèi)容：例如：隨著人工智能的不斷發(fā)展，機器學(xué)習(xí)這門技術(shù)也越來越重要，很多人都開啟了學(xué)習(xí)機器學(xué)習(xí)，本文就介紹了機器學(xué)習(xí)的基礎(chǔ)內(nèi)容。提示：以下是本篇文

2021-12-16 06:27:44

介紹機器學(xué)習(xí)的基礎(chǔ)內(nèi)容

2021-08-13 07:39:46

關(guān)于機器學(xué)習(xí)的日志

機器學(xué)習(xí)日志

2020-07-08 12:54:25

決策樹在機器學(xué)習(xí)的理論學(xué)習(xí)與實踐

決策樹在機器學(xué)習(xí)的理論學(xué)習(xí)與實踐

2019-09-20 12:48:44

分析一個不錯的機器學(xué)習(xí)項目簡歷收集冊

分析一個不錯的機器學(xué)習(xí)項目簡歷收集冊

2021-09-26 06:03:10

可解釋的機器學(xué)習(xí)——打開機器學(xué)習(xí)黑匣子

【資源下載】《可解釋的機器學(xué)習(xí)》，打開機器學(xué)習(xí)黑匣子

2020-05-20 14:16:57

基于機器學(xué)習(xí)理論之圖像辨識技術(shù)應(yīng)用 – 傳統(tǒng)水表附加遠(yuǎn)程抄表功能

。下圖為智能數(shù)字辨識水表的架構(gòu)示意圖，新唐科技除了提供M48xxGCAE系列開發(fā)平臺外，還提供了基于機器學(xué)習(xí)理論的數(shù)字辨識技術(shù)范例代碼，可降低開發(fā)難度與節(jié)省客戶大量的開發(fā)時間。若您想對新唐M480

2022-03-01 14:21:29

基于流形學(xué)習(xí)的毫米波探測器目標(biāo)識別方法研究【個人收藏】

流形學(xué)習(xí)是一種機器學(xué)習(xí)理論，旨在發(fā)現(xiàn)高維數(shù)據(jù)分布的內(nèi)在規(guī) 律，并從中恢復(fù)低維流形結(jié)構(gòu) ，實現(xiàn)維數(shù)約簡。本文將流形學(xué)習(xí)方法應(yīng)用于毫米波探測器目標(biāo)識別，并對現(xiàn)有流形學(xué)習(xí)算法進行了改進和推廣。

2021-12-20 15:43:44

基于深度學(xué)習(xí)技術(shù)的智能機器人

——工業(yè)機器人的智能化程度要求也越來越高，采用深度學(xué)習(xí)技術(shù)為工業(yè)機器人賦能是目前各大廠商的統(tǒng)一認(rèn)知。本文結(jié)合實際案例，簡要說明一下智能機器人的實現(xiàn)流程。一、智能機器人概念人工智能技術(shù)，其主要作用就是用

2018-05-31 09:36:03

如何學(xué)習(xí)機器學(xué)習(xí)

【吳恩達(dá)機器學(xué)習(xí)】學(xué)習(xí)筆記13（Normal Equation& 與梯度下降比較）

2020-04-26 11:05:59

如何實現(xiàn)機器人的自我學(xué)習(xí)？

不等式得到這樣的推論：訓(xùn)練樣本足夠大時，訓(xùn)練數(shù)據(jù)上的結(jié)果與全部數(shù)據(jù)上的結(jié)果會足夠接近。這就是機器學(xué)習(xí)為什么能“舉一反三”的理論基礎(chǔ)。[hide]訓(xùn)練樣本足夠大時，訓(xùn)練數(shù)據(jù)上的結(jié)果與全部數(shù)據(jù)上的結(jié)果會足夠

2016-03-04 10:34:38

如何用卷積神經(jīng)網(wǎng)絡(luò)方法去解決機器監(jiān)督學(xué)習(xí)下面的分類問題？

人工智能下面有哪些機器學(xué)習(xí)分支？如何用卷積神經(jīng)網(wǎng)絡(luò)（CNN）方法去解決機器學(xué)習(xí)監(jiān)督學(xué)習(xí)下面的分類問題？

2021-06-16 08:09:03

如果只是應(yīng)用機器學(xué)習(xí)，而不是研究，需要哪些知識

如果只是應(yīng)用機器學(xué)習(xí)，而不是研究，需要哪些知識？還用深入學(xué)習(xí)數(shù)字么

2019-08-30 14:51:02

微型機器學(xué)習(xí)

人工智能 AI 正在加快速度從云端走向邊緣，進入到越來越小的物聯(lián)網(wǎng)設(shè)備中。而這些物聯(lián)網(wǎng)設(shè)備往往體積很小，面臨著許多挑戰(zhàn)，例如功耗、延時以及精度等問題，傳統(tǒng)的機器學(xué)習(xí)模型無法滿足要求，那么微型機器學(xué)習(xí)又如何呢？

2021-09-15 09:23:12

最值得學(xué)習(xí)的機器學(xué)習(xí)編程語言

選擇最能滿足個人需求，以及保證自己將來能夠在 AI 和機器學(xué)習(xí)領(lǐng)域順利發(fā)展的編程語言。在本文中，我們將介紹最值得學(xué)習(xí)的 5 種編程語言，這些語言不僅能夠為機器學(xué)習(xí)征服世界鋪平道路，而且也能夠幫助你處理好日常工作。下面，我們來看看為了在 AI 和機器學(xué)習(xí)領(lǐng)域站穩(wěn)腳跟，你需要學(xué)習(xí)的五種語言。

2021-03-02 06:22:38

物聯(lián)網(wǎng)防火墻與機器學(xué)習(xí)技術(shù)解析

物聯(lián)網(wǎng)防火墻與機器學(xué)習(xí)技術(shù)

2021-02-25 06:05:58

軟體機器人學(xué)習(xí)問題探討

，學(xué)習(xí)并探討軟體機器人結(jié)構(gòu)設(shè)計、柔性制造、運動控制、裝配和調(diào)試等內(nèi)容，使學(xué)員熟練應(yīng)用控制工程理論、自動化、材料力學(xué)、機械原理、機械設(shè)計、3D打印等基礎(chǔ)知識，培養(yǎng)和提高學(xué)員對軟體機器人目標(biāo)分析、模型建立、設(shè)計制作和實驗測試的能力；

2019-08-12 15:09:17

部署基于嵌入的機器學(xué)習(xí)模型

1、如何在生產(chǎn)中部署基于嵌入的機器學(xué)習(xí)模型　　由于最近大量的研究，機器學(xué)習(xí)模型的性能在過去幾年里有了顯著的提高。雖然這些改進的模型開辟了新的可能性，但是它們只有在可以部署到生產(chǎn)應(yīng)用中時才開始提供真正

2022-11-02 15:09:52

基于建構(gòu)主義學(xué)習(xí)理論的藏文音素拼讀法MCAI設(shè)計

建構(gòu)主義是符合人類認(rèn)知規(guī)律的一種學(xué)習(xí)理論,而MCAI是廣泛使用且行之有效的教學(xué)輔助工具。文章介紹基于建構(gòu)主義學(xué)習(xí)理論的藏文音素拼讀法多媒體教學(xué)軟件的設(shè)計。

2010-03-01 15:08:32

計算學(xué)習(xí)理論(1)#機器學(xué)習(xí)

機器學(xué)習(xí)

未來加油dz發(fā)布于 2023-07-14 17:02:21

計算學(xué)習(xí)理論(2)#機器學(xué)習(xí)

機器學(xué)習(xí)

未來加油dz發(fā)布于 2023-07-14 17:03:16

Spark機器學(xué)習(xí)庫的各種機器學(xué)習(xí)算法

本文將簡要介紹Spark機器學(xué)習(xí)庫（Spark MLlibs APIs）的各種機器學(xué)習(xí)算法，主要包括：統(tǒng)計算法、分類算法、聚類算法和協(xié)同過濾算法，以及各種算法的應(yīng)用。你不是一個數(shù)據(jù)科學(xué)家。根據(jù)

2017-09-28 16:44:43

機器學(xué)習(xí)理論基礎(chǔ)介紹

成為一名合格的開發(fā)工程師不是一件簡單的事情，需要掌握從開發(fā)到調(diào)試到優(yōu)化等一系列能力，這些能力中的每一項掌握起來都需要足夠的努力和經(jīng)驗。而要成為一名合格的機器學(xué)習(xí)算法工程師（以下簡稱算法工程師）更是

2017-12-12 11:27:55

3612

面向認(rèn)知的多源數(shù)據(jù)學(xué)習(xí)理論和算法研究進展

多源數(shù)據(jù)學(xué)習(xí)在大數(shù)據(jù)時代具有極其重要的意義，目前，多源數(shù)據(jù)學(xué)習(xí)算法研究遠(yuǎn)遠(yuǎn)超前于多源數(shù)據(jù)學(xué)習(xí)理論研究，經(jīng)典的機器學(xué)習(xí)理論難以應(yīng)用于多源數(shù)據(jù)學(xué)習(xí)。更難以提供多源數(shù)據(jù)學(xué)習(xí)算法在實際應(yīng)用中的理論保障

2017-12-26 16:10:41

2018年IoT領(lǐng)域即將爆發(fā)的兩大應(yīng)用：區(qū)塊鏈及機器學(xué)習(xí)

機器學(xué)習(xí)是人工智能（AI）的一個分支。人工智能的研究是從「推理」到「知識」，再到以「學(xué)習(xí)」為重點，有一條自然、清晰的脈絡(luò)可循。機器學(xué)習(xí)則是實現(xiàn)人工智能的一個途徑，即以機器學(xué)習(xí)為手段解決人工智能中的問題。

2018-01-02 08:39:24

2649

什么是機器學(xué)習(xí)？機器學(xué)習(xí)能解決什么問題？（案例分析）

隨著大數(shù)據(jù)時代的到來，機器學(xué)習(xí)成為解決問題的一種重要且關(guān)鍵的工具。不管是工業(yè)界還是學(xué)術(shù)界，機器學(xué)習(xí)都是一個炙手可熱的方向，但是學(xué)術(shù)界和工業(yè)界對機器學(xué)習(xí)的研究各有側(cè)重，學(xué)術(shù)界側(cè)重于對機器學(xué)習(xí)理論

2018-05-18 13:13:00

15976

如何開始接觸機器學(xué)習(xí)_機器學(xué)習(xí)入門方法盤點

機器學(xué)習(xí)入門方法一說到機器學(xué)習(xí)，我被問得最多的問題是：給那些開始學(xué)習(xí)機器學(xué)習(xí)的人的最好的建議是什么？

2018-05-20 07:10:00

3755

機器學(xué)習(xí)心得總結(jié)

接觸機器學(xué)習(xí)有一年了，是從上張敏老師的課開始的。后來師兄推薦了一本《統(tǒng)計學(xué)習(xí)理論的本質(zhì)》，還記得第一印象覺得“統(tǒng)計”二字很奇怪。之后就漸漸習(xí)以為常了，接觸到的機器學(xué)習(xí)方法都是基于統(tǒng)計的，以至于統(tǒng)計學(xué)習(xí)與機器學(xué)習(xí)成了一個概念，以至于最近看了一些東西突然覺得自己長見識了。

2018-07-07 09:40:00

12720

機器學(xué)習(xí)的100天作戰(zhàn)計劃與教程

其實機器學(xué)習(xí)涵蓋的知識面非常多，而且不僅要學(xué)習(xí)理論還有實踐同樣不能忽視。如果基礎(chǔ)薄弱，學(xué)習(xí)起來肯定是會遇到很多困難的，但就一定不行嗎？如何在基礎(chǔ)薄弱的條件下進行有效的學(xué)習(xí)是很多人都非常關(guān)心的。至此

2018-08-03 09:50:30

4199

機器學(xué)習(xí)入門資料之機器學(xué)習(xí)的詳細(xì)資料介紹

機器學(xué)習(xí)是計算機科學(xué)的一個子領(lǐng)域，根據(jù)Arthur Samuel在1959年提出的，它賦予“計算機在不被明確地編程的情況下學(xué)習(xí)的能力。”1_是人工智能中模式識別和計算學(xué)習(xí)理論研究的進展，2_機器學(xué)習(xí)

2018-11-15 15:35:39

機器學(xué)習(xí)中應(yīng)用數(shù)學(xué)應(yīng)該要注意的幾點注記

只是一般機器學(xué)習(xí)中使用的數(shù)學(xué)的一小部分（例如，機器學(xué)習(xí)理論的處理將包括基本泛化誤差邊界的數(shù)學(xué)）下游經(jīng)常使用EST。我包括兩種作業(yè)，‘練習(xí)’和‘謎題’。練習(xí)開始時很容易，反之亦然；這些謎題是帶有一點馬基雅維利惡作

2018-11-16 16:17:37

精選10本機器學(xué)習(xí)暢銷書,玩轉(zhuǎn)機器學(xué)習(xí)

人工智能和大數(shù)據(jù)時代，分布式機器學(xué)習(xí)解決了大量最具挑戰(zhàn)性的問題，《分布式機器學(xué)習(xí)：算法、理論與實踐》全面分析了分布式機器學(xué)習(xí)的現(xiàn)狀，深入分析其中核心問題，討論該領(lǐng)域的未來發(fā)展方向。

2018-12-10 09:36:38

4246

機器學(xué)習(xí)在嵌入式系統(tǒng)中的應(yīng)用

機器學(xué)習(xí)已從一個有趣的研究課題迅速發(fā)展成為廣泛應(yīng)用的有效解決方案。它顯而易見的有效性迅速吸引了人工智能理論學(xué)者群體之外的開發(fā)者社區(qū)的興趣。在某些方面，機器學(xué)習(xí)開發(fā)能力已經(jīng)擴展到其它基于強大理論基礎(chǔ)的技術(shù)應(yīng)用層面。

2019-04-05 09:32:00

4640

自動化機器學(xué)習(xí)是什么情況

機器學(xué)習(xí)發(fā)展中遇到的問題，一個核心因素是人，而機器學(xué)習(xí)的工作又有大量的人工干預(yù)，如特征提取、模型選擇、參數(shù)調(diào)節(jié)等機器學(xué)習(xí)的各個方面。

2019-11-04 16:35:08

1245

機器學(xué)習(xí)該怎么學(xué)習(xí)

網(wǎng)上關(guān)于機器學(xué)習(xí)的文章，視頻不計其數(shù)，本來寫這么一篇東西，我自己也覺得有點多余，但是我還真沒找到一個能幫助像我這樣零基礎(chǔ)的人，快速接觸和上手機器學(xué)習(xí)的文章。這篇文章不能讓你深入學(xué)習(xí)和掌握機器學(xué)習(xí)

2020-05-12 08:54:38

811

目前機器學(xué)習(xí)面臨的常見問題和挑戰(zhàn)

由于我們的主要任務(wù)是選擇一種學(xué)習(xí)算法，并對某些數(shù)據(jù)進行訓(xùn)練，所以最可能出現(xiàn)的兩個問題不外乎是“壞算法”和“壞數(shù)據(jù)”，本文主要從壞數(shù)據(jù)出發(fā)，帶大家了解目前機器學(xué)習(xí)面臨的常見問題和挑戰(zhàn)，從而更好地學(xué)習(xí)機器學(xué)習(xí)理論。

2020-10-23 11:42:49

14230

機器學(xué)習(xí)的范圍和算法

什么是機器學(xué)習(xí)？機器學(xué)習(xí)是英文名稱MachineLearning（簡稱ML）的直譯。機器學(xué)習(xí)涉及概率論、統(tǒng)計學(xué)、逼近論、凸分析、算法復(fù)雜度理論等多門學(xué)科。

2020-11-12 10:19:12

1203

機器學(xué)習(xí)的范圍/算法/分類

2021-01-21 09:29:06

3315

機器學(xué)習(xí)和深度學(xué)習(xí)有什么區(qū)別？

深度學(xué)習(xí)算法現(xiàn)在是圖像處理軟件庫的組成部分。在他們的幫助下，可以學(xué)習(xí)和訓(xùn)練復(fù)雜的功能;但他們的應(yīng)用也不是萬能的。 “機器學(xué)習(xí)”和“深度學(xué)習(xí)”有什么區(qū)別？在機器視覺和深度學(xué)習(xí)中，人類視覺的力量和對視

2021-03-12 16:11:00

7762

基于機器學(xué)習(xí)的哈希檢索算法綜述

基于機器學(xué)習(xí)的哈希檢索算法綜述

2021-06-10 11:05:56

機器學(xué)習(xí)在故障檢測與診斷領(lǐng)域中的應(yīng)用綜述

機器學(xué)習(xí)在故障檢測與診斷領(lǐng)域中的應(yīng)用綜述

2021-06-24 11:12:16

基于DNN與規(guī)則學(xué)習(xí)的機器翻譯算法綜述

基于DNN與規(guī)則學(xué)習(xí)的機器翻譯算法綜述

2021-06-29 15:44:06

機器學(xué)習(xí)在衛(wèi)星遙測分析建模中的應(yīng)用綜述

機器學(xué)習(xí)在衛(wèi)星遙測分析建模中的應(yīng)用綜述

2021-06-29 16:40:48

自動機器學(xué)習(xí)的優(yōu)點與痛點

自動機器學(xué)習(xí)綜述自從計算機時代開始，科學(xué)家和工程師們就一直想知道如何像人類一樣，給計算機注入學(xué)習(xí)的能力。艾倫·圖靈是第一批提出智能理論的科學(xué)家之一，該理論設(shè)想有一天計算機能夠達(dá)到與人類同等的智能

2021-09-01 14:29:50

4091

水聲被動定位中的機器學(xué)習(xí)方法研究進展綜述

向量機、隨機森林及以卷積網(wǎng)絡(luò)層和全連接層為主要組成單元的深度神經(jīng)網(wǎng)絡(luò)。本文通過重點引述近幾年發(fā)表在國際期刊和會議上的相關(guān)前沿研究工作,詳細(xì)論述了將機器學(xué)習(xí)方法應(yīng)用于水聲被動定位的關(guān)鍵理論基礎(chǔ)、單水聽器和陣列前端信號

2021-12-24 11:18:27

467

機器學(xué)習(xí)是什么，機器學(xué)習(xí)的定義

機器學(xué)習(xí)是一門能夠讓編程計算機從數(shù)據(jù)中學(xué)習(xí)的計算機科學(xué)（和藝術(shù)）。

2022-02-03 09:18:00

7631

基于機器學(xué)習(xí)的效用和理論理解

機器學(xué)習(xí)領(lǐng)域近年的發(fā)展非常迅速，然而我們對機器學(xué)習(xí)理論的理解還很有限，有些模型的實驗效果甚至超出了我們對基礎(chǔ)理論的理解。

2022-03-24 13:50:14

2083

機器學(xué)習(xí)找一個好用的函數(shù)的原因是什么

（1）機器學(xué)習(xí)中經(jīng)典的“支持向量機（SVM）”的主要提出者弗拉基米爾·萬普尼克（Vladimir Vapnik），在其著作《統(tǒng)計學(xué)習(xí)理論的本質(zhì)》中這樣定義機器學(xué)習(xí)“機器學(xué)習(xí)就是一個基于經(jīng)驗數(shù)據(jù)的函數(shù)估計問題”。

2022-11-02 16:15:41

492

機器學(xué)習(xí)技術(shù)的理論背景

近年來，所謂的深度學(xué)習(xí)范式徹底改變了機器學(xué)習(xí)領(lǐng)域。深度學(xué)習(xí)通過解決以前傳統(tǒng)模式識別方法無法解決的挑戰(zhàn)，對機器學(xué)習(xí)社區(qū)產(chǎn)生了巨大影響（LeCun et al. 2015）。深度學(xué)習(xí)的引入極大地提高了

2022-12-02 14:53:35

1005

基于機器學(xué)習(xí)的效用和理論理解機器學(xué)習(xí)幾大領(lǐng)域未來進展預(yù)測

機器學(xué)習(xí)領(lǐng)域中，有些模型非常有效，但我們并不能完全確定其原因。相反，一些相對容易理解的研究領(lǐng)域則在實踐中適用性有限。本文基于機器學(xué)習(xí)的效用和理論理解，探討各個子領(lǐng)域的進展。

2023-01-06 09:59:40

347

AI是干什么的？機器學(xué)習(xí)的基礎(chǔ)流程和理論基礎(chǔ)

機器學(xué)習(xí)的“訓(xùn)練”部分就是找到f( )，即成本函數(shù)按照梯度下降的方法找到最優(yōu)的f( )。大家理解了找f()，才能進入各種算法討論。

2023-02-01 10:46:46

664

機器學(xué)習(xí)理論：k近鄰算法

KNN(k-Nearest Neighbors)思想簡單，應(yīng)用的數(shù)學(xué)知識幾乎為0，所以作為機器學(xué)習(xí)的入門非常實用、可以解釋機器學(xué)習(xí)算法使用過程中的很多細(xì)節(jié)問題。能夠更加完整地刻畫機器學(xué)習(xí)應(yīng)用的流程。

2023-06-06 11:15:02

392

基于機器學(xué)習(xí)理論之圖像辨識技術(shù)應(yīng)用-傳統(tǒng)水表附加遠(yuǎn)程抄表功能

基于機器學(xué)習(xí)理論之圖像辨識技術(shù)應(yīng)用-傳統(tǒng)水表附加遠(yuǎn)程抄表功能

2023-08-10 11:19:07

293

機器學(xué)習(xí)和深度學(xué)習(xí)的區(qū)別

機器學(xué)習(xí)和深度學(xué)習(xí)的區(qū)別隨著人工智能技術(shù)的不斷發(fā)展，機器學(xué)習(xí)和深度學(xué)習(xí)已經(jīng)成為大家熟知的兩個術(shù)語。雖然它們都屬于人工智能技術(shù)的研究領(lǐng)域，但它們之間有很大的差異。本文將詳細(xì)介紹機器學(xué)習(xí)和深度學(xué)習(xí)

2023-08-17 16:11:40

2726

機器學(xué)習(xí)算法匯總機器學(xué)習(xí)算法分類機器學(xué)習(xí)算法模型

機器學(xué)習(xí)算法匯總機器學(xué)習(xí)算法分類機器學(xué)習(xí)算法模型機器學(xué)習(xí)是人工智能的分支之一，它通過分析和識別數(shù)據(jù)模式，學(xué)習(xí)從中提取規(guī)律，并用于未來的決策和預(yù)測。在機器學(xué)習(xí)中，算法是最基本的組成部分之一。算法

2023-08-17 16:11:48

632

機器學(xué)習(xí)算法總結(jié) 機器學(xué)習(xí)算法是什么機器學(xué)習(xí)算法優(yōu)缺點

機器學(xué)習(xí)算法總結(jié) 機器學(xué)習(xí)算法是什么?機器學(xué)習(xí)算法優(yōu)缺點? 機器學(xué)習(xí)算法總結(jié) 機器學(xué)習(xí)算法是一種能夠從數(shù)據(jù)中自動學(xué)習(xí)的算法。它能夠從訓(xùn)練數(shù)據(jù)中學(xué)習(xí)特征，進而對未知數(shù)據(jù)進行分類、回歸、聚類等任務(wù)。通過

2023-08-17 16:11:50

938

機器學(xué)習(xí)算法入門機器學(xué)習(xí)算法介紹機器學(xué)習(xí)算法對比

機器學(xué)習(xí)算法入門機器學(xué)習(xí)算法介紹機器學(xué)習(xí)算法對比機器學(xué)習(xí)算法入門、介紹和對比隨著機器學(xué)習(xí)的普及，越來越多的人想要了解和學(xué)習(xí)機器學(xué)習(xí)算法。在這篇文章中，我們將會簡單介紹機器學(xué)習(xí)算法的基本概念

2023-08-17 16:27:15

569

機器學(xué)習(xí)是什么意思？機器學(xué)習(xí)屬于什么分支？機器學(xué)習(xí)有什么用處？

機器學(xué)習(xí)是什么意思？機器學(xué)習(xí)屬于什么分支？機器學(xué)習(xí)是什么有什么用處？機器學(xué)習(xí)是指讓計算機通過經(jīng)驗來不斷優(yōu)化和改進自身的算法和模型的過程。因此，機器學(xué)習(xí)可以被理解為是一種從數(shù)據(jù)中自動獲取規(guī)律和知識

2023-08-17 16:30:04

1145

機器學(xué)習(xí)theta是什么？機器學(xué)習(xí)tpe是什么？

機器學(xué)習(xí)theta是什么？機器學(xué)習(xí)tpe是什么？機器學(xué)習(xí)是近年來蓬勃發(fā)展的一個領(lǐng)域，其相關(guān)技術(shù)和理論受到了廣泛的關(guān)注和應(yīng)用。在機器學(xué)習(xí)中，theta和tpe是兩個非常重要的概念。首先，我們來了

2023-08-17 16:30:08

1017

機器學(xué)習(xí)有哪些算法？機器學(xué)習(xí)分類算法有哪些？機器學(xué)習(xí)預(yù)判有哪些算法？

機器學(xué)習(xí)有哪些算法？機器學(xué)習(xí)分類算法有哪些？機器學(xué)習(xí)預(yù)判有哪些算法？機器學(xué)習(xí)是一種人工智能技術(shù)，通過對數(shù)據(jù)的分析和學(xué)習(xí)，為計算機提供智能決策。機器學(xué)習(xí)算法是實現(xiàn)機器學(xué)習(xí)的基礎(chǔ)。常見的機器學(xué)習(xí)算法

2023-08-17 16:30:11

1244

機器學(xué)習(xí)發(fā)展歷程

機器學(xué)習(xí)發(fā)展歷程：機器學(xué)習(xí)發(fā)展現(xiàn)狀、機器學(xué)習(xí)發(fā)展前景和機器學(xué)習(xí)發(fā)展歷史隨著科技的快速發(fā)展，全球各個行業(yè)都在加速數(shù)字化轉(zhuǎn)型，從而加速了人工智能和機器學(xué)習(xí)的發(fā)展。機器學(xué)習(xí)已經(jīng)成為許多公司和組織實現(xiàn)商業(yè)

2023-08-17 16:30:15

1038

機器學(xué)習(xí)的研究現(xiàn)狀和發(fā)展趨勢機器學(xué)習(xí)的常見算法和優(yōu)缺點

隨著計算能力和大數(shù)據(jù)的崛起，機器學(xué)習(xí)算法正迎來快速發(fā)展的時期。在研究層面上，機器學(xué)習(xí)和深度學(xué)習(xí)是當(dāng)前最主要的熱點。在計算能力的推動下，機器學(xué)習(xí)算法取得了許多重大突破，如AlphaGo戰(zhàn)勝人類棋手

2023-08-22 17:49:27

1657

已全部加載完成