一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機(jī)器學(xué)習(xí)找一個好用的函數(shù)的原因是什么

wFVr_Hardware_1 ? 來源:硬件十萬個為什么 ? 作者:硬件十萬個為什么 ? 2022-11-02 16:15 ? 次閱讀

1、機(jī)器學(xué)習(xí)定義

我們一起看看AI界的大牛對機(jī)器學(xué)習(xí)的定義

(1)機(jī)器學(xué)習(xí)中經(jīng)典的“支持向量機(jī)(SVM)”的主要提出者弗拉基米爾·萬普尼克(Vladimir Vapnik),在其著作《統(tǒng)計學(xué)習(xí)理論的本質(zhì)》中這樣定義機(jī)器學(xué)習(xí)“機(jī)器學(xué)習(xí)就是一個基于經(jīng)驗數(shù)據(jù)的函數(shù)估計問題”。

(2)卡耐基梅隆大學(xué)的機(jī)器學(xué)習(xí)和人工智能領(lǐng)域知名教授湯姆·米切爾(Tom Mitchell),在他經(jīng)典教材《機(jī)器學(xué)習(xí)》中很抽象的定義了機(jī)器學(xué)習(xí):對于某類任務(wù)(Task,簡稱T)和某項性能評價準(zhǔn)則(Performance,簡稱P),如果一個計算機(jī)程序在T上以P作為性能度量,隨著經(jīng)驗(Experience,簡稱E)的積累,不斷自我完善,那么我們稱這個計算機(jī)程序從經(jīng)驗E中進(jìn)行了學(xué)習(xí)。比如學(xué)習(xí)圍棋的程序AlphaGo,它可以通過和自己下棋獲取經(jīng)驗,那么它的任務(wù)T就是“參與圍棋對弈”,它的性能P就是用“贏得比賽的百分比”來度量的。米切爾教授認(rèn)為,在機(jī)器學(xué)習(xí)中我們需要明確三個特征:任務(wù)的類型、衡量任務(wù)性能提升的標(biāo)準(zhǔn)以及獲取經(jīng)驗的來源。

(3)南京大學(xué)的機(jī)器學(xué)習(xí)專家周志華在經(jīng)典教材《機(jī)器學(xué)習(xí)》中這樣定義:機(jī)器學(xué)習(xí)致力于研究如何通過計算的手段,利用經(jīng)驗來改善系統(tǒng)自身的性能,而在計算機(jī)系統(tǒng)中,“經(jīng)驗”通常以“數(shù)據(jù)”形式存在,因此機(jī)器學(xué)習(xí)研究的主要內(nèi)容是關(guān)于在計算機(jī)上從數(shù)據(jù)中產(chǎn)生“模型”(model)的算法,即“學(xué)習(xí)算法”。有了學(xué)習(xí)算法,我們把經(jīng)驗數(shù)據(jù)提供給它,它就能基于這些數(shù)據(jù)產(chǎn)生模型,而在面對新的情況時,模型會給我們提供相應(yīng)的判斷。比如我們在買瓜的時候看到一個沒剖開的西瓜,我們可以利用經(jīng)驗對這個瓜的好壞進(jìn)行判斷。

結(jié)合這些行業(yè)大牛的定義,我們可以這樣理解機(jī)器學(xué)習(xí),“從數(shù)據(jù)中學(xué)習(xí),形成有效經(jīng)驗,提升執(zhí)行任務(wù)/工作的表現(xiàn)”,而我們對于機(jī)器學(xué)習(xí)的研究就是一個不斷找尋更有效算法的過程。對于計算機(jī)系統(tǒng)而言,所有的“經(jīng)驗”都是以數(shù)據(jù)的形式存在的,而數(shù)據(jù)作為學(xué)習(xí)的對象類型是多樣的,可以是數(shù)字、文字、圖像、音頻、視頻,也可以是它們的各種組合。經(jīng)典機(jī)器學(xué)習(xí)中還要依賴人類的先驗知識,把原始數(shù)據(jù)預(yù)處理成各種特征,然后對特征進(jìn)行分類。而這種分類的效果,高度取決于特征選取的好壞,因此傳統(tǒng)的機(jī)器學(xué)習(xí)專家們,把大部分時間都花在如何尋找更加合適的特征上。我們進(jìn)入在“數(shù)據(jù)泛濫,信息超量”的大數(shù)據(jù)時代后,能自動從大數(shù)據(jù)中獲取知識的機(jī)器學(xué)習(xí)一定會扮演重要角色。

2、機(jī)器學(xué)習(xí)的主要形式

機(jī)器學(xué)習(xí)的主要形式有監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)及強(qiáng)化學(xué)習(xí),我們再來回顧一下每一種形式的特點

(1)有監(jiān)督學(xué)習(xí):有監(jiān)督學(xué)習(xí)使用有標(biāo)簽的訓(xùn)練數(shù)據(jù),“監(jiān)督”可以理解為已經(jīng)知道訓(xùn)練樣本(輸入數(shù)據(jù))中期待的輸出信號(標(biāo)簽)。監(jiān)督學(xué)習(xí)過程是,先為機(jī)器學(xué)習(xí)算法提供打過標(biāo)簽的訓(xùn)練數(shù)據(jù)以擬合預(yù)測模型,然后用該模型對未打過標(biāo)簽的新數(shù)據(jù)進(jìn)行預(yù)測。以垃圾郵件過濾為例,可以采用監(jiān)督機(jī)器學(xué)習(xí)算法在打過標(biāo)簽的(正確標(biāo)識垃圾與非垃圾)電子郵件的語料庫上訓(xùn)練模型,然后用該模型來預(yù)測新郵件是否屬于垃圾郵件。當(dāng)前火熱的神經(jīng)網(wǎng)絡(luò)就屬于有監(jiān)督學(xué)習(xí)。

(2)無監(jiān)督學(xué)習(xí):無監(jiān)督學(xué)習(xí)的使用未標(biāo)記過的訓(xùn)練數(shù)據(jù),“無監(jiān)督”就不知道輸入對應(yīng)的輸出結(jié)果了,無監(jiān)督學(xué)習(xí)讓算法自身發(fā)現(xiàn)數(shù)據(jù)的模型和規(guī)律。比如“聚類”,利用距離的親疏遠(yuǎn)近來衡量不同類型。還有“異常檢測”,判斷某些點不合群。“異常檢測”也是“聚類”的反向應(yīng)用。

(3)半監(jiān)督學(xué)習(xí):則采用“中庸之道”,利用聚類技術(shù)擴(kuò)大已知標(biāo)簽范圍,也就是說,訓(xùn)練中使用的數(shù)據(jù)只有一小部分是標(biāo)記過的,而大部分是沒有標(biāo)記的,然后逐漸擴(kuò)大標(biāo)記數(shù)據(jù)的范圍。

(4)強(qiáng)化學(xué)習(xí):強(qiáng)化學(xué)習(xí)也使用未標(biāo)記的數(shù)據(jù),它可以通過某種方法(獎懲函數(shù))知道你是離正確答案越來越近,還是越來越遠(yuǎn)。強(qiáng)化學(xué)習(xí)的目標(biāo)是開發(fā)一個系統(tǒng),通過與環(huán)境的交互來提高其性能,我們也可以把強(qiáng)化學(xué)習(xí)看作一個與監(jiān)督學(xué)習(xí)相關(guān)的領(lǐng)域,然而強(qiáng)化學(xué)習(xí)的反饋并非標(biāo)定過的正確標(biāo)簽或數(shù)值,而是獎勵函數(shù)對行動度量的結(jié)果。強(qiáng)化學(xué)習(xí)的常見示例是國際象棋,系統(tǒng)根據(jù)棋盤的狀態(tài)或環(huán)境來決定一系列的行動,獎勵定義為比賽的輸或贏。

3、機(jī)器學(xué)習(xí)系統(tǒng)的路線圖

9a0f4dc6-4c89-11ed-a3b6-dac502259ad0.png

(1)預(yù)處理:我們能夠獲得的原始數(shù)據(jù)很少以理想形式出現(xiàn),無法滿足學(xué)習(xí)算法的最佳性能,因此數(shù)據(jù)的預(yù)處理是所有機(jī)器學(xué)習(xí)應(yīng)用中最關(guān)鍵的步驟。為了獲得模型的最佳性能,許多機(jī)器學(xué)習(xí)算法要求所選特征的測量結(jié)果單位相同,通常通過把特征數(shù)據(jù)變換到[0,1]的取值范圍,或者均值為0、方差為1的標(biāo)準(zhǔn)正態(tài)分布來實現(xiàn)。由于某些選定的特征相互之間可能高度相關(guān),因此在某種程度上呈現(xiàn)冗余的現(xiàn)象。在這種情況下,可以通過降維技術(shù)將特征壓縮到低維子空間,減少存儲空間,提高算法的運行速度。預(yù)處理中為了確定機(jī)器學(xué)習(xí)算法不僅在訓(xùn)練數(shù)據(jù)集上表現(xiàn)良好,而且對新數(shù)據(jù)也有很好的適應(yīng)性,我們將數(shù)據(jù)集隨機(jī)分成單獨的訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集。用訓(xùn)練數(shù)據(jù)集來訓(xùn)練和優(yōu)化機(jī)器學(xué)習(xí)模型,同時把測試數(shù)據(jù)集保留到最后以評估最終的模型。

(2)訓(xùn)練和選擇預(yù)測模型:為了完成各種不同的任務(wù),目前開發(fā)了許多不同的機(jī)器學(xué)習(xí)算法,但沒有哪個分類算法是完美的。例如,每個分類算法都存在著固有的偏置,如果不對分類任務(wù)做任何假設(shè),沒有哪個分類模型會占上風(fēng)。因此,在實際應(yīng)用中我們至少要比較幾種不同的算法,以便訓(xùn)練和選擇性能最好的模型。在比較不同的模型之前,我們首先要確定度量性能的指標(biāo),通常用分類準(zhǔn)確率作為度量指標(biāo),其定義為正確分類的個體占所有個體的百分比。我們不能期望軟件庫所提供的不同機(jī)器學(xué)習(xí)算法的默認(rèn)參數(shù)值對特定問題最優(yōu),因此使用超參數(shù)調(diào)優(yōu)技術(shù)來調(diào)優(yōu)模型的性能就特別重要,我們可以這樣理解超參數(shù),這不是從數(shù)據(jù)中學(xué)習(xí)的參數(shù),而是模型的調(diào)節(jié)旋鈕,可以來回旋轉(zhuǎn)調(diào)整模型的性能。

(3)評估模型并對未曾謀面的數(shù)據(jù)進(jìn)行預(yù)測:在訓(xùn)練數(shù)據(jù)集上擬合并選擇模型之后,我們可以用測試數(shù)據(jù)集來評估它在從來沒見過的新數(shù)據(jù)上的表現(xiàn),以評估泛化誤差。如果我們對模型的表現(xiàn)滿意,那么就可以用它來預(yù)測未來的新數(shù)據(jù)。

4、機(jī)器學(xué)習(xí)函數(shù)化

(1)機(jī)器學(xué)習(xí)就是找一個好用的函數(shù)

《未來簡史》的作者赫拉利這樣定義,人工智能實際上就是找到一種高效的“電子算法”,用以代替或在某項指標(biāo)上超越人類的“生物算法”。那么,任何一個“電子算法”都要實現(xiàn)一定的功能(Function)才有意義,這種“功能”就是我們使用的“函數(shù)”。

臺灣大學(xué)李宏毅博士的說法更通俗一些,機(jī)器學(xué)習(xí)在形式上可近似等同于在數(shù)據(jù)對象中通過統(tǒng)計或推理的方法,尋找一個有關(guān)特定輸入和預(yù)期輸出的功能函數(shù)f。

通常我們把輸入變量空間記作X,也就是特征,變量既可以是標(biāo)量(scalar),也可以是向量(vector),包括各種數(shù)據(jù)表或矩陣的列;而把輸出變量空間記作Y,也就是目標(biāo)。所謂的機(jī)器學(xué)習(xí)就是完成如下變換:Y=f (X)。

在這樣的函數(shù)中,針對語音識別功能,如果輸入一個音頻信號,就能輸出諸如“你好”或“How are you?”等這類識別信息;針對圖片識別功能,如果輸入的是一張圖片,在這個函數(shù)的加工下,就能輸出一個或貓或狗的判定;針對下棋博弈功能,如果輸入的是一個圍棋的棋譜局勢,它能輸出這盤圍棋下

一步的“最佳”走法;而對于具備智能交互功能的系統(tǒng)(比如微軟小冰),當(dāng)我們給這個函數(shù)輸入諸如“How are you?”,它就能輸出諸如“I am fine,thank you,and you?”等智能的回應(yīng)。

總結(jié)這一下,機(jī)器學(xué)習(xí)的過程和目標(biāo)就是在尋找一個“好用的”函數(shù)。

(2)如何才能尋找到一個好用的函數(shù)

“好用的”函數(shù)并不那么好找,輸入一只貓的圖像后,這個f函數(shù)并不一定就能輸出一只貓,可能它會錯誤地輸出為一條狗或一條蛇,開發(fā)者想要找到好的函數(shù)必須要走好三大步

如何找一系列的函數(shù)來實現(xiàn)預(yù)期的功能,這是建模問題。

如何找出一系列評價標(biāo)準(zhǔn)來評估函數(shù)的好壞,這是評估問題。

如何快速找到性能最佳的函數(shù),這是優(yōu)化問題。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 函數(shù)
    +關(guān)注

    關(guān)注

    3

    文章

    4365

    瀏覽量

    63872
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8481

    瀏覽量

    133866

原文標(biāo)題:機(jī)器學(xué)習(xí)為什么要找一個好用的函數(shù)?

文章出處:【微信號:Hardware_10W,微信公眾號:硬件十萬個為什么】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    ADC的諧波產(chǎn)生的原因是什么?

    ADC的諧波產(chǎn)生的原因是什么
    發(fā)表于 02-08 08:25

    傳統(tǒng)機(jī)器學(xué)習(xí)方法和應(yīng)用指導(dǎo)

    用于開發(fā)生物學(xué)數(shù)據(jù)的機(jī)器學(xué)習(xí)方法。盡管深度學(xué)習(xí)般指神經(jīng)網(wǎng)絡(luò)算法)是強(qiáng)大的工具,目前也非常
    的頭像 發(fā)表于 12-30 09:16 ?894次閱讀
    傳統(tǒng)<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>方法和應(yīng)用指導(dǎo)

    什么是機(jī)器學(xué)習(xí)?通過機(jī)器學(xué)習(xí)方法能解決哪些問題?

    計算機(jī)系統(tǒng)自身的性能”。事實上,由于“經(jīng)驗”在計算機(jī)系統(tǒng)中主要以數(shù)據(jù)的形式存在,因此機(jī)器學(xué)習(xí)需要設(shè)法對數(shù)據(jù)進(jìn)行分析學(xué)習(xí),這就使得它逐漸成為智能數(shù)據(jù)分析技術(shù)的創(chuàng)新源之
    的頭像 發(fā)表于 11-16 01:07 ?742次閱讀
    什么是<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>?通過<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>方法能解決哪些問題?

    人工智能、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)存在什么區(qū)別

    人工智能指的是在某種程度上顯示出類似人類智能的設(shè)備。AI有很多技術(shù),但其中很大的子集是機(jī)器學(xué)習(xí)——讓算法從數(shù)據(jù)中學(xué)習(xí)
    發(fā)表于 10-24 17:22 ?2677次閱讀
    人工智能、<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>和深度<b class='flag-5'>學(xué)習(xí)</b>存在什么區(qū)別

    用STM32的芯片測PWM輸入,頻率有的時候不對是什么原因造成的?

    最近用STM32的芯片測PWM輸入,發(fā)現(xiàn)頻率有的時候不對,原因是HAL_TIM_IC_CaptureCallback函數(shù)里測量的上升沿之間間隔和上升沿下降沿之間間隔,發(fā)現(xiàn)有的時候丟
    發(fā)表于 09-27 08:21

    華納云:企業(yè)遷移到云端的主要原因是什么?

    企業(yè)遷移到云端的主要原因是什么?原因不止。削減成本通常被認(rèn)為是主要原因——但盡管通過云遷移降低成本無疑是
    的頭像 發(fā)表于 09-14 17:38 ?438次閱讀

    調(diào)相信號經(jīng)過鉗位電路后產(chǎn)生了同頻信號,原因是什么?

    請教問題:調(diào)相信號經(jīng)過鉗位電路后產(chǎn)生了同頻信號,原因是什么?如何解決
    發(fā)表于 08-16 07:59

    OPA828ID發(fā)燙的原因是什么?

    你好,下面是我的DAC部分電路圖,運放用的是OPA828ID,封裝SOIC-8,±15V供電,現(xiàn)在上電就發(fā)燙,用紅外成像儀顯示能達(dá)到67℃,網(wǎng)上查詢了解到,運放發(fā)熱的主要原因是自激振蕩和負(fù)載過大(電流過大),但電路功能目前正常,且工作電流最大6m 請問此電路中運放發(fā)
    發(fā)表于 08-09 08:10

    XTR105不能正常工作的原因是什么?

    XTR105不能正常工作的原因是什么?
    發(fā)表于 08-08 08:23

    OPA820同樣的建波電路mutisim仿真與TINA輸出結(jié)果差異較大,原因是什么?

    同樣的建波電路 mutisim 仿真與TINA 輸出結(jié)果差異較大,原因是什么?如何調(diào)整電路才能讓兩軟件仿真結(jié)果致,實現(xiàn)檢波?
    發(fā)表于 08-07 07:45

    LMV321同型號生產(chǎn)工藝上晶圓差異較大的原因是什么?

    型號生產(chǎn)工藝上晶圓差異較大的原因是?
    發(fā)表于 08-07 07:02

    ESP8266與服務(wù)器通信停止的原因是什么?

    我正在使用 ESP8266 模塊,我遇到了奇怪的問題,當(dāng)我通過 Android 平板電腦與設(shè)備通信時,我有連接,也可以進(jìn)行通信,但問題是在通信過程中它會停止,幾秒鐘然后重新開始。我已經(jīng)檢查了平板
    發(fā)表于 07-19 07:18

    機(jī)器學(xué)習(xí)算法原理詳解

    機(jī)器學(xué)習(xí)作為人工智能的重要分支,其目標(biāo)是通過讓計算機(jī)自動從數(shù)據(jù)中學(xué)習(xí)并改進(jìn)其性能,而無需進(jìn)行明確的編程。本文將深入解讀幾種常見的
    的頭像 發(fā)表于 07-02 11:25 ?2005次閱讀

    機(jī)器學(xué)習(xí)的經(jīng)典算法與應(yīng)用

    關(guān)于數(shù)據(jù)機(jī)器學(xué)習(xí)就是喂入算法和數(shù)據(jù),讓算法從數(shù)據(jù)中尋找種相應(yīng)的關(guān)系。Iris鳶尾花數(shù)據(jù)集是經(jīng)典數(shù)據(jù)集,在統(tǒng)計
    的頭像 發(fā)表于 06-27 08:27 ?1888次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>的經(jīng)典算法與應(yīng)用

    實現(xiàn)ns級的延時函數(shù),延時時間不可控的原因?

    現(xiàn)在要實現(xiàn)ns級的延時函數(shù),用nop指令已經(jīng)調(diào)試完成,然而問題在于這個延時函數(shù)經(jīng)常被中斷,導(dǎo)致延時時間不可控,我在延時函數(shù)前后加了 p
    發(fā)表于 06-26 06:50