一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一文帶你快速讀懂支持向量機(jī) SVM 算法

h1654155999.2342 ? 來(lái)源:博客園 ? 作者: JerryLead ? 2021-08-26 15:27 ? 次閱讀

簡(jiǎn)介

支持向量機(jī)基本上是最好的有監(jiān)督學(xué)習(xí)算法了。最開(kāi)始接觸SVM是去年暑假的時(shí)候,老師要求交《統(tǒng)計(jì)學(xué)習(xí)理論》的報(bào)告,那時(shí)去網(wǎng)上下了一份入門教程,里面講的很通俗,當(dāng)時(shí)只是大致了解了一些相關(guān)概念。

這次斯坦福提供的學(xué)習(xí)材料,讓我重新學(xué)習(xí)了一些SVM知識(shí)。我看很多正統(tǒng)的講法都是從VC 維理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小原理出發(fā),然后引出SVM什么的,還有些資料上來(lái)就講分類超平面什么的。

這份材料從前幾節(jié)講的logistic回歸出發(fā),引出了SVM,既揭示了模型間的聯(lián)系,也讓人覺(jué)得過(guò)渡更自然。

重新審視logistic回歸

Logistic回歸目的是從特征學(xué)習(xí)出一個(gè)0/1分類模型,而這個(gè)模型是將特性的線性組合作為自變量,由于自變量的取值范圍是負(fù)無(wú)窮到正無(wú)窮。

因此,使用logistic函數(shù)(或稱作sigmoid函數(shù))將自變量映射到(0,1)上,映射后的值被認(rèn)為是屬于y=1的概率。

形式化表示就是

假設(shè)函數(shù)

aa5ecf14-f846-11eb-9bcf-12bb97331649.png

其中x是n維特征向量,函數(shù)g就是logistic函數(shù)。

aa77a2dc-f846-11eb-9bcf-12bb97331649.png的圖像是

aa93046e-f846-11eb-9bcf-12bb97331649.png

可以看到,將無(wú)窮映射到了(0,1)。

而假設(shè)函數(shù)就是特征屬于y=1的概率。

aabd24d8-f846-11eb-9bcf-12bb97331649.png

當(dāng)我們要判別一個(gè)新來(lái)的特征屬于哪個(gè)類時(shí),只需求aaeb088a-f846-11eb-9bcf-12bb97331649.png,若大于0.5就是y=1的類,反之屬于y=0類。

再審視一下aaeb088a-f846-11eb-9bcf-12bb97331649.png,發(fā)現(xiàn)aaeb088a-f846-11eb-9bcf-12bb97331649.png只和ab32d732-f846-11eb-9bcf-12bb97331649.png有關(guān),ab32d732-f846-11eb-9bcf-12bb97331649.png>0,那么ab60cbce-f846-11eb-9bcf-12bb97331649.png,g(z)只不過(guò)是用來(lái)映射,真實(shí)的類別決定權(quán)還在ab32d732-f846-11eb-9bcf-12bb97331649.png。還有當(dāng)ab869638-f846-11eb-9bcf-12bb97331649.png時(shí),aaeb088a-f846-11eb-9bcf-12bb97331649.png=1,反之aaeb088a-f846-11eb-9bcf-12bb97331649.png=0。

如果我們只從ab32d732-f846-11eb-9bcf-12bb97331649.png出發(fā),希望模型達(dá)到的目標(biāo)無(wú)非就是讓訓(xùn)練數(shù)據(jù)中y=1的特征ab869638-f846-11eb-9bcf-12bb97331649.png,而是y=0的特征abd0d748-f846-11eb-9bcf-12bb97331649.png

Logistic回歸就是要學(xué)習(xí)得到abef8eea-f846-11eb-9bcf-12bb97331649.png,使得正例的特征遠(yuǎn)大于0,負(fù)例的特征遠(yuǎn)小于0,強(qiáng)調(diào)在全部訓(xùn)練實(shí)例上達(dá)到這個(gè)目標(biāo)。

圖形化表示如下:

ac0c8c5c-f846-11eb-9bcf-12bb97331649.png

中間那條線是ac2780c0-f846-11eb-9bcf-12bb97331649.png,logistic回顧強(qiáng)調(diào)所有點(diǎn)盡可能地遠(yuǎn)離中間那條線。學(xué)習(xí)出的結(jié)果也就中間那條線。

考慮上面3個(gè)點(diǎn)A、B和C。從圖中我們可以確定A是×類別的,然而C我們是不太確定的,B還算能夠確定。這樣我們可以得出結(jié)論,我們更應(yīng)該關(guān)心靠近中間分割線的點(diǎn),讓他們盡可能地遠(yuǎn)離中間線,而不是在所有點(diǎn)上達(dá)到最優(yōu)。

因?yàn)槟菢拥脑?,要使得一部分點(diǎn)靠近中間線來(lái)?yè)Q取另外一部分點(diǎn)更加遠(yuǎn)離中間線。我想這就是支持向量機(jī)的思路和logistic回歸的不同點(diǎn),一個(gè)考慮局部(不關(guān)心已經(jīng)確定遠(yuǎn)離的點(diǎn)),一個(gè)考慮全局(已經(jīng)遠(yuǎn)離的點(diǎn)可能通過(guò)調(diào)整中間線使其能夠更加遠(yuǎn)離)。這是我的個(gè)人直觀理解。

形式化表示

我們這次使用的結(jié)果標(biāo)簽是y=-1,y=1,替換在logistic回歸中使用的y=0和y=1。同時(shí)將abef8eea-f846-11eb-9bcf-12bb97331649.png替換成w和b。

以前的ac5a1a08-f846-11eb-9bcf-12bb97331649.png,其中認(rèn)為ac8034f4-f846-11eb-9bcf-12bb97331649.png。現(xiàn)在我們替換aca11cfa-f846-11eb-9bcf-12bb97331649.png為b,后面替換acbfbaf2-f846-11eb-9bcf-12bb97331649.pngacdc3b1e-f846-11eb-9bcf-12bb97331649.png(即ad0adbea-f846-11eb-9bcf-12bb97331649.png)。這樣,我們讓ad2249ce-f846-11eb-9bcf-12bb97331649.png,進(jìn)一步ad4341e2-f846-11eb-9bcf-12bb97331649.png。

也就是說(shuō)除了y由y=0變?yōu)閥=-1,只是標(biāo)記不同外,與logistic回歸的形式化表示沒(méi)區(qū)別。再明確下假設(shè)函數(shù)

ad715730-f846-11eb-9bcf-12bb97331649.png

上一節(jié)提到過(guò)我們只需考慮ab32d732-f846-11eb-9bcf-12bb97331649.png的正負(fù)問(wèn)題,而不用關(guān)心g(z),因此我們這里將g(z)做一個(gè)簡(jiǎn)化,將其簡(jiǎn)單映射到y(tǒng)=-1和y=1上。映射關(guān)系如下:

ad98c93c-f846-11eb-9bcf-12bb97331649.png

函數(shù)間隔(functional margin)和幾何間隔(geometric margin)

給定一個(gè)訓(xùn)練樣本adb55e08-f846-11eb-9bcf-12bb97331649.png,x是特征,y是結(jié)果標(biāo)簽。i表示第i個(gè)樣本。我們定義函數(shù)間隔如下:

addd8388-f846-11eb-9bcf-12bb97331649.png

可想而知,當(dāng)ae151190-f846-11eb-9bcf-12bb97331649.png時(shí),在我們的g(z)定義中,ae30ac84-f846-11eb-9bcf-12bb97331649.pngae4fc01a-f846-11eb-9bcf-12bb97331649.png的值實(shí)際上就是ae6752b6-f846-11eb-9bcf-12bb97331649.png。反之亦然。

為了使函數(shù)間隔最大(更大的信心確定該例是正例還是反例),當(dāng)ae151190-f846-11eb-9bcf-12bb97331649.png時(shí),ae8e9f6a-f846-11eb-9bcf-12bb97331649.png應(yīng)該是個(gè)大正數(shù),反之是個(gè)大負(fù)數(shù)。因此函數(shù)間隔代表了我們認(rèn)為特征是正例還是反例的確信度。

繼續(xù)考慮w和b,如果同時(shí)加大w和b,比如在aeac850c-f846-11eb-9bcf-12bb97331649.png前面乘個(gè)系數(shù)比如2,那么所有點(diǎn)的函數(shù)間隔都會(huì)增大二倍,這個(gè)對(duì)求解問(wèn)題來(lái)說(shuō)不應(yīng)該有影響,因?yàn)槲覀円蠼獾氖?img src="https://file.elecfans.com/web2/M00/12/4D/pYYBAGEnQ1qAfwBTAAAByHc6ZD4972.png" alt="aec9ada8-f846-11eb-9bcf-12bb97331649.png" />,同時(shí)擴(kuò)大w和b對(duì)結(jié)果是無(wú)影響的。

這樣,我們?yōu)榱讼拗苭和b,可能需要加入歸一化條件,畢竟求解的目標(biāo)是確定唯一一個(gè)w和b,而不是多組線性相關(guān)的向量。這個(gè)歸一化一會(huì)再考慮。

剛剛我們定義的函數(shù)間隔是針對(duì)某一個(gè)樣本的,現(xiàn)在我們定義全局樣本上的函數(shù)間隔

aee7afba-f846-11eb-9bcf-12bb97331649.png

說(shuō)白了就是在訓(xùn)練樣本上分類正例和負(fù)例確信度最小那個(gè)函數(shù)間隔。

接下來(lái)定義幾何間隔

假設(shè)我們有了B點(diǎn)所在的aec9ada8-f846-11eb-9bcf-12bb97331649.png分割面。任何其他一點(diǎn),比如A到該面的距離以af54e79c-f846-11eb-9bcf-12bb97331649.png表示,假設(shè)B就是A在分割面上的投影。

我們知道向量BA的方向是af7d4476-f846-11eb-9bcf-12bb97331649.png(分割面的梯度),單位向量是afb3cdac-f846-11eb-9bcf-12bb97331649.png。A點(diǎn)是adb55e08-f846-11eb-9bcf-12bb97331649.png,所以B點(diǎn)是x=afdf28bc-f846-11eb-9bcf-12bb97331649.png(利用初中的幾何知識(shí)),帶入aec9ada8-f846-11eb-9bcf-12bb97331649.png得,

進(jìn)一步得到

b02d5640-f846-11eb-9bcf-12bb97331649.png

af54e79c-f846-11eb-9bcf-12bb97331649.png實(shí)際上就是點(diǎn)到平面距離。

再換種更加優(yōu)雅的寫法:

b057aa76-f846-11eb-9bcf-12bb97331649.png

當(dāng)b075fd32-f846-11eb-9bcf-12bb97331649.png時(shí),不就是函數(shù)間隔嗎?是的,前面提到的函數(shù)間隔歸一化結(jié)果就是幾何間隔。

他們?yōu)槭裁磿?huì)一樣呢?因?yàn)楹瘮?shù)間隔是我們定義的,在定義的時(shí)候就有幾何間隔的色彩。同樣,同時(shí)擴(kuò)大w和b,w擴(kuò)大幾倍,b09437e8-f846-11eb-9bcf-12bb97331649.png就擴(kuò)大幾倍,結(jié)果無(wú)影響。同樣定義全局的幾何間隔b0b3917e-f846-11eb-9bcf-12bb97331649.png

最優(yōu)間隔分類器(optimal margin classifier)

回想前面我們提到我們的目標(biāo)是尋找一個(gè)超平面,使得離超平面比較近的點(diǎn)能有更大的間距。也就是我們不考慮所有的點(diǎn)都必須遠(yuǎn)離超平面,我們關(guān)心求得的超平面能夠讓所有點(diǎn)中離它最近的點(diǎn)具有最大間距。

形象的說(shuō),我們將上面的圖看作是一張紙,我們要找一條折線,按照這條折線折疊后,離折線最近的點(diǎn)的間距比其他折線都要大。形式化表示為:

b0ce205c-f846-11eb-9bcf-12bb97331649.png

這里用b09437e8-f846-11eb-9bcf-12bb97331649.png=1規(guī)約w,使得b0f630a6-f846-11eb-9bcf-12bb97331649.png是幾何間隔。

到此,我們已經(jīng)將模型定義出來(lái)了。如果求得了w和b,那么來(lái)一個(gè)特征x,我們就能夠分類了,稱為最優(yōu)間隔分類器。接下的問(wèn)題就是如何求解w和b的問(wèn)題了。

由于b112b91a-f846-11eb-9bcf-12bb97331649.png不是凸函數(shù),我們想先處理轉(zhuǎn)化一下,考慮幾何間隔和函數(shù)間隔的關(guān)系,b12f9620-f846-11eb-9bcf-12bb97331649.png,我們改寫一下上面的式子:

b149fb8c-f846-11eb-9bcf-12bb97331649.png

這時(shí)候其實(shí)我們求的最大值仍然是幾何間隔,只不過(guò)此時(shí)的w不受b112b91a-f846-11eb-9bcf-12bb97331649.png的約束了。然而這個(gè)時(shí)候目標(biāo)函數(shù)仍然不是凸函數(shù),沒(méi)法直接代入優(yōu)化軟件里計(jì)算。我們還要改寫。

前面說(shuō)到同時(shí)擴(kuò)大w和b對(duì)結(jié)果沒(méi)有影響,但我們最后要求的仍然是w和b的確定值,不是他們的一組倍數(shù)值,因此,我們需要對(duì)b1b4ebd6-f846-11eb-9bcf-12bb97331649.png做一些限制,以保證我們解是唯一的。

這里為了簡(jiǎn)便我們?nèi)?img src="https://file.elecfans.com/web2/M00/12/4D/pYYBAGEnQ1qARWS6AAABLmiOTds980.png" alt="b1d495d0-f846-11eb-9bcf-12bb97331649.png" />。這樣的意義是將全局的函數(shù)間隔定義為1,也即是將離超平面最近的點(diǎn)的距離定義為b1ed6cc2-f846-11eb-9bcf-12bb97331649.png。由于求b1ed6cc2-f846-11eb-9bcf-12bb97331649.png的最大值相當(dāng)于求b21a0b6a-f846-11eb-9bcf-12bb97331649.png的最小值,因此改寫后結(jié)果為:

b23844cc-f846-11eb-9bcf-12bb97331649.png

這下好了,只有線性約束了,而且是個(gè)典型的二次規(guī)劃問(wèn)題(目標(biāo)函數(shù)是自變量的二次函數(shù))。代入優(yōu)化軟件可解。

到這里發(fā)現(xiàn),這個(gè)講義雖然沒(méi)有像其他講義一樣先畫好圖,畫好分類超平面,在圖上標(biāo)示出間隔那么直觀,但每一步推導(dǎo)有理有據(jù),依靠思路的流暢性來(lái)推導(dǎo)出目標(biāo)函數(shù)和約束。

—版權(quán)聲明—

僅用于學(xué)術(shù)分享,版權(quán)屬于原作者。

若有侵權(quán),請(qǐng)聯(lián)系 刪除或修改!

轉(zhuǎn)自:JerryLead

http://www.cnblogs.com/jerrylead/archive/2011/03/13/1982639.html

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4682

    瀏覽量

    94372
  • 向量機(jī)
    +關(guān)注

    關(guān)注

    0

    文章

    166

    瀏覽量

    21094
  • SVM
    SVM
    +關(guān)注

    關(guān)注

    0

    文章

    154

    瀏覽量

    32899

原文標(biāo)題:優(yōu)雅的讀懂支持向量機(jī) SVM 算法

文章出處:【微信號(hào):gh_f39db674fbfd,微信公眾號(hào):尖刀視】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    請(qǐng)問(wèn)ST25R3916有快速讀取嗎?

    ST25R3916有快速讀取嗎?
    發(fā)表于 04-25 06:41

    請(qǐng)問(wèn)ST25R3916有快速讀取嗎?

    ST25R3916有快速讀取嗎?
    發(fā)表于 04-23 06:25

    讀懂,可重構(gòu)芯片為何是AI的完美搭檔

    在當(dāng)今數(shù)字化時(shí)代,人工智能(AI)無(wú)疑是最為耀眼的技術(shù)領(lǐng)域之。從早期簡(jiǎn)單的機(jī)器學(xué)習(xí)算法,到如今復(fù)雜的深度學(xué)習(xí)和Transformer模型,AI算法正以前所未有的速度快速發(fā)展。這種
    的頭像 發(fā)表于 03-31 12:05 ?333次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>讀懂</b>,可重構(gòu)芯片為何是AI的完美搭檔

    請(qǐng)問(wèn)ST25R3916有快速讀取嗎?

    ST25R3916有快速讀取嗎?
    發(fā)表于 03-13 06:36

    讀懂:LED 驅(qū)動(dòng)電路二極管挑選要點(diǎn)

    讀懂:LED 驅(qū)動(dòng)電路二極管挑選要點(diǎn)
    的頭像 發(fā)表于 02-06 14:47 ?381次閱讀

    讀懂什么是「雷電4」

    Thunderbolt讀懂什么是「雷電4」目前大部分PC接口配備了USB接口、音頻接口、HDMI接口等,這些接口的功能基本覆蓋了用戶的日常使用需求。為了提供更高速、更便捷的數(shù)據(jù)傳輸和設(shè)備連接體
    的頭像 發(fā)表于 02-05 17:52 ?1171次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>讀懂</b>什么是「雷電4」

    帶你讀懂EBSD

    電子背散射衍射(ElectronBackscatterDiffraction,簡(jiǎn)稱EBSD)技術(shù)是種基于掃描電子顯微鏡(SEM)的顯微分析技術(shù),它能夠提供材料微觀結(jié)構(gòu)的詳細(xì)信息,包括晶體取向
    的頭像 發(fā)表于 01-14 12:00 ?660次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>帶你</b><b class='flag-5'>讀懂</b>EBSD

    讀懂單燈控制器工作原理

    讀懂單燈控制器工作原理
    的頭像 發(fā)表于 11-11 13:13 ?903次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>讀懂</b>單燈控制器工作原理

    智慧公交是什么?帶你詳解智慧公交的解決方案!

    智慧公交是什么?帶你詳解智慧公交的解決方案!
    的頭像 發(fā)表于 11-05 12:26 ?739次閱讀
    智慧公交是什么?<b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>帶你</b>詳解智慧公交的解決方案!

    讀懂MSA(測(cè)量系統(tǒng)分析)

    讀懂MSA(測(cè)量系統(tǒng)分析)
    的頭像 發(fā)表于 11-01 11:08 ?1371次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>讀懂</b>MSA(測(cè)量系統(tǒng)分析)

    讀懂新能源汽車的功能安全

    電子發(fā)燒友網(wǎng)站提供《讀懂新能源汽車的功能安全.pdf》資料免費(fèi)下載
    發(fā)表于 09-04 09:22 ?3次下載

    讀懂什么單片機(jī):組成結(jié)構(gòu)與應(yīng)用

    歡迎來(lái)到單片機(jī)的世界,這是種微小(但功能強(qiáng)大)的設(shè)備,改變了嵌入式系統(tǒng)的面貌。在本文中,您將了解單片機(jī)些基本知識(shí)、單片機(jī)的結(jié)構(gòu)以及微處
    的頭像 發(fā)表于 08-09 11:49 ?2126次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>讀懂</b>什么單片<b class='flag-5'>機(jī)</b>:組成結(jié)構(gòu)與應(yīng)用

    計(jì)算機(jī)視覺(jué)技術(shù)的AI算法模型

    技術(shù)AI算法模型,包括卷積神經(jīng)網(wǎng)絡(luò)(CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)、支持向量機(jī)SVM)、卡爾曼濾波器(Kalman Filter)和隨機(jī)
    的頭像 發(fā)表于 07-24 12:46 ?1461次閱讀

    機(jī)器學(xué)習(xí)算法原理詳解

    機(jī)器學(xué)習(xí)作為人工智能的個(gè)重要分支,其目標(biāo)是通過(guò)讓計(jì)算機(jī)自動(dòng)從數(shù)據(jù)中學(xué)習(xí)并改進(jìn)其性能,而無(wú)需進(jìn)行明確的編程。本文將深入解讀幾種常見(jiàn)的機(jī)器學(xué)習(xí)算法原理,包括線性回歸、邏輯回歸、支持向量
    的頭像 發(fā)表于 07-02 11:25 ?2005次閱讀

    帶你讀懂什么是工控機(jī)

    簡(jiǎn)單來(lái)說(shuō),工控機(jī)是專為工業(yè)用途而設(shè)計(jì)的計(jì)算機(jī)。這意味著它可以在各種溫度范圍內(nèi)提供工業(yè)自動(dòng)化,具有增強(qiáng)的耐用性,并且通常包括專為工業(yè)應(yīng)用設(shè)計(jì)的功能,例如過(guò)程控制和數(shù)據(jù)采集。體化設(shè)計(jì)用于輕松集成到更大
    的頭像 發(fā)表于 06-03 17:00 ?747次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>帶你</b><b class='flag-5'>讀懂</b>什么是工控<b class='flag-5'>機(jī)</b>