一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機(jī)器學(xué)習(xí)特征選擇的三種方法

倩倩 ? 來源:云溪初閣 ? 2020-04-15 15:56 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

特征選擇,這是一個(gè)在機(jī)器學(xué)習(xí)中非常重要的東西,那些好的特征可以從整體上來提升模型的性能,可以幫助我們更加清晰的理解真?zhèn)€數(shù)據(jù)的特點(diǎn)及底層結(jié)構(gòu),對于后面的模型,算法有著非常重要的作用。

備注:在很多情況下,特征選擇并非必要的,業(yè)務(wù)特征的選擇有很強(qiáng)烈的業(yè)務(wù)契合度在里面,代表著這些特征在業(yè)務(wù)中的重要性也是很高,如果去掉,很有可能會有一定的副作用,但是無法說清這個(gè)副作用,這個(gè)需要進(jìn)入到訓(xùn)練中去訓(xùn)練數(shù)據(jù)來驗(yàn)證這個(gè)效果。

特征選擇作用

這里有些同學(xué)可能是剛開始接觸做特征選擇,并不是很了解為什么要做特征選擇,做了有什么作用?是否只是簡單地減少特征?是否這樣子做了,對結(jié)果有沒有影響?

這里每個(gè)人都有自己的理解,小編根據(jù)自己的經(jīng)驗(yàn),總結(jié)有兩個(gè),參考一下:

1、減少特征的數(shù)量,降低維度,這樣子可以在一定程度上加強(qiáng)模型的泛化能力,從而盡可能地減少過擬合,這里要注意一下:過擬合只能減少,無法消滅,好比這個(gè)世上,其實(shí)沒有最優(yōu)解的一樣,擁有的只有不滿足。

2、在一定程度上降低特征后,從直觀上來看,很多時(shí)候可以一目了然看到特征與特征值之間的關(guān)聯(lián),這個(gè)場景,需要實(shí)際業(yè)務(wù)的支撐,生產(chǎn)上的業(yè)務(wù)數(shù)據(jù)更加明顯,有興趣的同學(xué)可以私信我加群,一起研究。

特征選擇從何入手

這是一個(gè)非常重要的問題,有很多同學(xué)可能剛開始接觸或者想往這方面發(fā)展,拿到了一組數(shù)組,很多時(shí)候就是直接拿了一個(gè)算法,直接做分類或者做回歸或者做聚類,但是這樣子正常情況下,數(shù)據(jù)會存在很多噪音(科普:噪音可以理解為一些垃圾數(shù)據(jù),對我們的結(jié)果或者期望造成了干擾),這樣子的數(shù)據(jù)不會很好。

那如果我要特征選擇呢,又不知從何入手?

這里有兩個(gè)方法,可以作為參考:

1、從業(yè)務(wù)范圍分析,直接觀察特征與業(yè)務(wù)的相關(guān)性,這點(diǎn)非常重要,那些對業(yè)務(wù)有著直接指標(biāo)的數(shù)據(jù),建議保留,否則,可以考慮手動刪除掉。

2、從發(fā)散特性分析,這個(gè)很多同學(xué)畢業(yè)后,就忘了這個(gè)東西,簡單用成語一個(gè)成語來理解一下:一成不變。如果這個(gè)特征滿足這種條件,那證明不發(fā)散,其實(shí)在數(shù)學(xué)中,用方差來計(jì)算的,這種不發(fā)散的特征,基本就沒有什么差異性了,例如某一項(xiàng)特征都是0,怎么有影響呢,這樣子的特征其實(shí)就沒什么用。

特征選擇的三種方法

進(jìn)行特征選擇的時(shí)候,其實(shí)有一定的方法或者規(guī)律可言,總結(jié)起來有三個(gè)

1、過濾法:目前這是小編用的最普遍的方法,因?yàn)樽詈唵?,與業(yè)務(wù)契合度最高,操作過程就是我可以設(shè)定某一個(gè)閾值,然后根據(jù)數(shù)據(jù)的發(fā)散情況或者與業(yè)務(wù)是否相關(guān)來打分,一般都是當(dāng)?shù)陀谶@個(gè)閾值的時(shí)候,就可以考慮過濾掉。

2、嵌入法:這個(gè)方法無法直接從字面來理解,但是其實(shí)也是很好的東西,小編把它叫做過濾法的進(jìn)化版。如何理解這個(gè)進(jìn)化版,原先我們采用過濾法的時(shí)候,很多時(shí)候是人肉直接擼一擼,但是這時(shí)候特征多呢,給你200個(gè)特征,然后我就可能瞎了或者手廢掉了,此時(shí)的做法是此案用機(jī)器學(xué)習(xí)的算法或者模型來訓(xùn)練,然后可以得到各個(gè)特征的權(quán)重值,做個(gè)排序,干掉那些排序地的,例如樹的特征選擇,這些算法,后面會逐一介紹。

3、包裝法:聽這個(gè)名字,是不是也是很迷糊,其實(shí)這個(gè)也比較好理解,不斷循環(huán)訓(xùn)練模型,進(jìn)行目標(biāo)函數(shù)的計(jì)算,一般我們是采用預(yù)測的效果來評分,逐一選擇一定量的特征來做,不斷循環(huán),得到結(jié)果進(jìn)行對比,這樣就可以看到哪些特征不好。不過這個(gè)小編比較少用,計(jì)算上比較費(fèi)時(shí)費(fèi)力,后面的具體算法也會介紹到。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4711

    瀏覽量

    95446
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8505

    瀏覽量

    134677
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    精選好文!噪聲系數(shù)測量的三種方法

    器件噪聲系數(shù)的三種方法。每種方法都有其優(yōu)缺點(diǎn),適用于特定的應(yīng)用。下表是三種方法優(yōu)缺點(diǎn)的總結(jié)。理論上,同一個(gè)射頻器件的測量結(jié)果應(yīng)該一樣,但是由于射頻設(shè)備的限制(可用性、精度、頻率范圍、噪聲基底等),必須
    發(fā)表于 05-07 10:18

    雙極型極管放大電路的三種基本組態(tài)的學(xué)習(xí)課件免費(fèi)下載

      本文檔的主要內(nèi)容詳細(xì)介紹的是雙極型極管放大電路的三種基本組態(tài)的學(xué)習(xí)課件免費(fèi)下載包括了:共集電極放大電路,共基極放大電路,三種基本組態(tài)的比較   輸入信號ui
    發(fā)表于 04-11 16:39 ?26次下載

    redis三種集群方案詳解

    在Redis中提供的集群方案總共有三種(一般一個(gè)redis節(jié)點(diǎn)不超過10G內(nèi)存)。
    的頭像 發(fā)表于 03-31 10:46 ?736次閱讀
    redis<b class='flag-5'>三種</b>集群方案詳解

    FPGA頻率測量的三種方法

    1、FPGA頻率測量? 頻率測量在電子設(shè)計(jì)和測量領(lǐng)域中經(jīng)常用到,因此對頻率測量方法的研究在實(shí)際工程應(yīng)用中具有重要意義。 通常的頻率測量方法三種:直接測量法,間接測量法,等精度測量法。 2、直接
    的頭像 發(fā)表于 01-09 09:37 ?752次閱讀
    FPGA頻率測量的<b class='flag-5'>三種方法</b>

    傳統(tǒng)機(jī)器學(xué)習(xí)方法和應(yīng)用指導(dǎo)

    在上一篇文章中,我們介紹了機(jī)器學(xué)習(xí)的關(guān)鍵概念術(shù)語。在本文中,我們會介紹傳統(tǒng)機(jī)器學(xué)習(xí)的基礎(chǔ)知識和多種算法特征,供各位老師
    的頭像 發(fā)表于 12-30 09:16 ?1198次閱讀
    傳統(tǒng)<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)方法</b>和應(yīng)用指導(dǎo)

    如何選擇云原生機(jī)器學(xué)習(xí)平臺

    當(dāng)今,云原生機(jī)器學(xué)習(xí)平臺因其彈性擴(kuò)展、高效部署、低成本運(yùn)營等優(yōu)勢,逐漸成為企業(yè)構(gòu)建和部署機(jī)器學(xué)習(xí)應(yīng)用的首選。然而,市場上的云原生機(jī)器
    的頭像 發(fā)表于 12-25 11:54 ?461次閱讀

    ADS8688,ADS8688A,ADS8688AT三種型號有什么區(qū)別?如何選擇?

    問一下官方,ADS8688有三種型號,ADS8688,ADS8688A,ADS8688AT,好像還不是同一個(gè)手冊上的型號,請問這三種型號有什么區(qū)別?如何選擇?如果芯片有區(qū)別,萬一買錯(cuò)了怎么辦?
    發(fā)表于 12-12 07:51

    三種常見平方根算法的電路設(shè)計(jì)及Verilog實(shí)現(xiàn)與仿真

    、圖形顯示等領(lǐng)域具有重要的地位,所以如何在硬件上實(shí)現(xiàn)該運(yùn)算可以提高計(jì)算單元的性能,加快計(jì)算速度。 本文實(shí)現(xiàn)的算法包括二分迭代法、牛頓迭代法、逐次逼近法,前兩種方法來源于數(shù)值計(jì)算方法,第三種方法類似于逐次漸進(jìn)型A
    的頭像 發(fā)表于 11-26 10:12 ?1413次閱讀
    <b class='flag-5'>三種</b>常見平方根算法的電路設(shè)計(jì)及Verilog實(shí)現(xiàn)與仿真

    數(shù)據(jù)準(zhǔn)備指南:10基礎(chǔ)特征工程方法的實(shí)戰(zhàn)教程

    在數(shù)據(jù)分析和機(jī)器學(xué)習(xí)領(lǐng)域,從原始數(shù)據(jù)中提取有價(jià)值的信息是一個(gè)關(guān)鍵步驟。這個(gè)過程不僅有助于輔助決策,還能預(yù)測未來趨勢。為了實(shí)現(xiàn)這一目標(biāo),特征工程技術(shù)顯得尤為重要。特征工程是將原始數(shù)據(jù)轉(zhuǎn)化
    的頭像 發(fā)表于 11-01 08:09 ?629次閱讀
    數(shù)據(jù)準(zhǔn)備指南:10<b class='flag-5'>種</b>基礎(chǔ)<b class='flag-5'>特征</b>工程<b class='flag-5'>方法</b>的實(shí)戰(zhàn)教程

    相異步電動機(jī)三種調(diào)速方法

    。為了滿足不同的應(yīng)用需求,人們開發(fā)了多種調(diào)速方法。 1. 變極調(diào)速 變極調(diào)速是通過改變電動機(jī)的極數(shù)來實(shí)現(xiàn)調(diào)速的一種方法。這種方法適用于恒轉(zhuǎn)矩負(fù)載,如鼓風(fēng)機(jī)、水泵等。 原理 相異步電動
    的頭像 發(fā)表于 10-12 15:30 ?5401次閱讀

    光纖測試方法有哪三種

    光纖測試是確保光纖通信系統(tǒng)性能和可靠性的重要環(huán)節(jié)。光纖測試方法多樣,主要包括插入損耗測試、回波損耗測試和光纖端面檢查。以下是對這三種測試方法的介紹: 1. 插入損耗測試 插入損耗測試是測量光纖鏈路中
    的頭像 發(fā)表于 09-24 09:31 ?2672次閱讀

    單片機(jī)的三種總線結(jié)構(gòu)

    、控制信號傳遞和地址選擇中發(fā)揮著至關(guān)重要的作用。下面將詳細(xì)闡述這三種總線結(jié)構(gòu)的特點(diǎn)及其在單片機(jī)系統(tǒng)中的應(yīng)用。
    的頭像 發(fā)表于 09-10 11:32 ?7203次閱讀

    vim的三種工作模式是什么?如何切換

    Vim是一款功能強(qiáng)大的文本編輯器,它具有多種工作模式,以滿足不同用戶的需求。在Vim中,主要有三種工作模式:普通模式、插入模式和命令行模式。 普通模式(Normal Mode) 普通模式是Vim
    的頭像 發(fā)表于 08-30 14:50 ?4487次閱讀

    【「時(shí)間序列與機(jī)器學(xué)習(xí)」閱讀體驗(yàn)】時(shí)間序列的信息提取

    個(gè)重要環(huán)節(jié),目標(biāo)是從給定的時(shí)間序列數(shù)據(jù)中提取出有用的信息和特征,以支持后續(xù)的分析和預(yù)測任務(wù)。 特征工程(Feature Engineering)是將數(shù)據(jù)轉(zhuǎn)換為更好地表示潛在問題的特征,從而提高
    發(fā)表于 08-17 21:12

    MCUXpresso IDE下在線聯(lián)合調(diào)試雙核MCU工程的三種方法

    大家好,我是痞子衡,是正經(jīng)搞技術(shù)的痞子。今天痞子衡給大家分享的是MCUXpresso IDE下在線聯(lián)合調(diào)試i.MXRT1170雙核工程的三種方法。
    的頭像 發(fā)表于 08-08 15:18 ?1381次閱讀
    MCUXpresso IDE下在線聯(lián)合調(diào)試雙核MCU工程的<b class='flag-5'>三種方法</b>