一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

SparkMLlib GBDT算法工業(yè)大數(shù)據(jù)的實戰(zhàn)案例

電子設(shè)計 ? 來源:電子設(shè)計 ? 作者:電子設(shè)計 ? 2020-12-25 17:42 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在格物匯之前發(fā)表的《工業(yè)大數(shù)據(jù)挖掘的利器——Spark MLlib》中提到,Spark 的MLlib組件能夠?qū)I(yè)現(xiàn)場海量數(shù)據(jù)進行高效挖掘,快速呈現(xiàn)結(jié)果給業(yè)務(wù)分析人員。接下來將向大家介紹SparkMLlib 中的GBDT算法,并將應(yīng)用該算法對工業(yè)數(shù)據(jù)進行代碼實戰(zhàn)。

1算法概念

GB(Gradient Boosting)梯度提升算法,GB 共需要進行M次迭代,通過采用梯度下降的方法,每次迭代向損失函數(shù)的負(fù)梯度方向進行移動,從而使損失函數(shù)越來越小,進而使模型越來越精確。算法偽代碼如下:

GB算法跟原始的Boosting算法相比較,還是有比較明顯的區(qū)別。

Boosting算法開始的時候,是會給每個樣本附上權(quán)重的,在每次迭代的時候就會增加錯的樣本的權(quán)重,減少對的樣本的權(quán)重,經(jīng)過N次迭代之后,會得到N個分類器,然后我們再將他們組合起來,得到最終模型。

GB算法與Boosting區(qū)別是,他的每一次迭代的目標(biāo)都是減少上一次的殘差,所以在殘差減少的方向上建立一個新的模型。在GB算法框架上加入決策樹,就是GBDT(GradientBoost Decision Tree)算法。

GBDT主要的優(yōu)點有:

1) 可以靈活處理各種類型的數(shù)據(jù),包括連續(xù)值和離散值。

2) 在相對少的調(diào)參時間情況下,預(yù)測的準(zhǔn)備率也可以比較高。這個是相對SVM來說的。

3)使用一些健壯的損失函數(shù),對異常值的魯棒性非常強。比如 Huber損失函數(shù)和Quantile損失函數(shù)。

4) 很好的利用了弱分類器進行級聯(lián)。

5) 充分考慮的每個分類器的權(quán)重。

6) 可以得到變量間的重要性排序。

GBDT的主要缺點有:

1)由于弱學(xué)習(xí)器之間存在依賴關(guān)系,難以并行訓(xùn)練數(shù)據(jù),不過可以通過自采樣的SGBT來達到部分并行。

2完整代碼實例

工業(yè)生產(chǎn)中,產(chǎn)品在制程過程中會有很多特性值,如果能對產(chǎn)品的特性值及時進行預(yù)測,得到特性值的具體數(shù)值,那么就會幫組業(yè)務(wù)人員知曉產(chǎn)品的質(zhì)量,實現(xiàn)產(chǎn)品的全檢,并能防止異常產(chǎn)品后流,造成不必要的浪費。

本次實戰(zhàn)代碼的采用的數(shù)據(jù)是半導(dǎo)體制程中某一道工序的機臺的制程參數(shù)值,通過采用SparkMLlib中的GBDT算法對工業(yè)現(xiàn)場機臺的制程參數(shù)進行建模,預(yù)測出經(jīng)過該機臺生產(chǎn)之后產(chǎn)品的膜層厚度。

模型最后輸出模型性能指標(biāo)如下:

Mape(Mean Absolute Percentage Error):0.23%

通過上圖模型輸出的預(yù)測值與實際值對比,發(fā)現(xiàn)預(yù)測出來的產(chǎn)品膜厚的數(shù)值走勢跟實際數(shù)值走勢基本符合,mape達到0.5%以內(nèi),擬合度相當(dāng)可觀,后續(xù)還可以通過樣本篩選以及特征工程等手段對該模型進行進一步調(diào)優(yōu)。

在模型達到業(yè)務(wù)需求的擬合度等指標(biāo)后,通過該模型進行部署,實現(xiàn)產(chǎn)品的“實時全檢”,從而實現(xiàn)產(chǎn)品質(zhì)量的全面監(jiān)控,杜絕異常產(chǎn)品后流;與工廠內(nèi)的抽檢系統(tǒng)結(jié)合后,降低產(chǎn)品的抽檢率,提高工廠的效率。

GBDT算法的用途還是比較廣泛的,它不僅可以處理分類問題,能對線性與非線性回歸問題進行處理,還能通過輸出變量間重要因子排序,方便業(yè)務(wù)人員快速定位異常變量。在工業(yè)現(xiàn)場的頑固異常分析還是產(chǎn)品特性預(yù)測等領(lǐng)域,GBDT算法確實是很值得數(shù)據(jù)分析人員考慮的一種算法。

本文作者:

格創(chuàng)東智大數(shù)據(jù)工程師黃歡(轉(zhuǎn)載請注明作者及來源)


審核編輯:符乾江
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    雷曼光電榮獲第七屆“深圳工業(yè)大獎”企業(yè)獎

    近日,第七屆“深圳工業(yè)大獎”名單公示,雷曼光電憑借在超高清顯示領(lǐng)域的卓越技術(shù)實力與創(chuàng)新成果,成功摘得“深圳工業(yè)大獎”。這一榮譽不僅是對雷曼光電深耕工業(yè)經(jīng)濟、推動產(chǎn)業(yè)升級的充分肯定,更是對雷曼光電在大尺寸Micro LED顯示技術(shù)
    的頭像 發(fā)表于 07-17 17:08 ?171次閱讀

    歐菲光榮獲第七屆“深圳工業(yè)大獎” 深圳工業(yè)界最高榮譽

    近日,第七屆“深圳工業(yè)大獎”名單公示,經(jīng)深圳工業(yè)大獎獨立評審團成員認(rèn)真審議、記名投票,分別評選產(chǎn)生第七屆“深圳工業(yè)大獎”企業(yè)10家、工業(yè)家10位、項目10個。其中,歐菲光集團股份有限公
    的頭像 發(fā)表于 07-15 18:07 ?265次閱讀

    工業(yè)大數(shù)據(jù)管理平臺是什么?有什么功能?

    PLC跨網(wǎng)段通信網(wǎng)關(guān)是一種用于解決工業(yè)自動化領(lǐng)域中不同網(wǎng)絡(luò)段內(nèi)PLC(可編程邏輯控制器)設(shè)備通信問題的關(guān)鍵設(shè)備,其核心作用是實現(xiàn)不同網(wǎng)絡(luò)協(xié)議、IP網(wǎng)段之間的數(shù)據(jù)交互與信息傳輸,下面從多個方面詳細(xì)介紹
    的頭像 發(fā)表于 06-13 15:43 ?135次閱讀

    京東工業(yè)大模型Joy industrial重磅發(fā)布

    京東工業(yè)多年深耕工業(yè)數(shù)智供應(yīng)鏈領(lǐng)域形成的經(jīng)驗積累和數(shù)據(jù)沉淀,通過“工業(yè)大模型+供應(yīng)鏈場景應(yīng)用”雙引擎,構(gòu)建從底層算力、算法
    的頭像 發(fā)表于 05-28 17:12 ?473次閱讀

    效能拓展,智能并行:G-ADLS03工業(yè)大母板為工業(yè)自動化提供尖端硬件基石

    吉方工控全新G系列工業(yè)大母板G-ADLS03,憑借其卓越的性能、豐富的功能以及強大的擴展性,成為工業(yè)升級領(lǐng)域中備受矚目的明星產(chǎn)品,并獲得由中國工控網(wǎng)及多方平臺共同頒發(fā)的2025CAIMRS“產(chǎn)業(yè)智能
    的頭像 發(fā)表于 02-21 09:47 ?556次閱讀
    效能拓展,智能并行:G-ADLS03<b class='flag-5'>工業(yè)大</b>母板為<b class='flag-5'>工業(yè)</b>自動化提供尖端硬件基石

    創(chuàng)新奇智AInnoGC工業(yè)大模型技術(shù)升級

    創(chuàng)新奇智近日宣布,其旗下的AInnoGC工業(yè)大模型已成功完成技術(shù)升級,實現(xiàn)了DeepSeek-R1蒸餾AInno-75B的技術(shù)適配。這一技術(shù)突破,標(biāo)志著創(chuàng)新奇智在AI技術(shù)領(lǐng)域的又一次飛躍。 通過引入
    的頭像 發(fā)表于 02-14 09:42 ?563次閱讀

    工程大數(shù)據(jù)平臺

    由于無人駕駛系統(tǒng)開發(fā)需要長期迭代優(yōu)化,其過程需要大量的路試數(shù)據(jù)支撐,經(jīng)緯恒潤針對無人駕駛系統(tǒng)持續(xù)運營和持續(xù)迭代的需求,開發(fā)并在云端部署了車路云工程大數(shù)據(jù)平臺,依托5G網(wǎng)絡(luò),具有遠(yuǎn)程數(shù)據(jù)采集、壓縮、傳輸、解析、回放與
    的頭像 發(fā)表于 01-10 17:00 ?586次閱讀
    工程<b class='flag-5'>大數(shù)據(jù)</b>平臺

    河南工業(yè)大學(xué)選購我司同步熱分析儀,助力科研與教學(xué)創(chuàng)新

    近日,河南工業(yè)大學(xué)已正式選購我們的同步熱分析儀,以進一步提升其科研與教學(xué)水平。此次合作不僅是對我司產(chǎn)品性能的肯定,更是雙方在科研創(chuàng)新領(lǐng)域的一次重要攜手。河南工業(yè)大學(xué)同步熱分析儀作為材料分析設(shè)備,能夠
    的頭像 發(fā)表于 12-11 10:15 ?51次閱讀
    河南<b class='flag-5'>工業(yè)大</b>學(xué)選購我司同步熱分析儀,助力科研與教學(xué)創(chuàng)新

    ADS1675最大數(shù)據(jù)吞吐率是是多少?

    ADS1675 24bit的ADC的采樣率最大是4Msps,請問這款adc的最大數(shù)據(jù)吞吐率是是多少?怎么算的,在datasheet中有明確寫出來嗎
    發(fā)表于 11-28 07:56

    西北工業(yè)大學(xué)OpenHarmony技術(shù)俱樂部正式揭牌成立

    11月15日,由OpenAtom OpenHarmony(以下簡稱“OpenHarmony”)項目群技術(shù)指導(dǎo)委員會與西北工業(yè)大學(xué)共同舉辦的“西北工業(yè)大學(xué)OpenHarmony技術(shù)俱樂部成立大會”在
    的頭像 發(fā)表于 11-19 18:04 ?965次閱讀
    西北<b class='flag-5'>工業(yè)大</b>學(xué)OpenHarmony技術(shù)俱樂部正式揭牌成立

    智慧城市與大數(shù)據(jù)的關(guān)系

    智慧城市與大數(shù)據(jù)之間存在著密切的關(guān)系,這種關(guān)系體現(xiàn)在大數(shù)據(jù)對智慧城市建設(shè)的支撐和推動作用,以及智慧城市產(chǎn)生的大量數(shù)據(jù)大數(shù)據(jù)技術(shù)的應(yīng)用需求。 大數(shù)據(jù)
    的頭像 發(fā)表于 10-24 15:27 ?1327次閱讀

    基于大數(shù)據(jù)與深度學(xué)習(xí)的穿戴式運動心率算法

    性能的關(guān)鍵手段。然而,在復(fù)雜多變的運動環(huán)境中,準(zhǔn)確測量心率數(shù)據(jù)對于傳統(tǒng)算法而言具有較大的技術(shù)瓶頂。本文將探討如何運用大數(shù)據(jù)和深度學(xué)習(xí)技術(shù)來開發(fā)創(chuàng)新的穿戴式運動心率算
    的頭像 發(fā)表于 09-10 08:03 ?643次閱讀
    基于<b class='flag-5'>大數(shù)據(jù)</b>與深度學(xué)習(xí)的穿戴式運動心率<b class='flag-5'>算法</b>

    小鵬汽車榮獲2024年機械工業(yè)大型重點骨干企業(yè)

    近日,由中國機械工業(yè)聯(lián)合會主辦的“2024年機械工業(yè)大型重點骨干企業(yè)發(fā)展論壇暨機械、鋼鐵產(chǎn)業(yè)鏈融通發(fā)展大會”在北京舉行,小鵬汽車榮獲“機械工業(yè)大型重點骨干企業(yè)”稱號。
    的頭像 發(fā)表于 08-05 10:26 ?776次閱讀

    旗晟機器人儀器儀表識別AI智慧算法

    缺少的一個環(huán)節(jié)。那么我們說說旗晟儀器儀表識別AI智慧算法吧。 旗晟儀器儀表識別AI智慧算法是通過各類采集設(shè)備與AI服務(wù)器,結(jié)合行業(yè)大數(shù)據(jù)庫積累以及自研AI深度學(xué)習(xí)算法模型,形成了高效率
    的頭像 發(fā)表于 07-26 09:58 ?663次閱讀
    旗晟機器人儀器儀表識別AI智慧<b class='flag-5'>算法</b>

    使用CYW20829的BLE進行最大數(shù)據(jù)發(fā)送應(yīng)用,BLE丟失數(shù)據(jù)如何解決?

    我目前正在使用 CYW20829 的 BLE 進行最大數(shù)據(jù)發(fā)送應(yīng)用,我使用的是 FREERTOS(例程 Bluetooth_LE_GATT_Throughput_Server 是我的參考),藍牙被
    發(fā)表于 07-23 07:56