一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機(jī)器學(xué)習(xí)步驟詳解,一文了解全過(guò)程

星星科技指導(dǎo)員 ? 來(lái)源:mouser ? 作者:M. Tim Jones ? 2023-05-16 09:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

引言

部署機(jī)器學(xué)習(xí)的過(guò)程涉及多個(gè)步驟。首先選擇一個(gè)模型,針對(duì)特定任務(wù)加以訓(xùn)練,用測(cè)試數(shù)據(jù)進(jìn)行驗(yàn)證,然后,將該模型部署到實(shí)際系統(tǒng)中并進(jìn)行監(jiān)控。在本文中,我們將討論這些步驟,將每個(gè)步驟拆分講解來(lái)介紹機(jī)器學(xué)習(xí)。

機(jī)器學(xué)習(xí)是指在沒(méi)有明確指令的情況下能夠?qū)W習(xí)和加以改進(jìn)的系統(tǒng)。這些系統(tǒng)從數(shù)據(jù)中學(xué)習(xí),用于執(zhí)行特定的任務(wù)或功能。在某些情況下,學(xué)習(xí),或者更具體地說(shuō),訓(xùn)練,是在受監(jiān)督的方式下進(jìn)行,當(dāng)輸出不正確時(shí)對(duì)模型加以調(diào)整,使其生成正確的輸出。在其他情況下,則實(shí)行無(wú)監(jiān)督學(xué)習(xí),由系統(tǒng)負(fù)責(zé)梳理數(shù)據(jù)來(lái)發(fā)現(xiàn)以前未知的模式。大多數(shù)機(jī)器學(xué)習(xí)模型都是遵循這兩種范式(監(jiān)督學(xué)習(xí)與無(wú)監(jiān)督學(xué)習(xí))。

現(xiàn)在,讓我們深入研究“模型”的含義,然后探究數(shù)據(jù)如何成為機(jī)器學(xué)習(xí)的燃料。

機(jī)器學(xué)習(xí)模型

模型是機(jī)器學(xué)習(xí)解決方案的抽象化表述。模型定義架構(gòu),架構(gòu)經(jīng)過(guò)訓(xùn)練變成產(chǎn)品實(shí)現(xiàn)。所以,我們不是部署模型,而是部署經(jīng)過(guò)數(shù)據(jù)訓(xùn)練的模型的實(shí)現(xiàn)(在下一節(jié)中有更加詳細(xì)的介紹)。模型 + 數(shù)據(jù) + 訓(xùn)練=機(jī)器學(xué)習(xí)解決方案的實(shí)例(圖1)。

poYBAGRi4kWACGwdAAD4Lj1H204920.png

圖1:從機(jī)器學(xué)習(xí)模型到解決方案。(圖源:作者)

機(jī)器學(xué)習(xí)解決方案代表一個(gè)系統(tǒng)。它們接受輸入,在網(wǎng)絡(luò)中執(zhí)行不同類(lèi)型的計(jì)算,然后提供輸出。輸入和輸出代表數(shù)值型數(shù)據(jù),這意味著,在某些情況下,需要轉(zhuǎn)譯。例如,將文本數(shù)據(jù)輸入深度學(xué)習(xí)網(wǎng)絡(luò)需要將單詞編碼成數(shù)字形式,考慮到可以使用的單詞的多樣性,該數(shù)字形式通常是高維向量。同樣,輸出可能需要從數(shù)字形式轉(zhuǎn)譯回文本形式。

機(jī)器學(xué)習(xí)模型有多種類(lèi)型,如神經(jīng)網(wǎng)絡(luò)模型、貝葉斯 (Bayesian) 模型、回歸模型、聚類(lèi)模型等。您選擇的模型是基于著手解決的問(wèn)題。

對(duì)于神經(jīng)網(wǎng)絡(luò)來(lái)說(shuō),模型從淺多層網(wǎng)絡(luò)到深度神經(jīng)網(wǎng)絡(luò),類(lèi)型豐富,而深度神經(jīng)網(wǎng)絡(luò)還包括多層特化神經(jīng)元(處理單元)。深度神經(jīng)網(wǎng)絡(luò)還有一系列基于目標(biāo)應(yīng)用的可用模型。例如:

如果您的應(yīng)用側(cè)重于識(shí)別圖像中的對(duì)象,那么卷積神經(jīng)網(wǎng)絡(luò) (CNN) 就是理想的模型。CNN已被應(yīng)用于皮膚癌檢測(cè),效果優(yōu)于皮膚科醫(yī)生的平均水平。

如果您的應(yīng)用涉及預(yù)測(cè)或生成復(fù)雜序列(如人類(lèi)語(yǔ)言句子),那么遞歸神經(jīng)網(wǎng)絡(luò) (RNN) 或長(zhǎng)短期記憶網(wǎng)絡(luò) (LSTM) 是理想模型。LSTM也已經(jīng)應(yīng)用到人類(lèi)語(yǔ)言的機(jī)器翻譯中。

如果您的應(yīng)用涉及用人類(lèi)語(yǔ)言描述圖像內(nèi)容,可以使用CNN和LSTM的組合(圖像輸入CNN,CNN的輸出代表LSTM的輸入,后者發(fā)出詞匯序列)。

如果您的應(yīng)用涉及生成現(xiàn)實(shí)圖像(如風(fēng)景或人臉),那么生成對(duì)抗網(wǎng)絡(luò) (GAN) 是當(dāng)前最先進(jìn)的模型。

這些模型代表了當(dāng)今常用的部分深層神經(jīng)網(wǎng)絡(luò)架構(gòu)。深度神經(jīng)網(wǎng)絡(luò)深受歡迎,因?yàn)樗鼈兛梢越邮芊墙Y(jié)構(gòu)化數(shù)據(jù),如圖像、視頻音頻信息。網(wǎng)絡(luò)中的各層構(gòu)成一個(gè)特征層次結(jié)構(gòu),使它們能夠?qū)Ψ浅?fù)雜的信息進(jìn)行分類(lèi)。深度神經(jīng)網(wǎng)絡(luò)已經(jīng)在許多問(wèn)題領(lǐng)域展示出先進(jìn)的性能。但是像其他機(jī)器學(xué)習(xí)模型一樣,它們的準(zhǔn)確性依賴(lài)于數(shù)據(jù)。接下來(lái)我們就探討一下這個(gè)方面。

數(shù)據(jù)和訓(xùn)練

無(wú)論在運(yùn)算中,還是在通過(guò)模型訓(xùn)練構(gòu)建機(jī)器學(xué)習(xí)解決方案的過(guò)程中,數(shù)據(jù)皆為驅(qū)動(dòng)機(jī)器學(xué)習(xí)的燃料。對(duì)于深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練數(shù)據(jù),探索數(shù)量和質(zhì)量前提下的必要數(shù)據(jù)至關(guān)重要。

深度神經(jīng)網(wǎng)絡(luò)需要大量數(shù)據(jù)進(jìn)行訓(xùn)練;按經(jīng)驗(yàn)來(lái)說(shuō),圖像分類(lèi)中每類(lèi)需要1,000張圖像。但具體答案顯然取決于模型的復(fù)雜度和容錯(cuò)度。實(shí)際機(jī)器學(xué)習(xí)解決方案中的一些示例表明,數(shù)據(jù)集有各種大小。一個(gè)面部檢測(cè)和識(shí)別系統(tǒng)需要45萬(wàn)張圖像,一個(gè)問(wèn)答聊天機(jī)器人需要接受20萬(wàn)個(gè)問(wèn)題和200萬(wàn)個(gè)匹配答案的訓(xùn)練。根據(jù)要解決的問(wèn)題,有時(shí)較小的數(shù)據(jù)集也足夠。一個(gè)情感分析解決方案(根據(jù)書(shū)面文本確定觀(guān)點(diǎn)的極性)只需要數(shù)萬(wàn)個(gè)樣本。

數(shù)據(jù)的質(zhì)量和數(shù)量同等重要。鑒于訓(xùn)練需要大數(shù)據(jù)集,即使少量的錯(cuò)誤訓(xùn)練數(shù)據(jù)也會(huì)導(dǎo)致糟糕的解決方案。根據(jù)所需的數(shù)據(jù)類(lèi)型,數(shù)據(jù)可能會(huì)經(jīng)歷一個(gè)清洗過(guò)程。此過(guò)程確保數(shù)據(jù)集一致、沒(méi)有重復(fù)數(shù)據(jù)且準(zhǔn)確、完整(沒(méi)有無(wú)效或不完整數(shù)據(jù))。有可以支持此過(guò)程的工具。驗(yàn)證數(shù)據(jù)的偏差也很重要,確保數(shù)據(jù)不會(huì)導(dǎo)致有偏差的機(jī)器學(xué)習(xí)解決方案。

機(jī)器學(xué)習(xí)訓(xùn)練對(duì)數(shù)值型數(shù)據(jù)進(jìn)行運(yùn)算,因此,根據(jù)您的解決方案,可能需要預(yù)處理步驟。例如,如果數(shù)據(jù)是人類(lèi)語(yǔ)言,其必須首先轉(zhuǎn)譯為數(shù)字形式才能處理??梢詫?duì)圖像進(jìn)行預(yù)處理以保持一致性。例如,除了其他運(yùn)算外,輸入深度神經(jīng)網(wǎng)絡(luò)的圖像還需要調(diào)整大小和平滑處理,以去除噪聲。

機(jī)器學(xué)習(xí)中最大的問(wèn)題之一是獲取數(shù)據(jù)集來(lái)訓(xùn)練機(jī)器學(xué)習(xí)解決方案。根據(jù)您的具體問(wèn)題,這個(gè)工作量可能非常大,因?yàn)榭赡軟](méi)有現(xiàn)成的數(shù)據(jù),需要您另外設(shè)法獲取。

最后,應(yīng)該分割數(shù)據(jù)集,分別用作訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)。訓(xùn)練數(shù)據(jù)用于訓(xùn)練模型,在訓(xùn)練完成后,測(cè)試數(shù)據(jù)用于驗(yàn)證解決方案的準(zhǔn)確性(圖2)。

pYYBAGRi4kGAT61TAAEiodwu_eU900.png

圖2:分割數(shù)據(jù)集分別用于訓(xùn)練和驗(yàn)證。(圖源:作者)

有工具來(lái)幫助完成這個(gè)過(guò)程,大多數(shù)框架都擁有“分割”功能,用于分割訓(xùn)練和測(cè)試數(shù)據(jù)?,F(xiàn)在我們來(lái)看一些簡(jiǎn)化機(jī)器學(xué)習(xí)解決方案構(gòu)造的框架。

框架

現(xiàn)在,不再需要從頭開(kāi)始構(gòu)建機(jī)器學(xué)習(xí)模型。您可以使用包含這些模型和其他工具的框架來(lái)準(zhǔn)備數(shù)據(jù)和驗(yàn)證您的解決方案。這些框架還提供用于部署解決方案的環(huán)境。選擇哪個(gè)框架通常取決于您的熟悉程度,但在剛開(kāi)始的時(shí)候可以選擇一個(gè)適合您要使用的應(yīng)用與模型的框架。

TensorFlow是最好的深度學(xué)習(xí)框架。它支持所有流行的模型(CNN、RNN、LSTM等),并允許您使用PythonC++進(jìn)行開(kāi)發(fā)。從高端服務(wù)器到移動(dòng)設(shè)備,均可部署TensorFlow解決方案。如果您剛剛上手,TensorFlow是一個(gè)不錯(cuò)的起點(diǎn),它有教程和豐富的文檔。

CAFFE最初是一個(gè)學(xué)術(shù)項(xiàng)目,但在發(fā)布到開(kāi)源后,已經(jīng)發(fā)展成為一個(gè)流行的深度學(xué)習(xí)框架。CAFFE采用C++編寫(xiě),但也支持Python模型開(kāi)發(fā)。同TensorFlow一樣,它也支持廣泛的深度學(xué)習(xí)模型。

PyTorch的框架中。PyTorch是另一個(gè)很好的選擇,它基于豐富的可用信息,包括構(gòu)建不同類(lèi)型解決方案的實(shí)踐教程。

R語(yǔ)言和環(huán)境是機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)的流行工具。其為交互式工具,可幫助您逐步構(gòu)建解決方案的原型,同時(shí)分階段查看結(jié)果。有了Keras(一個(gè)開(kāi)源的神經(jīng)網(wǎng)絡(luò)庫(kù)),您可以用極少量的開(kāi)發(fā)投入來(lái)構(gòu)建CNN和RNN。

模型審核

一旦模型經(jīng)過(guò)訓(xùn)練并滿(mǎn)足了準(zhǔn)確性要求,即可部署到生產(chǎn)系統(tǒng)中。但是到了這一步就需要審核解決方案,以確保其符合要求。考慮到?jīng)Q策是由模型來(lái)做以及對(duì)人們的影響,這一點(diǎn)尤為重要。

有些機(jī)器學(xué)習(xí)模型是透明的,可以理解(例如,決策樹(shù))。但深度神經(jīng)網(wǎng)絡(luò)等其他模型被認(rèn)為是“黑箱”,決策是由數(shù)百萬(wàn)個(gè)無(wú)法用模型本身解釋的計(jì)算做出的。因此,過(guò)去一度可以接受定期審核,但是,連續(xù)審核正在迅速成為這些暗箱情況下的標(biāo)配,因?yàn)殄e(cuò)誤是不可避免的。一旦發(fā)現(xiàn)錯(cuò)誤,這些信息可以用作調(diào)整模型的數(shù)據(jù)。

另一個(gè)考慮是解決方案的生命周期。模型會(huì)衰退,輸入數(shù)據(jù)會(huì)發(fā)生變化,從而導(dǎo)致模型性能的變化。因此,必須接受解決方案隨著時(shí)間的推移會(huì)變得羸弱,機(jī)器學(xué)習(xí)解決方案必須隨著周?chē)澜绲淖兓粩嘧龀龈淖儭?/p>

總結(jié)

為了部署機(jī)器學(xué)習(xí)解決方案,我們從一個(gè)問(wèn)題開(kāi)始,然后考慮可能的解決模型。接下來(lái)是獲取數(shù)據(jù),經(jīng)過(guò)正確清理和分割,就可以使用機(jī)器學(xué)習(xí)框架訓(xùn)練和驗(yàn)證模型。并非所有的框架都是相同的,您可以根據(jù)您的模型和經(jīng)驗(yàn)來(lái)選擇和應(yīng)用。然后,使用該框架部署機(jī)器學(xué)習(xí)解決方案,通過(guò)適當(dāng)?shù)膶徍?,解決方案可以在真實(shí)世界中使用實(shí)時(shí)數(shù)據(jù)進(jìn)行運(yùn)算。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • C++
    C++
    +關(guān)注

    關(guān)注

    22

    文章

    2119

    瀏覽量

    75304
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8503

    瀏覽量

    134603
  • python
    +關(guān)注

    關(guān)注

    56

    文章

    4827

    瀏覽量

    86735
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    電流鏡設(shè)計(jì)步驟詳解全過(guò)程

    設(shè)計(jì)。電流鏡設(shè)計(jì)步驟詳解全過(guò)程】[/hide]大致內(nèi)容為: 1、邊界條件2、設(shè)計(jì)指標(biāo) 3、確定電路拓?fù)浣Y(jié)構(gòu)4、設(shè)計(jì)變量初始估算5、HSPICE仿真驗(yàn)證6、版圖設(shè)計(jì)7、討論&結(jié)論
    發(fā)表于 11-04 16:31

    熱轉(zhuǎn)印電路板制作全過(guò)程

    熱轉(zhuǎn)印電路板制作全過(guò)程
    發(fā)表于 06-24 00:46

    PCB 制作全過(guò)程

    `PCB 制作全過(guò)程。`
    發(fā)表于 08-05 22:43

    圖文詳解2000元電動(dòng)汽車(chē)DIY全過(guò)程

    `圖文詳解2000元電動(dòng)汽車(chē)DIY全過(guò)程`
    發(fā)表于 08-15 19:05

    音箱制作全過(guò)程

    音箱制作全過(guò)程
    發(fā)表于 08-16 17:00

    有人分享制作藍(lán)牙耳機(jī)的全過(guò)程嗎?

    我想自己制作個(gè)藍(lán)牙耳機(jī),但是技術(shù)不夠,希望有人分享下藍(lán)牙耳機(jī)的制作全過(guò)程,可以是模塊應(yīng)用,最好是從底層開(kāi)始制作的,包括軟件的編寫(xiě)代碼。{:23:}
    發(fā)表于 06-02 18:42

    分享個(gè)串口實(shí)現(xiàn)全過(guò)程好資料

    偶然中看到的篇好資料,不敢獨(dú)享,來(lái)給大家分享下,這里有特別詳細(xì)的串口實(shí)現(xiàn)通信的全過(guò)程,親自操作遍,可零基礎(chǔ)實(shí)現(xiàn)串口通信,希望能幫助到大家!
    發(fā)表于 02-05 17:18

    CPU制造全過(guò)程

    CPU制造全過(guò)程第1頁(yè):由沙到晶圓,CPU誕生全過(guò)程     沙中含有25%的硅,是地殼中第二多元素,在經(jīng)過(guò)氧化之后就成為了二氧化硅,在沙,尤其是石英中二氧
    發(fā)表于 09-22 08:08 ?77次下載

    組裝電腦全過(guò)程視頻教程

    組裝電腦全過(guò)程視頻教程 教你認(rèn)識(shí)電腦主機(jī)各種配件及組裝接線(xiàn)方法
    發(fā)表于 09-14 11:05 ?467次下載

    深入大規(guī)模芯片設(shè)計(jì)全過(guò)程

    介紹了navida公司設(shè)計(jì)圖象處理芯片(GPU)的全過(guò)程,本站對(duì)文章中些專(zhuān)業(yè)內(nèi)容進(jìn)行了修改和補(bǔ)充,讓大家可以對(duì)大規(guī)模芯片設(shè)計(jì)的過(guò)程,以及FPGA在IC設(shè)計(jì)中的作用,有個(gè)形象的
    發(fā)表于 04-10 10:17 ?33次下載

    用C語(yǔ)言開(kāi)發(fā)DSP系統(tǒng)的全過(guò)程的講解

    用C語(yǔ)言開(kāi)發(fā)DSP系統(tǒng)的全過(guò)程的講解。
    發(fā)表于 05-26 14:17 ?22次下載

    手工制作pcb全過(guò)程

    手工制作pcb全過(guò)程介紹。
    發(fā)表于 06-19 10:18 ?0次下載

    芯片制造全過(guò)程

    有人說(shuō)芯片是人類(lèi)最高智慧的代表,很多人都無(wú)法理解,接下來(lái)跟隨小編一起了解芯片的制作全過(guò)程,看完你就懂了。
    的頭像 發(fā)表于 12-08 17:42 ?1.2w次閱讀

    探究芯片制作的全過(guò)程

    有人說(shuō)芯片是人類(lèi)最高智慧的代表,很多人都無(wú)法理解,接下來(lái)跟隨小編一起了解芯片的制作全過(guò)程,看完你就懂了。 芯片的制造過(guò)程:芯片的原料晶圓→晶圓涂膜→晶圓光刻顯影→蝕刻→攙加雜質(zhì)→晶圓測(cè)試→封裝→測(cè)試
    的頭像 發(fā)表于 01-01 17:15 ?8805次閱讀

    電磁爐的維修全過(guò)程分享

    電磁爐的維修全過(guò)程分享
    發(fā)表于 01-10 15:16 ?84次下載