一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

嵌入式AI技術(shù)漫談:怎么為訓(xùn)練AI模型采集樣本數(shù)據(jù)

瑞薩MCU小百科 ? 來(lái)源:瑞薩MCU小百科 ? 2025-06-11 16:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Q

需要為嵌入式AI模型提供多少樣本數(shù)據(jù)?

我在向客戶(hù)介紹如何使用AI方法設(shè)計(jì)一款客戶(hù)產(chǎn)品時(shí),客戶(hù)理解,AI嵌入式項(xiàng)目的開(kāi)發(fā)都是圍繞數(shù)據(jù)展開(kāi)的,如此,我經(jīng)常會(huì)被問(wèn)到這樣的問(wèn)題:客戶(hù)的工程師需要采集多少數(shù)據(jù),才能形成合適的樣本集,進(jìn)而開(kāi)始訓(xùn)練模型呢?

此時(shí),回答“按需提供”或者“先試試看”似乎會(huì)變成一句車(chē)轱轆話(huà),看似回答了問(wèn)題,但客戶(hù)還是無(wú)從下手。

AI數(shù)據(jù)樣本的三個(gè)原則

這里,我以教孩子認(rèn)識(shí)蘋(píng)果和鴨梨為例進(jìn)行說(shuō)明。假設(shè)一個(gè)小孩子不認(rèn)識(shí)蘋(píng)果和鴨梨,在對(duì)真正的水果和鴨梨做判斷之前,我們只有一些蘋(píng)果和鴨梨的圖片可供孩子學(xué)習(xí),此時(shí)可以做類(lèi)比:

孩子用來(lái)記憶知識(shí)的大腦就是AI

預(yù)先準(zhǔn)備好的圖片就是樣本

通過(guò)照片學(xué)習(xí)的過(guò)程就是訓(xùn)練

脫離照片之后真的在一推水果里能挑選出蘋(píng)果和鴨梨的過(guò)程,就是推理過(guò)程。

好了,我們開(kāi)始分析。

合適的AI數(shù)據(jù)集中的樣本數(shù)據(jù),需要滿(mǎn)足如下的三個(gè)原則:

獨(dú)立性。在訓(xùn)練的初期,盡量選擇用正常的蘋(píng)果鴨梨的照片給孩子用于學(xué)習(xí),盡量避免使用各種畸形或者怪異的樣本影響孩子的第一印象。如果客觀存在似是而非的情況,我們甚至可以專(zhuān)門(mén)為這些特殊的樣本設(shè)計(jì)第三個(gè)分類(lèi)“不確定”,從而避免對(duì)正常樣本的判斷。

平衡性。在提供樣本數(shù)量上,盡量讓不同分類(lèi)的樣本平均分配,例如,如果提供100張?zhí)O果和100張鴨梨的照片,孩子能夠公平地對(duì)蘋(píng)果和鴨梨都建立相當(dāng)?shù)挠∠?。但如果?00張?zhí)O果和1張鴨梨的照片提供給孩子學(xué)習(xí),孩子對(duì)蘋(píng)果的印象更加深刻而忽略掉那唯一的一張鴨梨的照片。在實(shí)際判別時(shí),也會(huì)更傾向于將他看到的任何類(lèi)似的水果判定為蘋(píng)果。

顯著統(tǒng)計(jì)性。由于樣本是人工或者外力參與標(biāo)定的,在反應(yīng)客觀規(guī)律的時(shí)候,也可能存在系統(tǒng)偏差,出現(xiàn)少量的異常,或者在信號(hào)分析的領(lǐng)域里稱(chēng)為“噪聲點(diǎn)”。因此,在用于訓(xùn)練AI模型之前對(duì)數(shù)據(jù)進(jìn)行預(yù)處理的環(huán)節(jié),也會(huì)利用統(tǒng)計(jì)學(xué)規(guī)律對(duì)數(shù)據(jù)進(jìn)行初步篩選,例如,使用正態(tài)分布的規(guī)律,對(duì)某一分類(lèi)下的所有樣本中,遠(yuǎn)離平均水平(明顯不靠譜)的數(shù)據(jù)剔除,否則在后期訓(xùn)練中容易出現(xiàn)“過(guò)擬合”的情況,從而導(dǎo)致最終訓(xùn)練的AI模型的規(guī)模異常增大,并且也有可能偏離實(shí)際的規(guī)律。

在具體實(shí)踐過(guò)程中,需要系統(tǒng)專(zhuān)家設(shè)計(jì)好標(biāo)定環(huán)境,需要人工標(biāo)注樣本數(shù)據(jù)的分類(lèi),相當(dāng)于,先為測(cè)試考核提供提供參考答案。這涉及到硬件電路系統(tǒng)和軟件工具鏈的搭建工作。

然后,在滿(mǎn)足這三個(gè)的基礎(chǔ)上,可以根據(jù)實(shí)際情況采集少量樣本。實(shí)際上,嵌入式系統(tǒng)的數(shù)據(jù)量通常都比較大產(chǎn)生速度也比較快,例如,在使用AI方法在拉弧檢測(cè)的應(yīng)用中,使用500KSps的ADC采樣率,每秒鐘就可以采集到一條包含50萬(wàn)個(gè)數(shù)據(jù)點(diǎn)的,而用于判定拉弧的采樣窗口大多在1ms以?xún)?nèi),500個(gè)采樣點(diǎn)就可以構(gòu)成一個(gè)標(biāo)定為“有拉弧”或者“無(wú)拉弧”的樣本,如果不考慮窗口重疊的情況,每秒鐘就至少可以產(chǎn)生1千條樣本。如此可以看出,在初期很容易獲得數(shù)量相當(dāng)?shù)臉颖尽?/p>

之后,算法工程師使用獲取的樣本集構(gòu)建AI模型并訓(xùn)練,試著描述樣本數(shù)據(jù)的規(guī)律,通過(guò)分析模型的訓(xùn)練結(jié)果(例如準(zhǔn)確率、推理時(shí)間等性能),對(duì)進(jìn)一步采集數(shù)據(jù)提供指導(dǎo)。

如此反復(fù)多次,直到AI模型的準(zhǔn)確率、性能等指標(biāo)達(dá)到預(yù)期,即可收斂。

通過(guò)迭代摸索數(shù)據(jù)的門(mén)道

所以,簡(jiǎn)而言之的回答,還是“先采集數(shù)據(jù),試試看訓(xùn)練模型,然后逐漸摸索出門(mén)道,在循環(huán)迭代的過(guò)程中完善數(shù)據(jù)集,最終達(dá)到產(chǎn)品要求即可”。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 嵌入式AI
    +關(guān)注

    關(guān)注

    0

    文章

    36

    瀏覽量

    1170
  • AI大模型
    +關(guān)注

    關(guān)注

    0

    文章

    376

    瀏覽量

    618

原文標(biāo)題:嵌入式AI技術(shù)漫談——為訓(xùn)練AI模型采集樣本數(shù)據(jù)

文章出處:【微信號(hào):瑞薩MCU小百科,微信公眾號(hào):瑞薩MCU小百科】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    Deepseek海思SD3403邊緣計(jì)算AI產(chǎn)品系統(tǒng)

    海思SD3403邊緣計(jì)算AI框架,提供了一套開(kāi)放AI訓(xùn)練產(chǎn)品工具包,解決客戶(hù)低成本AI系統(tǒng),針對(duì)差異化
    發(fā)表于 04-28 11:05

    海思SD3403邊緣計(jì)算AI數(shù)據(jù)訓(xùn)練概述

    模型,將模型轉(zhuǎn)化為嵌入式AI模型模型升級(jí)AI攝像
    發(fā)表于 04-28 11:11

    為什么需要嵌入式AI?

    為什么需要嵌入式AI嵌入式AI還有瓶頸半導(dǎo)體廠商的新商機(jī)
    發(fā)表于 01-22 06:14

    嵌入式AI平臺(tái)有哪些?

    11.2.2 修剪神經(jīng)網(wǎng)絡(luò) 21.2.3 嵌入式終端優(yōu)化 21.3 GPU 21.4 ARM 31.5 FPGA結(jié)構(gòu)的并行計(jì)算 41.5.1 介紹 41.5.2 流水線計(jì)算 41.5.3 分布流水線計(jì)...
    發(fā)表于 10-27 06:45

    如何去使用STM32CubeMX.AI嵌入式設(shè)備呢

    STM32CubeMX.AI嵌入式設(shè)備有何特點(diǎn)?如何去使用STM32CubeMX.AI嵌入式設(shè)備呢?
    發(fā)表于 11-19 07:12

    嵌入式AI的相關(guān)資料下載

    一、嵌入式AI概述大部分神經(jīng)網(wǎng)絡(luò)計(jì)算都在卷積層,基本上99%都在卷積層,二、模型加速2-1.權(quán)值量化tengine量化后的準(zhǔn)確率之下降了1.5%。2-2.網(wǎng)絡(luò)剪枝2-3.知識(shí)蒸餾大網(wǎng)絡(luò)是一個(gè)老師
    發(fā)表于 12-14 06:57

    如何將AI模型部署到嵌入式系統(tǒng)中

    本期我們分享主題是如何將 AI 模型部署到嵌入式系統(tǒng)中,下一期將介紹如何在 RT-Thread 操作系統(tǒng)上運(yùn)行 Mnist Demo(手寫(xiě)數(shù)字識(shí)別)。 嵌入式關(guān)聯(lián) AIAI落地一直是一
    發(fā)表于 12-14 07:55

    STM32Cube.AI工具包使用初探

    嵌入式MCU上跑AI模型了,買(mǎi)了一塊開(kāi)發(fā)板來(lái)做一些嘗試,做一下記錄。我所使用的Nucleo開(kāi)發(fā)板,MCUSTM32F767ZITCube.AI
    發(fā)表于 02-22 06:50

    嵌入式AI技術(shù)提升智能硬件應(yīng)用能力

    本帖最后由 我愛(ài)方案網(wǎng) 于 2022-10-9 14:34 編輯 嵌入式AI的出現(xiàn)是最近幾年的事情,但已成為市場(chǎng)的一個(gè)營(yíng)銷(xiāo)熱點(diǎn),在未來(lái)的產(chǎn)品市場(chǎng)占有率中正扮演關(guān)鍵角色。因此,在智能家居、智能
    發(fā)表于 10-09 14:33

    嵌入式邊緣AI應(yīng)用開(kāi)發(fā)指南

    、針對(duì)性能和精度目標(biāo)對(duì)模型進(jìn)行訓(xùn)練和優(yōu)化,以及學(xué)習(xí)使用在嵌入式邊緣處理器上部署模型的專(zhuān)用工具。從模型選擇到在處理器上部署,TI可免費(fèi)提供相關(guān)
    發(fā)表于 11-03 06:53

    ST MCU邊緣AI開(kāi)發(fā)者云 - STM32Cube.AI

    意法半導(dǎo)體(ST)嵌入式AI開(kāi)發(fā)人員和數(shù)據(jù)科學(xué)家擴(kuò)展了面向嵌入式AI開(kāi)發(fā)人員和
    發(fā)表于 02-02 09:52

    AI技術(shù)導(dǎo)向的嵌入式應(yīng)用現(xiàn)在發(fā)展如何

    隨著許多嵌入式系開(kāi)始變得智能且自主,El-Ouazzane預(yù)計(jì)以AI導(dǎo)向的嵌入式系統(tǒng)即將爆發(fā)。
    發(fā)表于 11-22 08:36 ?1394次閱讀

    嵌入式UI架構(gòu)設(shè)計(jì)漫談

    嵌入式UI架構(gòu)設(shè)計(jì)漫談
    發(fā)表于 11-03 17:36 ?15次下載
    <b class='flag-5'>嵌入式</b>UI架構(gòu)設(shè)計(jì)<b class='flag-5'>漫談</b>

    嵌入式ai應(yīng)用開(kāi)發(fā)

    AI算法在特定的嵌入式平臺(tái)上進(jìn)行部署,完成相應(yīng)的任務(wù),也就是邊緣計(jì)算。 AI模型可以認(rèn)為是一個(gè)非常復(fù)雜的非線性函數(shù),暫時(shí)理論上還不能給出解析解。這個(gè)
    的頭像 發(fā)表于 12-13 15:07 ?2284次閱讀

    嵌入式AI技術(shù)漫談 如何組建一個(gè)AI項(xiàng)目開(kāi)發(fā)小組

    解決具體的問(wèn)題,每個(gè)問(wèn)題出的場(chǎng)景各有不同,難有成例,都需要投入必要的人手執(zhí)行開(kāi)發(fā)工作。 嵌入式AI項(xiàng)目當(dāng)中,幾乎所有的開(kāi)發(fā)任務(wù)都將圍繞數(shù)據(jù)展開(kāi)。數(shù)據(jù)來(lái)源的差異性決定了每個(gè)
    的頭像 發(fā)表于 06-11 16:34 ?658次閱讀