Hello 大家好,今天繼續(xù)為大家?guī)韊IQ Time Series Studio系列講解,上期咱們講到“Utilities”模塊中的“Data Labeling”數(shù)據(jù)標(biāo)簽工具。數(shù)據(jù)標(biāo)簽工具使用戶能夠通過可視化界面將相應(yīng)的數(shù)據(jù)標(biāo)簽(如電弧或無電弧)應(yīng)用于當(dāng)前數(shù)據(jù)圖形的不同部分,從而對導(dǎo)入的原始數(shù)據(jù)進(jìn)行分類。然后,該工具根據(jù)標(biāo)簽對原始數(shù)據(jù)進(jìn)行細(xì)分,并創(chuàng)建用于訓(xùn)練機(jī)器學(xué)習(xí)模型的優(yōu)化數(shù)據(jù)集。本節(jié)會繼續(xù)介紹“Utilities”模塊中的“Data Intelligence”數(shù)據(jù)智能工具。
“Data Intelligence”
數(shù)據(jù)智能為用戶提供了一種非常有價(jià)值的工具,它能夠自動(dòng)并智能地分析數(shù)據(jù)集,以完成分類和異常檢測任務(wù)。本節(jié)介紹數(shù)據(jù)集分析的過程,并列出了優(yōu)化和重新收集數(shù)據(jù)的步驟,以提高性能并從分析結(jié)果中獲取更多數(shù)據(jù)信息。
數(shù)據(jù)智能的重要性
用戶通常根據(jù)自身經(jīng)驗(yàn)和對數(shù)據(jù)的了解導(dǎo)入時(shí)間序列數(shù)據(jù)集。然而,由于經(jīng)驗(yàn)和時(shí)間等限制,對數(shù)據(jù)的分析不夠全面無法得出令人滿意的結(jié)果。例如,采樣頻率可能高于相應(yīng)的應(yīng)用需求?;蛘?,對于分類任務(wù),每個(gè)類別的訓(xùn)練數(shù)據(jù)量可能不均衡。為了應(yīng)對這些挑戰(zhàn),數(shù)據(jù)智能工具可以幫助用戶評估數(shù)據(jù)集的平衡性,并確定各個(gè)數(shù)據(jù)通道/軸的重要性。該工具不僅標(biāo)記不平衡的數(shù)據(jù)集,還會建議忽略冗余通道。此外,該工具還可以幫助確定最佳采樣頻率和窗口大小,從而優(yōu)化數(shù)據(jù)集,提高質(zhì)量和分析結(jié)果。
數(shù)據(jù)集配置
第一步是配置導(dǎo)入數(shù)據(jù)的必需參數(shù)(以分類示例中風(fēng)扇狀態(tài)檢測為例)。
輸入以下信息:
數(shù)據(jù)集類型:“Segmented Data”分段數(shù)據(jù)或“Continuous Data”連續(xù)數(shù)據(jù)。
通道數(shù):每個(gè)數(shù)據(jù)點(diǎn)由有多少個(gè)通道組成。
類別數(shù):用戶數(shù)據(jù)需要分析的類別數(shù)。
使用的采樣頻率:用戶原始數(shù)據(jù)的采樣頻率。
最小頻率:可設(shè)置的最低分頻系數(shù)。
設(shè)置完成后,點(diǎn)擊“Confirm”按鈕,若有設(shè)置錯(cuò)誤,可點(diǎn)擊“Reset”并重新配置。
設(shè)置通道數(shù)后,用戶可以為每個(gè)通道分配單獨(dú)的別名,有助于區(qū)分各個(gè)通道并便于用戶理解分析報(bào)告。
數(shù)據(jù)集導(dǎo)入
數(shù)據(jù)集配置后,導(dǎo)入用戶數(shù)據(jù):
點(diǎn)擊每個(gè)類別旁邊的“+”按鈕彈出文件選擇窗口并加載文件。文件中的分隔符、行數(shù)和列數(shù)都會被自動(dòng)識別。
請確保每個(gè)文件符合指定的設(shè)置:當(dāng)數(shù)據(jù)分段時(shí),列數(shù)必須等于窗口大小乘以通道數(shù)。當(dāng)數(shù)據(jù)連續(xù)時(shí),列數(shù)必須等于通道數(shù)。同時(shí)還可以修改每個(gè)類別的別名,以便于標(biāo)注各類別的表現(xiàn)。
完成這些步驟后,點(diǎn)擊“START DATA ANALYSIS”按鈕,繼續(xù)進(jìn)行數(shù)據(jù)分析并生成報(bào)告。
數(shù)據(jù)分析報(bào)告
點(diǎn)擊“START DATA ANALYSIS”按鈕后,啟動(dòng)分析,系統(tǒng)會自動(dòng)處理數(shù)據(jù),然后顯示分析結(jié)果。
Segmented Data數(shù)據(jù)分析報(bào)告
Segmented Data數(shù)據(jù)分析報(bào)告主要包括:數(shù)據(jù)平衡,通道相關(guān)性,通道重要性和最佳采樣參數(shù)分析。
Data Balance-數(shù)據(jù)平衡
用五星對數(shù)據(jù)量的平衡進(jìn)行評價(jià),點(diǎn)亮的星數(shù)越多,表明各分類的數(shù)據(jù)集量越平衡。
Channel Correlation-通道相關(guān)性
僅適用于通道數(shù) >= 2 的情況。
顯示混淆矩陣表,說明不同通道之間的相關(guān)值。
絕對值越高,通道之間的相關(guān)性越高。值越接近于零,表示通道彼此獨(dú)立。該信息可用于識別并可能刪除冗余通道。刪除冗余通道有助于優(yōu)化數(shù)據(jù)集以用于訓(xùn)練步驟。
Channel Importance-通道重要性
僅適用于分段數(shù)據(jù)集。
僅適用于通道數(shù) >= 2 的情況。
在排名欄中顯示每個(gè)通道的重要性得分,分?jǐn)?shù)越高說明該通道越重要。
Best Sampling Params-最佳采樣參數(shù)
采樣頻率:輸出原始采樣頻率的推薦分頻。此建議旨在幫助消除數(shù)據(jù)中潛在的高頻噪聲成分。通過這種方式降低頻率,用戶可以節(jié)省資源和功耗,同時(shí)保留基本信息。
窗口大?。狠敵鐾扑]的窗口大小。對于分段數(shù)據(jù),此大小保持不變,僅適用于連續(xù)數(shù)據(jù)。
采樣時(shí)長:單個(gè)樣本數(shù)據(jù)的采樣時(shí)間。
Continuous Data數(shù)據(jù)分析報(bào)告
前面主要介紹導(dǎo)入“Segmented”數(shù)據(jù)后的數(shù)據(jù)分析報(bào)告,而導(dǎo)入“Continuous”的數(shù)據(jù)分析報(bào)告略有不同,如“Best Sampling Params”功能描述
在窗口大小和采樣頻率矩陣中,最推薦使用采樣頻率fs/1和窗口大小64的組合。
區(qū)分度:僅適用于連續(xù)數(shù)據(jù)。輸出在最佳分段窗口大小和采樣頻率下連續(xù)數(shù)據(jù)的數(shù)據(jù)區(qū)分度。
用戶可以將連續(xù)數(shù)據(jù)導(dǎo)入到“ Data Operation”中。使用生成數(shù)據(jù)樣本并嘗試推薦的采樣參數(shù),生成用于機(jī)器學(xué)習(xí)的樣本數(shù)據(jù)集。如果推薦的采樣頻率不是fs/1,則數(shù)據(jù)會根據(jù)分頻和推薦的窗口大小進(jìn)行降采樣。例如,如果智能分析后得到的分頻為fs/2,則數(shù)據(jù)集將按如下方式進(jìn)行降采樣并保存。
最后,用戶可以選擇“quality”并點(diǎn)擊 “Save PDF”按鈕將分析報(bào)告保存在本地PC中。
結(jié)論
該數(shù)據(jù)智能工具可自動(dòng)生成數(shù)據(jù)集質(zhì)量報(bào)告,并向用戶提供反饋,無需恩智浦的直接工程支持。分析的功能包括數(shù)據(jù)平衡、通道相關(guān)性、通道重要性、最佳采樣參數(shù)和窗長。這些功能使用戶能夠就數(shù)據(jù)重新收集或重新格式化做出明智的決策,確保其數(shù)據(jù)集處于最佳狀態(tài)以供后續(xù)處理。
-
恩智浦
+關(guān)注
關(guān)注
14文章
5981瀏覽量
116947 -
Studio
+關(guān)注
關(guān)注
2文章
210瀏覽量
29787 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8503瀏覽量
134646 -
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1224瀏覽量
25457
原文標(biāo)題:eIQ Time Series Studio 工具使用攻略(十)-數(shù)據(jù)智能
文章出處:【微信號:NXP_SMART_HARDWARE,微信公眾號:恩智浦MCU加油站】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
恩智浦eIQ Time Series Studio 工具使用攻略(四)-數(shù)據(jù)導(dǎo)入

恩智浦eIQ Time Series Studio工具使用教程之數(shù)據(jù)記錄

恩智浦車規(guī)級深度學(xué)習(xí)工具包使新一代汽車應(yīng)用性能提高30倍
NXP eIQ Time Series Studio 工具使用攻略(九)-數(shù)據(jù)標(biāo)簽

恩智浦eIQ Time Series Studio工具使用教程之數(shù)據(jù)操作

恩智浦eIQ? Neutron神經(jīng)處理單元
NVIDIA TAO工具套件功能與恩智浦eIQ機(jī)器學(xué)習(xí)開發(fā)環(huán)境的集成
恩智浦eIQ AI和機(jī)器學(xué)習(xí)開發(fā)軟件增加兩款新工具
恩智浦eIQ Time Series Studio的工作流程

恩智浦eIQ Time Series Studio工具使用教程之模型訓(xùn)練

恩智浦eIQ Time Series Studio工具使用教程之仿真

評論