一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

模型不起作用時(shí)的解決辦法

汽車玩家 ? 來源:人工智能遇見磐創(chuàng) ? 作者:人工智能遇見磐創(chuàng) ? 2020-05-04 09:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

你的團(tuán)隊(duì)幾個(gè)月來一直在收集數(shù)據(jù)、構(gòu)建預(yù)測(cè)模型、創(chuàng)建用戶界面,并與一些早期的用戶一起部署新的機(jī)器學(xué)習(xí)產(chǎn)品。但你現(xiàn)在聽到的并不是大家一起慶祝項(xiàng)目勝利的聲音,而是聽到產(chǎn)品經(jīng)理對(duì)那些早期用戶的抱怨,這些早期用戶對(duì)模型精度不滿意并開始認(rèn)為“模型不起作用”。所以你現(xiàn)在應(yīng)該做什么?

我們常常在很多模式識(shí)別實(shí)驗(yàn)室里給相關(guān)組織應(yīng)用機(jī)器學(xué)習(xí)算法到新產(chǎn)品見到這種情況。這不是一個(gè)容易迅速解決的問題。真實(shí)世界的機(jī)器學(xué)習(xí)模型的性能受到許多因素的影響,其中一些因素可能在控制之下,而另一些因素則可能不在控制之下。最重要的是,當(dāng)試圖對(duì)真實(shí)世界的現(xiàn)象建模時(shí),每個(gè)建模問題都有一個(gè)固有的噪聲或隨機(jī)性被混合在信號(hào)中,這使得很難理解我們使用一個(gè)預(yù)測(cè)模型真正能夠達(dá)到的準(zhǔn)確度。再加上用戶對(duì)你的模型準(zhǔn)確性的期望,你的數(shù)據(jù)科學(xué)團(tuán)隊(duì)就突然陷入了一個(gè)棘手的境地,并試圖找出從哪里開始解決問題。

1. 了解要解決的問題

首先要確保團(tuán)隊(duì)對(duì)他們?cè)噲D用模型解決的用戶問題有很好的理解。令人驚訝的是,數(shù)據(jù)科學(xué)團(tuán)隊(duì)對(duì)成功的定義的理解與用戶的標(biāo)準(zhǔn)經(jīng)常不同。最近,我們與一家公司合作,試圖預(yù)測(cè)惡劣天氣對(duì)公用事業(yè)公司運(yùn)營(yíng)的影響。技術(shù)團(tuán)隊(duì)絞盡腦汁想要提高他們模型的MAPE分?jǐn)?shù)。當(dāng)我們深入研究時(shí),我們發(fā)現(xiàn)MAPE根本不是正確的度量標(biāo)準(zhǔn),他們所追求的目標(biāo)是他們自己設(shè)定的(而不是傾聽用戶的意見)。用戶實(shí)際上最關(guān)心的是,我們能夠始終如一地將風(fēng)暴的影響嚴(yán)重程度劃分為1-5級(jí)的能力,這個(gè)劃分是為他們的操作程序定義的。

要確保數(shù)據(jù)科學(xué)團(tuán)隊(duì)對(duì)這個(gè)問題有一個(gè)全面的理解,并且這個(gè)理解最好直接來自用戶,這對(duì)于一個(gè)新計(jì)劃的成功是至關(guān)重要的。如果你的團(tuán)隊(duì)陷入了上面描述的模型“不能工作”的情況,那么第一步就是回去,確保你已經(jīng)正確地定義了問題,并理解你的用戶如何定義成功。

2. 數(shù)據(jù)是否正確、完整?

下一步是回頭查看你的團(tuán)隊(duì)收集的輸入數(shù)據(jù)。通常,在處理復(fù)雜的實(shí)際模型時(shí),模型性能不好的主要原因是由于輸入數(shù)據(jù)集和特征的問題,而不是模型本身。特別是當(dāng)你運(yùn)行多種類型的模型(我們建議你盡可能這樣做)并得到類似的結(jié)果時(shí),這通常是輸入數(shù)據(jù)集的問題。

這一步的一個(gè)關(guān)鍵部分是確保你已經(jīng)收集了盡可能多的相關(guān)數(shù)據(jù)。通常,現(xiàn)實(shí)世界的模式中有一些因素并不總是直觀或者明顯的,因此你可以收集的數(shù)據(jù)和特征越多越好。你可以使用許多技術(shù)來降低特征的選擇,以便在最相關(guān)的特征上構(gòu)建模型,我們將在下一個(gè)步驟中討論這些特征。但是對(duì)于這一步,重點(diǎn)是重新檢查你的假設(shè),哪些輸入的特征影響了你試圖建模的輸出,如果需要,還可以返回以獲取額外的數(shù)據(jù)。例如,當(dāng)試圖為現(xiàn)實(shí)世界的現(xiàn)象建模時(shí),通常需要考慮一些不明顯的因素,因?yàn)檫@些不明顯的因素會(huì)造成影響,特別是異常情況——例如季節(jié)性、天氣、日歷事件,甚至地緣政治事件。

其次,應(yīng)該進(jìn)行一些簡(jiǎn)單的QA檢查,以確保輸入數(shù)據(jù)得到正確映射和處理。最近,我們與一個(gè)想改善模型性能的客戶進(jìn)行了合作,但最終發(fā)現(xiàn)問題根本不是與模型有關(guān)——客戶錯(cuò)誤地處理了一些地理位置的特征數(shù)據(jù),這使得他們運(yùn)行的模型無法識(shí)別正確的模式。

CRISP-DM流程是許多數(shù)據(jù)科學(xué)團(tuán)隊(duì)用于管理項(xiàng)目的最常見框架之一。我們喜歡它的重點(diǎn)在于它確保在深入建模之前就能理解業(yè)務(wù)和數(shù)據(jù)。CRISP-DM過程中的兩個(gè)關(guān)鍵步驟是“數(shù)據(jù)理解”和“數(shù)據(jù)準(zhǔn)備”。正確地遵循這些步驟需要深入研究輸入數(shù)據(jù)以真正地理解它,通常需要可視化數(shù)據(jù)中的分布、趨勢(shì)和關(guān)系?!皵?shù)據(jù)準(zhǔn)備”通常包括預(yù)處理、數(shù)據(jù)擴(kuò)充與標(biāo)準(zhǔn)化,以便為建模做準(zhǔn)備。如果處理得當(dāng),這兩個(gè)步驟可以幫助數(shù)據(jù)科學(xué)家確保輸入數(shù)據(jù)中的錯(cuò)誤不會(huì)導(dǎo)致他以后遇到的任何模型性能問題。

3. 調(diào)整模型提升性能

既然你已經(jīng)盡可能正確和完整地驗(yàn)證了輸入數(shù)據(jù),現(xiàn)在是時(shí)候關(guān)注有趣的東西了——建模本身。這一步中影響最大的部分之一是特征選擇——從上到下選擇最影響輸出的關(guān)鍵特征,并對(duì)這些特征進(jìn)行訓(xùn)練,消除冗余或高度相關(guān)的特征,以提高模型的速度和準(zhǔn)確度。關(guān)于特征選擇技術(shù)有一些很好的博客文章,包括單變量選擇、遞歸特征消除和隨機(jī)森林特征重要性。這里有一個(gè)可供參考:https://machinelearningmastery.com/feature-selection-machine-learning-python/。無論你使用的是哪種技術(shù),或者它們的組合,都要確保在這一步上花費(fèi)時(shí)間,為你的模型獲得特征的最佳組合。

此步驟的另一個(gè)重要部分是重新考慮模型的選擇,或者考慮添加額外的模型類型或組合多個(gè)模型。同樣的,也有許多比較不同模型優(yōu)缺點(diǎn)的好文章,但是我們建議盡可能運(yùn)行至少兩種模型類型(理想情況下,一種是神經(jīng)網(wǎng)絡(luò))來比較結(jié)果。

最后,一旦你的特征和選擇的模型確定了后,重新調(diào)參,并且確保你正確地定義訓(xùn)練集,驗(yàn)證集和測(cè)試集,這代表你在調(diào)參時(shí)并沒有選擇欺詐,所以它在新數(shù)據(jù)上可以泛化的很好,而不是在訓(xùn)練集上表現(xiàn)良好甚至過擬合導(dǎo)致在新數(shù)據(jù)上模型沒有良好的工作。

4. 最后,也是最重要的,管理客戶的期望

這是許多數(shù)據(jù)科學(xué)家忽視的另一個(gè)關(guān)鍵步驟,因?yàn)樗麄冋J(rèn)為這“不是他們的工作”。當(dāng)推出一個(gè)面向世界的新機(jī)器學(xué)習(xí)產(chǎn)品時(shí),模型在真實(shí)世界的性能存在相當(dāng)大的不確定性。此外,如上所述,盡管你盡了最大的努力使準(zhǔn)確度最大化,但是在你正在解決的問題在真實(shí)世界中會(huì)出現(xiàn)的大量噪聲,這可能會(huì)限制模型的性能。所以這個(gè)步驟是數(shù)據(jù)科學(xué)團(tuán)隊(duì)的責(zé)任,需要數(shù)據(jù)科學(xué)團(tuán)隊(duì)去與產(chǎn)品經(jīng)理,銷售人員,客戶正確定義客戶期待在模型中看到的性能,并且在時(shí)間的推移擁有額外的數(shù)據(jù)的情況下,指導(dǎo)他們?nèi)绾稳ビ?xùn)練改善模型。

所以下次你的團(tuán)隊(duì)在模型放入真實(shí)世界里遇到性能問題時(shí),不要玩指責(zé)游戲或直接一頭扎進(jìn)調(diào)參工作進(jìn)行優(yōu)化與擬合,后退一步,跟著這個(gè)簡(jiǎn)單的,結(jié)構(gòu)化的過程一步一步來解決這個(gè)問題,在你的新模型上最大化性能。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3521

    瀏覽量

    50431
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1224

    瀏覽量

    25449
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    wiced_hal_sflash_write在CYW20721B2上不起作用是怎么回事?

    時(shí),寫入不起作用。 邏輯分析儀上沒有保存命令。 我記得在 CYW20706 中必須通過 *((unsigned char*)(0x00201a14)) = 1 解鎖寫入能力;
    發(fā)表于 06-30 06:22

    rt-thread-studio添加任何的軟件包都失敗,更改github或者gitee源都不起作用,有什么解決方案嗎?

    如圖,添加任何的軟件包都失敗,更改github或者gitee源都不起作用,有什么解決方案嗎?
    發(fā)表于 06-13 08:17

    PFC在250W LED驅(qū)動(dòng)器中不起作用是怎么回事?

    PFC 在 250W LED 驅(qū)動(dòng)器中不起作用。 請(qǐng)?jiān)谙旅嬲业皆敿?xì)信息。 PFCVS 時(shí)的 Volt. -1.50 BO-1.80 VCC-18V
    發(fā)表于 05-29 06:12

    使用IntCtrl_IP添加回調(diào)函數(shù)不起作用是怎么回事?

    使用 IntCtrl_IP 添加回調(diào)函數(shù),但它不起作用。 這是我的 LPUART0_ISR 函數(shù) void LPUART0_ISR() { const char* pBuffer = "
    發(fā)表于 04-11 07:38

    GPS北斗定位模塊問題及解決辦法

    GPS北斗定位模塊使用上大多需要配置和設(shè)置下的,因此出現(xiàn)應(yīng)用方面的問題也是可以理解的。以下是常見的問題及其解決辦法: 一、搜不到信號(hào) 問題描述: 在家或個(gè)別位置無法接收到GPS或北斗定位模塊的信號(hào)
    的頭像 發(fā)表于 03-30 07:37 ?1117次閱讀

    板載UART在S32K388中不起作用怎么解決?

    使用 Trace32 調(diào)試相同的項(xiàng)目時(shí),我的串行終端中沒有收到打印消息(我為此目的使用 Tera Term)。板載 UART 在 S32K388 中不起作用,因此我對(duì)連接到電路板 J695引腳組的 TX
    發(fā)表于 03-28 08:13

    外部構(gòu)建器在S32DS 3.6.0中不起作用怎么解決?

    您好 NXP, 安裝 S32DS 3.6.0 后,外部構(gòu)建器(用于 makefile 項(xiàng)目)似乎不起作用,IDE 沒有調(diào)用我的 *.bat 文件。相同的設(shè)置在 3.5.0 中可以正常工作。 我嘗試
    發(fā)表于 03-20 07:06

    STM32G431KBU3只要開中斷HAL_xxxx_Start_IT()就死機(jī)一動(dòng)不動(dòng)了,為什么?

    自己畫的G431KBU3 ,沒有使用外部晶振, 只要在代碼中開啟 中斷, 就是 使用 HAL_xxx_Start_IT 這個(gè)函數(shù), 后面的代碼就不起作用了,卡住了,哪位大師幫忙分析一下原因及解決辦法
    發(fā)表于 03-13 07:49

    PLC異常工作的原因和解決辦法

    PLC(可編程邏輯控制器)異常工作的原因及解決辦法。
    的頭像 發(fā)表于 02-24 17:27 ?1081次閱讀

    常見墊圈故障及解決辦法 防漏墊圈的設(shè)計(jì)與應(yīng)用

    常見墊圈故障及解決辦法 1. 墊圈老化 故障現(xiàn)象: 墊圈因長(zhǎng)時(shí)間使用而老化,失去彈性,導(dǎo)致密封性能下降。 解決辦法: 定期檢查墊圈的老化情況,及時(shí)更換新的墊圈。 2. 墊圈變形 故障現(xiàn)象: 由于安裝
    的頭像 發(fā)表于 12-12 15:31 ?1104次閱讀

    AFE5816的TR_EN為什么不起作用呢?

    相關(guān)寄存器為默認(rèn),REG230的BIT4為0代表由TR_EN[X]引腳決定是否斷開LNA的HPF連接, 但我的TR_EN為什么不起作用呢??如下圖所示
    發(fā)表于 12-09 06:11

    調(diào)試PCM3070的時(shí)候,進(jìn)行通道切換時(shí)不起作用,為什么?

    當(dāng)前在調(diào)試PCM3070的時(shí)候,進(jìn)行通道切換時(shí)不起作用,加載的EQ 數(shù)據(jù)在IN1也都已工作正常。 我的電路工作方式為三個(gè)模擬輸入(IN1,IN2,IN3),一個(gè)模擬輸出(LOL/R),采用DSP做為EQ處理。
    發(fā)表于 11-06 07:16

    常見MCU故障及解決辦法

    微控制器單元(MCU)是現(xiàn)代電子設(shè)備中的核心組件,負(fù)責(zé)處理和控制各種功能。然而,由于各種原因,MCU可能會(huì)出現(xiàn)故障。以下是一些常見的MCU故障及其解決辦法: 1. 電源問題 故障現(xiàn)象: MCU無法
    的頭像 發(fā)表于 11-01 13:41 ?7702次閱讀

    TPA3112D1為什么不起作用了?

    您好,我有一塊TPA3112D1模塊之前用著一直是好的,但是突然就不起作用了,我想知道友們有辦法測(cè)試一下我的芯片是好是壞,是否工作正常??謝謝
    發(fā)表于 09-06 07:45

    ESP8266在任何波特率上都不起作用,為什么?

    現(xiàn)在我的ESP8266在任何波特率上都不起作用,我嘗試了所有這些,但它們都會(huì)產(chǎn)生垃圾。其中一些會(huì)產(chǎn)生垃圾,但我也可以在重置后立即在某些回合率上看到字符串致命錯(cuò)誤 (28)。當(dāng)我連接到 76800
    發(fā)表于 07-22 06:40