一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何在任何機(jī)器學(xué)習(xí)項(xiàng)目開始時(shí)預(yù)見對(duì)后續(xù)更新的需求

倩倩 ? 來源:AI科技大本營 ? 2020-03-25 16:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

高效的機(jī)器學(xué)習(xí)模型需要高質(zhì)量的數(shù)據(jù)。訓(xùn)練你的機(jī)器學(xué)習(xí)模型并不是過程中的單個(gè)有限階段。即使將其部署到生產(chǎn)環(huán)境中,也可能需要穩(wěn)定的新訓(xùn)練數(shù)據(jù)流來確保模型隨時(shí)間推移的預(yù)測(cè)準(zhǔn)確性。

畢竟,訓(xùn)練數(shù)據(jù)會(huì)顯式地調(diào)用數(shù)據(jù)集中的屬性,這些屬性代表外部世界中不斷變化的基本事實(shí)。如果不進(jìn)行周期性的重新訓(xùn)練,隨著現(xiàn)實(shí)世界變量的演變,模型的準(zhǔn)確性自然會(huì)隨時(shí)間下降。

在本文中,我們將討論為什么不管你的初始訓(xùn)練數(shù)據(jù)過程多么嚴(yán)格,繼續(xù)訓(xùn)練你的機(jī)器學(xué)習(xí)模型都是至關(guān)重要的。我們還將討論再訓(xùn)練的方法以及每種方法的優(yōu)點(diǎn)。

最后,我們將介紹如何在任何機(jī)器學(xué)習(xí)項(xiàng)目開始時(shí)預(yù)見對(duì)后續(xù)更新的需求。通過從一開始就建立再訓(xùn)練流程,幫你設(shè)計(jì)一個(gè)可持續(xù)的預(yù)測(cè)模型。

數(shù)據(jù)漂移與再訓(xùn)練需求

為什么大多數(shù)機(jī)器學(xué)習(xí)模型都需要更新才能保持準(zhǔn)確性?答案在于訓(xùn)練數(shù)據(jù)的性質(zhì)以及它如何告知機(jī)器學(xué)習(xí)模型的預(yù)測(cè)功能。

訓(xùn)練數(shù)據(jù)是一個(gè)靜態(tài)數(shù)據(jù)集,機(jī)器學(xué)習(xí)模型可從該數(shù)據(jù)集中推斷出模式和關(guān)系,并形成對(duì)未來的預(yù)測(cè)。

隨著現(xiàn)實(shí)世界條件的變化,訓(xùn)練數(shù)據(jù)的基本事實(shí)方面表示可能會(huì)不太準(zhǔn)確。想象一下用于預(yù)測(cè)50個(gè)大型都會(huì)區(qū)租金成本的機(jī)器學(xué)習(xí)模型。從2000年到2019年的訓(xùn)練數(shù)據(jù)可能會(huì)以驚人的準(zhǔn)確性預(yù)測(cè)2020年的租金價(jià)格。在預(yù)測(cè)2050年的租金價(jià)格時(shí),這種方法可能會(huì)不太有效,因?yàn)榉康禺a(chǎn)市場(chǎng)的基本性質(zhì)可能在未來幾十年內(nèi)發(fā)生變化。

應(yīng)用自然語言處理(NLP)來訓(xùn)練聊天機(jī)器人提供了數(shù)據(jù)漂移的另一個(gè)有用的例子。我們使用語言的方式正在不斷演變,因此必須更新用于聊天機(jī)器人的訓(xùn)練數(shù)據(jù)的語義分析,來反映當(dāng)前的語言。想象一下,嘗試使用1980年代的培訓(xùn)數(shù)據(jù)來訓(xùn)練聊天機(jī)器人與現(xiàn)代消費(fèi)者進(jìn)行互動(dòng)。在40年中,語言可能會(huì)發(fā)生重大變化,這迫使人們需要更新訓(xùn)練數(shù)據(jù)。

這一現(xiàn)象已經(jīng)有了多種描述方法,包括數(shù)據(jù)漂移、概念漂移和模型衰減。不管你怎么稱呼它,它都代表了機(jī)器學(xué)習(xí)的硬道理:在未來的某個(gè)時(shí)候,你的訓(xùn)練數(shù)據(jù)將不再為準(zhǔn)確的預(yù)測(cè)提供基礎(chǔ)。

如何應(yīng)對(duì)這個(gè)不可避免的挑戰(zhàn)呢?答案是定期使用新的或擴(kuò)展的數(shù)據(jù)重新訓(xùn)練你的模型。實(shí)際上,訓(xùn)練你的模型是一個(gè)持續(xù)的過程,特別是在質(zhì)量要求很高的情況下。

你應(yīng)該如何更新你的機(jī)器學(xué)習(xí)模型?簡(jiǎn)單來說,你有兩個(gè)選擇:使用更新的輸入手動(dòng)重新訓(xùn)練模型,或構(gòu)建一個(gè)旨在從新數(shù)據(jù)中不斷學(xué)習(xí)的模型。

手動(dòng)模型重新訓(xùn)練方法

手動(dòng)更新機(jī)器學(xué)習(xí)模型的方法本質(zhì)上是復(fù)制你的初始訓(xùn)練數(shù)據(jù)過程,但要使用一組更新的數(shù)據(jù)輸入。在這種情況下,你可以決定如何以及何時(shí)向算法提供新數(shù)據(jù)。

此選項(xiàng)的可行性取決于你定期獲取和準(zhǔn)備新訓(xùn)練數(shù)據(jù)的能力。你可以隨時(shí)監(jiān)控模型的性能,確定何時(shí)需要更新。如果模型的準(zhǔn)確性明顯下降,則可能需要對(duì)更新的數(shù)據(jù)進(jìn)行重新訓(xùn)練。

這種方法的優(yōu)點(diǎn)之一是修修補(bǔ)補(bǔ)通??梢詭碚嬷埔姾蛣?chuàng)新。如果密切監(jiān)視模型并找出缺點(diǎn),你可能會(huì)發(fā)現(xiàn)包含額外數(shù)據(jù)或以更基本的方式修改算法的價(jià)值。

模型訓(xùn)練的持續(xù)學(xué)習(xí)方法

持續(xù)學(xué)習(xí)模型通常會(huì)從部署了數(shù)據(jù)的生產(chǎn)環(huán)境中合并新的數(shù)據(jù)流。

消費(fèi)者每天都會(huì)參與持續(xù)學(xué)習(xí)的機(jī)器學(xué)習(xí)模型。以音樂流媒體平臺(tái)Spotify為例,該平臺(tái)使用協(xié)作過濾功能,根據(jù)具有相似愛好的其他用戶的偏好向用戶提供推薦,來創(chuàng)造價(jià)值和競(jìng)爭(zhēng)優(yōu)勢(shì)。

當(dāng)Spotify用戶收聽音樂時(shí),與他們的選擇有關(guān)的數(shù)據(jù)會(huì)反饋到公司的預(yù)測(cè)算法中。由此產(chǎn)生的反饋循環(huán)完善了該應(yīng)用為其用戶提供的推薦,并允許高級(jí)個(gè)性化設(shè)置,例如機(jī)器生成的個(gè)性化播放列表。Netflix等其他領(lǐng)先的消費(fèi)媒體服務(wù)提供商也使用類似的持續(xù)學(xué)習(xí)系統(tǒng)。

如你所料,構(gòu)建這些系統(tǒng)所需的技術(shù)專業(yè)知識(shí)和資源對(duì)于許多組織來說根本無法滿足。此外,你需要穩(wěn)定的數(shù)據(jù)流來進(jìn)行自動(dòng)集成。在持續(xù)學(xué)習(xí)模型中,人為干預(yù)是可能的,但它代表了一個(gè)真正的瓶頸。例如,Spotify在將其數(shù)百萬用戶生成的數(shù)據(jù)反饋回其算法之前,不需要對(duì)其進(jìn)行清理或格式化。

無論是手動(dòng)更新還是持續(xù)學(xué)習(xí)似乎都是更有效(可行)的選擇,你需要從戰(zhàn)略上考慮用于生成新數(shù)據(jù)來進(jìn)行再培訓(xùn)的勞動(dòng)力和技術(shù)。如果你打算在可預(yù)見的將來使用你的模型,則需要合適的資源來保持該模型最新。

預(yù)測(cè)進(jìn)化:選擇團(tuán)隊(duì)

創(chuàng)建訓(xùn)練數(shù)據(jù)需要人員、流程和工具的戰(zhàn)略組合。要解決收集、清理和標(biāo)記數(shù)據(jù)的模糊性,你需要一個(gè)高效的技術(shù)人員團(tuán)隊(duì),其中包括熟練的技術(shù)人員和先進(jìn)的技術(shù)。

許多組織無法管理或擴(kuò)展內(nèi)部團(tuán)隊(duì)來準(zhǔn)備訓(xùn)練數(shù)據(jù),因此他們尋求利用人類智能的替代方法。眾包勞動(dòng)力是一種常見選擇,它使你可以在短時(shí)間內(nèi)找到數(shù)百名匿名工人。

然而,匿名眾包帶來了隱性成本,包括與員工的溝通不暢,這可能導(dǎo)致工作質(zhì)量低下。而且,如果在開發(fā)初期訓(xùn)練數(shù)據(jù)集時(shí)這些缺點(diǎn)很明顯,那么當(dāng)你嘗試重新訓(xùn)練和更新模型時(shí),這些缺點(diǎn)將讓人特別沮喪。

在一群匿名的眾包工人的情況下,幾乎不可能進(jìn)行監(jiān)督或轉(zhuǎn)移機(jī)構(gòu)記憶。每次開發(fā)新的訓(xùn)練數(shù)據(jù)時(shí),都有發(fā)現(xiàn)新的不一致和性能問題的風(fēng)險(xiǎn)。

或許你也可以選擇另一種方式,將這個(gè)問題外包給靠譜的、專業(yè)解決這種問題的企業(yè),會(huì)更有保障。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    在任何平臺(tái)上使用PetaLinux的先決條件

    本篇文章介紹了在任何平臺(tái)上使用 PetaLinux 的先決條件。PetaLinux 是一種嵌入式 Linux 軟件開發(fā)套件 (SDK),主要用于基于 FPGA 的系統(tǒng)級(jí)芯片 (SoC) 設(shè)計(jì)或 FPGA 設(shè)計(jì)。
    的頭像 發(fā)表于 04-24 10:40 ?588次閱讀
    <b class='flag-5'>在任何</b>平臺(tái)上使用PetaLinux的先決條件

    如何成為一名合格的KaihongOS北向應(yīng)用開發(fā)工程師

    開發(fā)者社區(qū),與其他開發(fā)者交流經(jīng)驗(yàn)。 開源貢獻(xiàn):參與開源項(xiàng)目,貢獻(xiàn)代碼或文檔,以提升個(gè)人技能和社區(qū)影響力。 9. 持續(xù)學(xué)習(xí) 技術(shù)更新:跟蹤 KaihongOS 和相關(guān)技術(shù)的最新消息和更新
    發(fā)表于 04-23 06:46

    S32K118EVB-Q064如何在firs幀后停止tx?

    您好,我需要使用 CAN2.0 標(biāo)準(zhǔn) ID。我需要每 500 毫秒發(fā)送一個(gè)數(shù)據(jù)幀,但是當(dāng)傳輸開始時(shí),micro 不會(huì)在第一幀后停止,而是始終在傳輸。我正在使用 S32K118EVB-Q064。 如何在 firs 幀后停止 tx?
    發(fā)表于 04-09 07:22

    可以在任何FLEXCOMM接口上使用MDIO嗎?

    我正在使用 NXP LPC55S28JBD100與 I2C 和 MDIO 設(shè)備通信。在MCUXpresso IDE的PINS工具中,我在FLEXCOMM3顯示屏中看到引腳列為MDIO和MDC。FLEXCOMM3 可以作為 MDIO 主站運(yùn)行嗎?或者,我可以在任何 FLEXCOMM 接口上使用 MDIO 嗎?
    發(fā)表于 04-08 07:52

    人臉識(shí)別指南:如何在樹莓派上安裝和設(shè)置 Dlib

    學(xué)習(xí)何在樹莓派上安裝Dlib并配置人臉識(shí)別功能,為您的AI項(xiàng)目奠定基礎(chǔ)。在樹莓派上安裝Dlib的詳細(xì)步驟要為樹莓派安裝Dlib并確保人臉識(shí)別項(xiàng)目順利運(yùn)行,請(qǐng)按照以下詳細(xì)步驟操作。前置
    的頭像 發(fā)表于 03-24 17:31 ?768次閱讀
    人臉識(shí)別指南:如<b class='flag-5'>何在</b>樹莓派上安裝和設(shè)置 Dlib

    如何成為一名合格的北向應(yīng)用開發(fā)工程師

    :了解API的分類,在不同級(jí)別的應(yīng)用中使用不同級(jí)別的API。 系統(tǒng)級(jí)API :了解如何在系統(tǒng)應(yīng)用中使用系統(tǒng)API。 4. 實(shí)踐經(jīng)驗(yàn) 項(xiàng)目實(shí)踐 :通過實(shí)際項(xiàng)目來應(yīng)用你的知識(shí)。從小項(xiàng)目
    發(fā)表于 01-10 10:00

    《具身智能機(jī)器人系統(tǒng)》第7-9章閱讀心得之具身智能機(jī)器人與大模型

    將自然語言理解與運(yùn)動(dòng)規(guī)劃融為一體。這種端到端的方法使機(jī)器人能夠直接從人類指令生成動(dòng)作序列,大幅簡(jiǎn)化了控制流程。該項(xiàng)目的工作流程包含設(shè)計(jì)并封裝一個(gè)人機(jī)器人函數(shù)庫、編寫清晰地描述提示詞、在仿真環(huán)境中執(zhí)行
    發(fā)表于 12-24 15:03

    什么是機(jī)器學(xué)習(xí)?通過機(jī)器學(xué)習(xí)方法能解決哪些問題?

    來源:Master編程樹“機(jī)器學(xué)習(xí)”最初的研究動(dòng)機(jī)是讓計(jì)算機(jī)系統(tǒng)具有人的學(xué)習(xí)能力以便實(shí)現(xiàn)人工智能。因?yàn)闆]有學(xué)習(xí)能力的系統(tǒng)很難被認(rèn)為是具有智能的。目前被廣泛采用的
    的頭像 發(fā)表于 11-16 01:07 ?965次閱讀
    什么是<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>?通過<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>方法能解決哪些問題?

    NPU與機(jī)器學(xué)習(xí)算法的關(guān)系

    在人工智能領(lǐng)域,機(jī)器學(xué)習(xí)算法是實(shí)現(xiàn)智能系統(tǒng)的核心。隨著數(shù)據(jù)量的激增和算法復(fù)雜度的提升,對(duì)計(jì)算資源的需求也在不斷增長(zhǎng)。NPU作為一種專門為深度學(xué)習(xí)機(jī)
    的頭像 發(fā)表于 11-15 09:19 ?1216次閱讀

    TPS76333加電開始時(shí)工作正常,工作一段時(shí)間就發(fā)熱,為什么?

    我的TPS76333加電開始時(shí)工作正常,工作一段時(shí)間就發(fā)熱,其負(fù)載只有液晶屏和藍(lán)牙芯片,電流不大,奇怪的是這種現(xiàn)象只發(fā)生在太陽能供電時(shí)。電源供電的板子沒有這種現(xiàn)象!兩個(gè)電感47微哼!
    發(fā)表于 09-14 06:12

    【「時(shí)間序列與機(jī)器學(xué)習(xí)」閱讀體驗(yàn)】時(shí)間序列的信息提取

    個(gè)重要環(huán)節(jié),目標(biāo)是從給定的時(shí)間序列數(shù)據(jù)中提取出有用的信息和特征,以支持后續(xù)的分析和預(yù)測(cè)任務(wù)。 特征工程(Feature Engineering)是將數(shù)據(jù)轉(zhuǎn)換為更好地表示潛在問題的特征,從而提高機(jī)器學(xué)習(xí)
    發(fā)表于 08-17 21:12

    【《時(shí)間序列與機(jī)器學(xué)習(xí)》閱讀體驗(yàn)】+ 時(shí)間序列的信息提取

    之前對(duì)《時(shí)間序列與機(jī)器學(xué)習(xí)》一書進(jìn)行了整體瀏覽,并且非常輕松愉快的完成了第一章的學(xué)習(xí),今天開始學(xué)習(xí)第二章“時(shí)間序列的信息提取”。 先粗略的翻
    發(fā)表于 08-14 18:00

    【「時(shí)間序列與機(jī)器學(xué)習(xí)」閱讀體驗(yàn)】+ 簡(jiǎn)單建議

    這本書以其系統(tǒng)性的框架和深入淺出的講解,為讀者繪制了一幅時(shí)間序列分析與機(jī)器學(xué)習(xí)融合應(yīng)用的宏偉藍(lán)圖。作者不僅扎實(shí)地構(gòu)建了時(shí)間序列分析的基礎(chǔ)知識(shí),更巧妙地展示了機(jī)器學(xué)習(xí)
    發(fā)表于 08-12 11:21

    分壓式滑動(dòng)變阻器開始時(shí)放在哪里

    分壓式滑動(dòng)變阻器在開始時(shí)(即電路接通前)的放置位置,主要是為了保護(hù)電路中的其他元件,并確保實(shí)驗(yàn)的安全進(jìn)行。一般來說,分壓式滑動(dòng)變阻器在開始時(shí)應(yīng)放置在以下位置: 一、放置位置 電阻最小處 (或靠近零
    的頭像 發(fā)表于 08-05 14:21 ?6275次閱讀

    ESP8266在任何波特率上都不起作用,為什么?

    現(xiàn)在我的ESP8266在任何波特率上都不起作用,我嘗試了所有這些,但它們都會(huì)產(chǎn)生垃圾。其中一些會(huì)產(chǎn)生垃圾,但我也可以在重置后立即在某些回合率上看到字符串致命錯(cuò)誤 (28)。當(dāng)我連接到 76800
    發(fā)表于 07-22 06:40