一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

業(yè)務(wù)場景數(shù)據(jù)的采集和標(biāo)注

深度學(xué)習(xí)自然語言處理 ? 來源:深度學(xué)習(xí)自然語言處理 ? 作者:深度學(xué)習(xí)自然語言 ? 2020-11-02 14:57 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

無論是在傳統(tǒng)機(jī)器學(xué)習(xí)領(lǐng)域還是現(xiàn)今炙手可熱的深度學(xué)習(xí)領(lǐng)域,基于訓(xùn)練樣本有明確標(biāo)簽或結(jié)果的監(jiān)督學(xué)習(xí)仍然是一種主要的模型訓(xùn)練方式。尤其是深度學(xué)習(xí)領(lǐng)域,需要更多數(shù)據(jù)以提升模型效果。目前,已經(jīng)有一些規(guī)模較大的公開數(shù)據(jù)集,如ImageNet,COCO等。對于深度學(xué)習(xí)入門者,這些公開數(shù)據(jù)集可以提供非常大的幫助;但是對于大部分企業(yè)開發(fā)者,特別在醫(yī)學(xué)成像、自動駕駛、工業(yè)質(zhì)檢等領(lǐng)域中,他們更需要利用專業(yè)領(lǐng)域的實(shí)際業(yè)務(wù)數(shù)據(jù)定制AI模型應(yīng)用,以保證其能夠更好地應(yīng)用在業(yè)務(wù)中。因此,業(yè)務(wù)場景數(shù)據(jù)的采集和標(biāo)注也是在實(shí)際AI模型開發(fā)過程中必不可少的重要環(huán)節(jié)。

數(shù)據(jù)標(biāo)注的質(zhì)量和規(guī)模通常是提升AI模型應(yīng)用效果的重要因素,然而完全通過人力手動標(biāo)注數(shù)據(jù)建立一個高質(zhì)量、大規(guī)模專業(yè)領(lǐng)域數(shù)據(jù)集卻并不容易:標(biāo)注人員的培訓(xùn)與手工標(biāo)注成本高、耗時長。為解決此問題,我們可以利用主動學(xué)習(xí)的方法,采用“Human-in-the-loop”的交互式框架(圖1)進(jìn)行數(shù)據(jù)標(biāo)注,以有效減少人工數(shù)據(jù)標(biāo)注量。

圖1 基于主動學(xué)習(xí)的“Human-in-the-loop”交互式數(shù)據(jù)標(biāo)注框架

主動學(xué)習(xí)(ActiveLearning, AL)是一種挑選具有高信息度數(shù)據(jù)的有效方式,它將數(shù)據(jù)標(biāo)注過程呈現(xiàn)為學(xué)習(xí)算法和用戶之間的交互。其中,算法負(fù)責(zé)挑選對訓(xùn)練AI模型價值更高的樣本,而用戶則標(biāo)注那些挑選出來的樣本。如“Human-in-the-loop”交互式數(shù)據(jù)標(biāo)注框架,通過用戶已標(biāo)注的一部分?jǐn)?shù)據(jù)來訓(xùn)練AI模型,通過此模型來標(biāo)注剩余數(shù)據(jù),再從中篩選出AI模型標(biāo)注較為困難的數(shù)據(jù)進(jìn)行人工標(biāo)注,再將這些數(shù)據(jù)用于模型的優(yōu)化。幾輪過后,用于數(shù)據(jù)標(biāo)注的AI模型將會具備較高的精度,更好地進(jìn)行數(shù)據(jù)標(biāo)注。以圖像分類問題舉例,首先,人工挑選并標(biāo)注一部分圖像數(shù)據(jù),訓(xùn)練初始模型,然后利用訓(xùn)練的模型預(yù)測其余未標(biāo)注的數(shù)據(jù),再通過“主動學(xué)習(xí)”中的“查詢方法”挑選出模型比較難分辨類別的數(shù)據(jù),再人為修正這些“難”數(shù)據(jù)的標(biāo)簽并加入訓(xùn)練集中再次微調(diào)(Fine-tuning)訓(xùn)練模型?!安樵兎椒ā笔侵鲃訉W(xué)習(xí)的核心之一,最常見的“查詢方法”有基于不確定性的樣本查詢策略和基于多樣性的樣本查詢策略。

基于不確定性的樣本查詢策略可查詢出深度學(xué)習(xí)模型預(yù)測時,靠近決策邊界的樣本。以二分類問題舉例,當(dāng)一個未標(biāo)注樣本被預(yù)測為任一標(biāo)簽的概率都是50%時,則該樣本對于預(yù)測模型而言是“不確定”的,極有可能被錯誤分類。要注意的是,主動學(xué)習(xí)是一個迭代過程,每次迭代,模型都會接收認(rèn)為修正后的標(biāo)注數(shù)據(jù)微調(diào)模型,通過這個過程直接改變模型決策的邊界,提高分類的正確率。

基于多樣性的查詢策略,可實(shí)現(xiàn)對當(dāng)前深度學(xué)習(xí)模型下狀態(tài)未知樣本的查詢。將通過多樣性查詢挑選出的數(shù)據(jù)加入訓(xùn)練集,可豐富訓(xùn)練集的特征組合,提升模型的泛化能力。模型學(xué)習(xí)過的數(shù)據(jù)特征越豐富,泛化能力越強(qiáng),預(yù)測模型適用的場景也越廣。

為解決大數(shù)據(jù)量標(biāo)注的痛點(diǎn),基于主動學(xué)習(xí)且融合多樣查詢策略的智能標(biāo)注AI解決方案應(yīng)運(yùn)而生。通過EasyDL平臺使用智能標(biāo)注后,開發(fā)者們只需標(biāo)注數(shù)據(jù)集中30%左右的數(shù)據(jù),即可啟動智能標(biāo)注在EasyDL后臺自動標(biāo)注剩余數(shù)據(jù),再返回少量后臺難以確定的數(shù)據(jù)再次進(jìn)行人工標(biāo)注,同時提升自動標(biāo)注的準(zhǔn)確性,經(jīng)過幾輪之后,在實(shí)際項(xiàng)目測試中,智能標(biāo)注功能可以幫助用戶節(jié)省70%的數(shù)據(jù)標(biāo)注量,極大地減少數(shù)據(jù)標(biāo)注中的人力成本和時間成本。

EasyDL零門檻AI開發(fā)平臺,面向企業(yè)開發(fā)者提供智能標(biāo)注、模型訓(xùn)練、服務(wù)部署等全流程功能,針對AI模型開發(fā)過程中繁雜的工作,提供便捷高效的平臺化解決方案。目前,EasyDL的智能標(biāo)注功能已支持計(jì)算機(jī)視覺CV方向的物體檢測模型、圖像分割、自然語言處理NLP方向的文本分類模型的數(shù)據(jù)標(biāo)注。

智能標(biāo)注解決了模型開發(fā)過程中龐大的數(shù)據(jù)準(zhǔn)備難題,那么在模型訓(xùn)練與部署階段,EasyDL是否還有其他“武功秘籍”幫助開發(fā)者高效開發(fā)?

本周六,AI快車道EasyDL零門檻模型訓(xùn)練營來到六朝古都南京,依托槳聲燈影里的秦淮河,為這座歷史悠久的城市帶來AI科技的新氣息!

各行業(yè)如何做到技術(shù)與場景結(jié)合,高效用AI?

視覺模型背后的核心技術(shù)點(diǎn)如何理解?

從云到端,端側(cè)模型的技術(shù)原理與部署如何操作?

模型精度難以提升,有沒有關(guān)鍵效果提升技巧尚未掌握?

責(zé)任編輯:xj

原文標(biāo)題:百度工程師帶來干貨分享,助你轉(zhuǎn)型AI應(yīng)用工程師!

文章出處:【微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)采集
    +關(guān)注

    關(guān)注

    40

    文章

    7173

    瀏覽量

    116496
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35136

    瀏覽量

    279795
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8503

    瀏覽量

    134603
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5561

    瀏覽量

    122794

原文標(biāo)題:百度工程師帶來干貨分享,助你轉(zhuǎn)型AI應(yīng)用工程師!

文章出處:【微信號:zenRRan,微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    什么是自動駕駛數(shù)據(jù)標(biāo)注?如何好做數(shù)據(jù)標(biāo)注

    、精準(zhǔn)且高效的數(shù)據(jù)標(biāo)注流程顯得尤為關(guān)鍵。那什么是數(shù)據(jù)標(biāo)注?如何做數(shù)據(jù)標(biāo)注? 自動駕駛
    的頭像 發(fā)表于 07-09 09:19 ?217次閱讀
    什么是自動駕駛<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標(biāo)注</b>?如何好做<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標(biāo)注</b>?

    淺析AI數(shù)據(jù)采集標(biāo)注在運(yùn)動健康領(lǐng)域的落地應(yīng)用

    的核心引擎。AI數(shù)據(jù)采集標(biāo)注作為人工智能技術(shù)應(yīng)用的根基,通過為算法模型提供高質(zhì)量的數(shù)據(jù)支撐,在運(yùn)動健康領(lǐng)域的多個場景實(shí)現(xiàn)了深度落地,從根本上改變了傳統(tǒng)運(yùn)動健康管理
    的頭像 發(fā)表于 05-28 17:39 ?227次閱讀
    淺析AI<b class='flag-5'>數(shù)據(jù)采集</b>和<b class='flag-5'>標(biāo)注</b>在運(yùn)動健康領(lǐng)域的落地應(yīng)用

    東軟集團(tuán)入選國家數(shù)據(jù)數(shù)據(jù)標(biāo)注優(yōu)秀案例

    近日,東軟飛標(biāo)醫(yī)學(xué)影像標(biāo)注平臺在國家數(shù)據(jù)局發(fā)布數(shù)據(jù)標(biāo)注優(yōu)秀案例集名單中排名第一(案例名稱“多模態(tài)醫(yī)學(xué)影像智能數(shù)據(jù)
    的頭像 發(fā)表于 05-09 14:37 ?472次閱讀

    富士PLC數(shù)據(jù)采集網(wǎng)關(guān)的功能特點(diǎn)及應(yīng)用場景

    富士PLC數(shù)據(jù)采集網(wǎng)關(guān)是一款用于采集富士PLC數(shù)據(jù)的工業(yè)設(shè)備,以下是其功能特點(diǎn)及應(yīng)用場景的具體介紹: 功能特點(diǎn) 數(shù)據(jù)采集能力強(qiáng):能夠?qū)崟r
    的頭像 發(fā)表于 04-24 14:20 ?352次閱讀

    數(shù)據(jù)標(biāo)注服務(wù)—奠定大模型訓(xùn)練的數(shù)據(jù)基石

    數(shù)據(jù)標(biāo)注是大模型訓(xùn)練過程中不可或缺的基礎(chǔ)環(huán)節(jié),其質(zhì)量直接影響著模型的性能表現(xiàn)。在大模型訓(xùn)練中,數(shù)據(jù)標(biāo)注承擔(dān)著將原始數(shù)據(jù)轉(zhuǎn)化為機(jī)器可理解、可學(xué)
    的頭像 發(fā)表于 03-21 10:30 ?776次閱讀

    標(biāo)貝數(shù)據(jù)標(biāo)注服務(wù):奠定大模型訓(xùn)練的數(shù)據(jù)基石

    數(shù)據(jù)標(biāo)注是大模型訓(xùn)練過程中不可或缺的基礎(chǔ)環(huán)節(jié),其質(zhì)量直接影響著模型的性能表現(xiàn)。在大模型訓(xùn)練中,數(shù)據(jù)標(biāo)注承擔(dān)著將原始數(shù)據(jù)轉(zhuǎn)化為機(jī)器可理解、可學(xué)
    的頭像 發(fā)表于 03-21 10:27 ?565次閱讀
    標(biāo)貝<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標(biāo)注</b>服務(wù):奠定大模型訓(xùn)練的<b class='flag-5'>數(shù)據(jù)</b>基石

    自動化標(biāo)注技術(shù)推動AI數(shù)據(jù)訓(xùn)練革新

    標(biāo)貝自動化數(shù)據(jù)標(biāo)注平臺在全棧數(shù)據(jù)標(biāo)注場景式中搭載了大模型預(yù)標(biāo)注和自動化
    的頭像 發(fā)表于 03-14 16:46 ?675次閱讀

    標(biāo)貝自動化數(shù)據(jù)標(biāo)注平臺推動AI數(shù)據(jù)訓(xùn)練革新

    標(biāo)貝自動化數(shù)據(jù)標(biāo)注平臺在全棧數(shù)據(jù)標(biāo)注場景式中搭載了大模型預(yù)標(biāo)注和自動化
    的頭像 發(fā)表于 03-14 16:42 ?902次閱讀
    標(biāo)貝自動化<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標(biāo)注</b>平臺推動AI<b class='flag-5'>數(shù)據(jù)</b>訓(xùn)練革新

    智能導(dǎo)航系統(tǒng)中的數(shù)據(jù)采集標(biāo)注案例分享

    智能導(dǎo)航系統(tǒng)依賴于高精度的環(huán)境感知和數(shù)據(jù)分析來實(shí)現(xiàn)其導(dǎo)航功能。數(shù)據(jù)采集標(biāo)注通過對原始數(shù)據(jù)進(jìn)行精確的處理和標(biāo)記,為智能導(dǎo)航系統(tǒng)提供了可靠的數(shù)據(jù)
    的頭像 發(fā)表于 01-10 17:01 ?650次閱讀
    智能導(dǎo)航系統(tǒng)中的<b class='flag-5'>數(shù)據(jù)采集</b><b class='flag-5'>標(biāo)注</b>案例分享

    數(shù)據(jù)采集標(biāo)注在智能導(dǎo)航系統(tǒng)中的應(yīng)用案例

    智能導(dǎo)航系統(tǒng)依賴于高精度的環(huán)境感知和數(shù)據(jù)分析來實(shí)現(xiàn)其導(dǎo)航功能。數(shù)據(jù)采集標(biāo)注通過對原始數(shù)據(jù)進(jìn)行精確的處理和標(biāo)記,為智能導(dǎo)航系統(tǒng)提供了可靠的數(shù)據(jù)
    的頭像 發(fā)表于 01-10 16:53 ?1229次閱讀
    <b class='flag-5'>數(shù)據(jù)采集</b><b class='flag-5'>標(biāo)注</b>在智能導(dǎo)航系統(tǒng)中的應(yīng)用案例

    標(biāo)貝數(shù)據(jù)標(biāo)注在智能駕駛訓(xùn)練中的落地案例

    標(biāo)貝科技深耕AI數(shù)據(jù)服務(wù)多年,在無人駕駛、自動駕駛等智能駕駛領(lǐng)域擁有豐富的合作案例。多次采用點(diǎn)云標(biāo)注以及3D&2D融合等標(biāo)注方式為智能駕駛領(lǐng)域客戶提供環(huán)境感知、決策策劃、車道線標(biāo)注、障
    的頭像 發(fā)表于 12-24 15:17 ?1561次閱讀
    標(biāo)貝<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標(biāo)注</b>在智能駕駛訓(xùn)練中的落地案例

    標(biāo)貝數(shù)據(jù)標(biāo)注案例分享:車載語音系統(tǒng)數(shù)據(jù)標(biāo)注

    的作用。一般來說,車載語音識別系統(tǒng)主要分為前端和后端兩個部分,本文將針對前端語音信號數(shù)據(jù)采集標(biāo)注進(jìn)行實(shí)例講解。
    的頭像 發(fā)表于 12-24 14:24 ?575次閱讀
    標(biāo)貝<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標(biāo)注</b>案例分享:車載語音系統(tǒng)<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標(biāo)注</b>

    標(biāo)貝科技:自動駕駛中的數(shù)據(jù)標(biāo)注類別分享

    的必要條件,數(shù)據(jù)采集數(shù)據(jù)標(biāo)注服務(wù)已成為支撐自動駕駛熱潮必不可少的一環(huán)。本文將以數(shù)據(jù)標(biāo)注的視角,通過標(biāo)貝科技自研平臺標(biāo)貝
    的頭像 發(fā)表于 11-22 15:07 ?2008次閱讀
    標(biāo)貝科技:自動駕駛中的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標(biāo)注</b>類別分享

    標(biāo)貝科技:自動駕駛中的數(shù)據(jù)標(biāo)注類別分享

    的必要條件,數(shù)據(jù)采集數(shù)據(jù)標(biāo)注服務(wù)已成為支撐自動駕駛熱潮必不可少的一環(huán)。本文將以數(shù)據(jù)標(biāo)注的視角,通過標(biāo)貝科技自研平臺標(biāo)貝
    的頭像 發(fā)表于 11-22 14:58 ?3779次閱讀
    標(biāo)貝科技:自動駕駛中的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標(biāo)注</b>類別分享

    opc數(shù)據(jù)采集平臺的應(yīng)用場景

    OPC數(shù)據(jù)采集平臺廣泛應(yīng)用于各種工業(yè)自動化和物聯(lián)網(wǎng)領(lǐng)域,以下是一些典型的應(yīng)用場景: 1. 制造業(yè):在制造業(yè)中,OPC數(shù)據(jù)采集平臺用于監(jiān)控和控制生產(chǎn)線上的各種設(shè)備,采集設(shè)備狀態(tài)、生產(chǎn)進(jìn)度
    的頭像 發(fā)表于 07-26 14:02 ?829次閱讀