一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

如何通過獲取預先說明的合成數(shù)據(jù)加速模型開發(fā)和AI培訓

星星科技指導員 ? 來源:NVIDIA ? 作者:Jakub Pietrzak ? 2022-04-15 16:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人工智能計算機視覺中,數(shù)據(jù)采集成本高、耗時長,并且基于人的標記容易出錯。模型的準確性還受到數(shù)據(jù)不足和不平衡以及改進深度學習模型所需的時間延長的影響。它總是要求在現(xiàn)實世界中重新獲取數(shù)據(jù)。

基于人工智能培訓的數(shù)據(jù)收集、準備和準確可靠的軟件解決方案的開發(fā)是一個極其艱苦的過程。所需的投資成本抵消了部署該系統(tǒng)的預期收益。

用合成數(shù)據(jù)代替真實數(shù)據(jù)進行訓練是縮小數(shù)據(jù)差距、加速模型訓練的一種方法 天空發(fā)動機 提供了一個 AI 平臺,將深度學習轉(zhuǎn)移到虛擬現(xiàn)實中??梢允褂?a href="http://www.www27dydycom.cn/analog/" target="_blank">模擬生成合成數(shù)據(jù),其中合成圖像帶有可直接用于訓練 AI 模型的注釋。

合成數(shù)據(jù)現(xiàn)在可以直接導出到 NVIDIA 遷移學習工具包 ( TLT )上運行, TLT 是一個人工智能訓練工具箱,通過抽象出人工智能/ DL 框架的復雜性來簡化訓練。這使您能夠更快地構(gòu)建生產(chǎn)質(zhì)量模型,而不需要任何人工智能專業(yè)知識。有了 SKY ENGINE AI 平臺和 TLT ,您可以快速迭代和構(gòu)建 AI 。

在這篇文章中,您將學習如何通過獲取預先說明的合成數(shù)據(jù)并在 TLT 上對其進行訓練來利用合成數(shù)據(jù)的威力。我演示了一個簡單的檢查用例,使用分段來識別電信塔上的天線。

關(guān)于天空引擎人工智能方法

SKY ENGINE 推出了一個用于虛擬現(xiàn)實深度學習的全棧 AI 平臺,這是下一代用于圖像和視頻分析應用的主動學習 AI 系統(tǒng)。 SKY ENGINE 人工智能平臺可以使用一個專有的、專用的模擬系統(tǒng)生成數(shù)據(jù),在這個系統(tǒng)中,圖像已經(jīng)經(jīng)過注釋,可以進行深入學習。

輸出數(shù)據(jù)流可以包括以下任一項:

所選模式中的渲染圖像或其他模擬傳感器數(shù)據(jù)

對象邊界框

三維邊界框

語義遮罩

二維或三維骨架

深度貼圖

法向量映射

天空引擎人工智能還包括先進的領域適應算法,可以了解真實數(shù)據(jù)的特點的例子。它們保證了推理過程中任何經(jīng)過訓練的人工智能模型的高質(zhì)量性能。

圖 1 天空引擎 AI 平臺用戶界面預覽。

天空引擎模擬系統(tǒng)支持物理驅(qū)動的傳感器模擬(相機、熱視覺、紅外、激光雷達、雷達等) 傳感器數(shù)據(jù)融合。它與深度學習管道緊密結(jié)合,以確保進化。在訓練過程中,天空引擎人工智能可以發(fā)現(xiàn)模糊的情況,從而降低人工智能模型的準確性。它可以獲得更多的圖像數(shù)據(jù)來反映那些深層次學習精度可以瞬間提高的問題情境。天空引擎 AI 通過每一個執(zhí)行的實驗學到了更多。

天空引擎 AI 提供了一個完全實現(xiàn)、測試和優(yōu)化的深度神經(jīng)網(wǎng)絡花園。提供的模型專用于流行的計算機視覺任務,如目標檢測和語義分割。它們還可以作為更復雜的拓撲結(jié)構(gòu),用于三維位置和姿態(tài)估計、三維幾何推理或表示學習。

天空引擎人工智能還包括先進的領域適應算法,可以了解實際數(shù)據(jù)的特點,并確保訓練模型推理的性能。天空引擎 AI 不需要復雜的渲染和成像知識,因此入門門檻非常低。它有一個 Python API ,包括大量的幫助程序來快速構(gòu)建和配置環(huán)境。

神經(jīng)網(wǎng)絡優(yōu)化

SKY ENGINE AI 平臺可以生成數(shù)據(jù)集,并支持深度學習模型的培訓,該模型可以使用來自任何來源的輸入數(shù)據(jù)。在 NVIDIA TLT 和 AI 驅(qū)動推理中訓練 AI 模型的輸入流可以有效地包括使用智能手機獲得的低質(zhì)量圖像、來自 CCTV 攝像機或安裝在無人機上的攝像機的數(shù)據(jù)。

您可以在云上部署用于電信網(wǎng)絡性能優(yōu)化的分析模塊,包括數(shù)據(jù)存儲和多 GPU 擴展。在這個領域,大多數(shù)由機器學習驅(qū)動的軟件項目都無法達到解決方案部署的最后階段。這可能是因為機器學習能力高度依賴于輸入數(shù)據(jù)的質(zhì)量。 SKY ENGINE 提供的人工智能模型的開發(fā)以及對合成數(shù)據(jù)的深入培訓,是一個具有可預測的項目開發(fā)和在多個工業(yè)業(yè)務流程中保證部署的解決方案。

電信設備檢測與分類

計算機視覺的一個常見任務是對感興趣的設備進行定位和分類。在這篇文章中,我提出了一個基于 MaskRCNN 的 NVIDIA TLT 環(huán)境的神經(jīng)網(wǎng)絡優(yōu)化過程,用于電信塔天線實例的包圍盒定位。你使用來自天空引擎 AI 的合成數(shù)據(jù)來訓練 MaskRCNN 模型。高層工作流程如下:

生成帶注釋的合成數(shù)據(jù)。

根據(jù) NVIDIA TLT-MaskRCNN 模型的要求將數(shù)據(jù)格式轉(zhuǎn)換為 COCO 。

配置 NGC 環(huán)境和數(shù)據(jù)預處理。

在合成數(shù)據(jù)上訓練和評估 MaskRCNN 模型。

使用訓練好的人工智能模型對合成和真實的電信塔進行推理。

給出了電信塔的真實示例,我使用 SE 呈現(xiàn)引擎創(chuàng)建了一個帶注釋的合成數(shù)據(jù)集。

要使用 SKY ENGINE AI 啟動標記數(shù)據(jù)的自動生成并準備數(shù)據(jù)源對象,必須定義基本工具(如空渲染器上下文)以及合成場景資源所在的路徑。

在這個渲染場景中,我隨機化了以下內(nèi)容:

給定電信塔上天線的數(shù)目

光的方向

攝像機的位置

攝像機的水平視野

背景圖

在許多項目中, SKY 引擎返回的樣本洗牌不夠。一個例子是渲染過程遵循攝影機軌跡。因此,我建議在將數(shù)據(jù)劃分為訓練集和測試集之前對其進行額外的洗牌。

生成圖像后,利用 SKY 引擎的數(shù)據(jù)輸出模塊將圖像轉(zhuǎn)換為 COCO 格式。這是 NVIDIA TLT 框架所要求的。根據(jù)文檔準備好配置文件后,可以使用 TensorFlow 后端運行 TLT 預訓練掩碼 RCNN 模型的培訓:

!tlt mask_rcnn train -e $SPECS_DIR/maskrcnn_train_telco_resnet50.txt \
 -d $USER_EXPERIMENT_DIR/experiment_telco_anchors \
 -k $KEY \
 --gpus1 

最后一步,運行一個經(jīng)過訓練的深度學習模型,對真實數(shù)據(jù)進行推理,以查看該模型是否準確地執(zhí)行了感興趣的任務。

!tlt mask_rcnn inference -i $DATA_DIR/valid_images \
 -o $USER_EXPERIMENT_DIR/se_telco_maskrcnn_inference_synth \
 -e $SPECS_DIR/maskrcnn_train_telco_resnet50.txt \
 -m $USER_EXPERIMENT_DIR/experiment_telco_anchors/model.step-20000.tlt \
 -l $SPECS_DIR/telco_labels.txt \
 -t 0.5 \
 -b 1 \
 -k $KEY \
 --include_mask 

概括

在本文中,我演示了如何使用 SKY ENGINE 的合成數(shù)據(jù),并使用 NVIDIA TLT 對其進行訓練和優(yōu)化,從而減少數(shù)據(jù)收集和注釋工作。我提出了一個用于電信行業(yè)的單天空引擎人工智能用例。

關(guān)于作者

Jakub Pietrzak 是 Sky Engine AI 的首席技術(shù)官。他負責 GPU 加速研究、數(shù)據(jù)科學和機器學習算法開發(fā)。他是一名計算機視覺魔術(shù)師,在機器學習、光線跟蹤和數(shù)字圖像處理方面有 15 年以上的經(jīng)驗。 Jakub 曾為歐洲最大的電影制片廠開發(fā)深度學習動力運動捕捉系統(tǒng),并參與了華沙腫瘤中心的醫(yī)學影像研究項目。他的博士學位。 Jakub 探索了在合成數(shù)據(jù)上訓練神經(jīng)網(wǎng)絡的思想,以及虛擬現(xiàn)實中機器學習問題的再創(chuàng)造。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡

    關(guān)注

    42

    文章

    4814

    瀏覽量

    103507
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    48987

    瀏覽量

    249103
  • 機器學習
    +關(guān)注

    關(guān)注

    66

    文章

    8501

    瀏覽量

    134548
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    51Sim利用NVIDIA Cosmos提升輔助駕駛合成數(shù)據(jù)場景的泛化性

    51Sim 利用 NVIDIA Cosmos 的生成式世界基礎模型,對現(xiàn)有的合成數(shù)據(jù)進行大規(guī)模泛化,在確保物理真實性的前提下,大幅提升了數(shù)據(jù)的豐富度。同時依托 NVIDIA Issac Sim,將
    的頭像 發(fā)表于 06-26 09:09 ?346次閱讀

    模型時代的新燃料:大規(guī)模擬真多風格語音合成數(shù)據(jù)

    模型充分學習到語音的發(fā)音規(guī)律、語義特征、語境等信息,從而提升語音識別、語音合成等關(guān)鍵能力,提供更加準確、自然、智能的語音交互體驗。 語音大模型發(fā)展面臨數(shù)據(jù)難題 然而,當前語音大
    的頭像 發(fā)表于 04-30 16:17 ?264次閱讀

    技術(shù)分享 | 高逼真合成數(shù)據(jù)助力智駕“看得更準、學得更快”

    自動駕駛研發(fā)如何高效獲取海量訓練數(shù)據(jù)?高逼真合成數(shù)據(jù)技術(shù)正在提供新解法。通過仿真平臺可生成多場景、多傳感器的精準標注數(shù)據(jù)。文章詳解如何構(gòu)建符
    的頭像 發(fā)表于 04-29 10:47 ?2886次閱讀
    技術(shù)分享 | 高逼真<b class='flag-5'>合成數(shù)據(jù)</b>助力智駕“看得更準、學得更快”

    DevEco Studio AI輔助開發(fā)工具兩大升級功能 鴻蒙應用開發(fā)效率再提升

    數(shù)據(jù)支撐時提供相關(guān)的延伸指導。這種設計既保障了鴻蒙技術(shù)支持的專注度,又通過善意引導幫助用戶建立合理預期,最終實現(xiàn)開發(fā)者體驗與專業(yè)深度的雙提升。 隨著DeepSeek模型使用RAG能力增
    發(fā)表于 04-18 14:43

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應手

    基石。 Neuron Studio打造全流程一站式開發(fā)體驗,為AI應用開發(fā)按下加速AI 應用的開發(fā)
    發(fā)表于 04-13 19:52

    英偉達GTC2025亮點 NVIDIA推出Cosmos世界基礎模型和物理AI數(shù)據(jù)工具的重大更新

    模型可實現(xiàn)物理 AI 的預測、可控世界生成和推理。 兩款全新Blueprint為機器人和自動駕駛汽車后訓練提供海量物理 AI 合成數(shù)據(jù)生成技術(shù)。 1X、Agility Robotic
    的頭像 發(fā)表于 03-20 19:01 ?871次閱讀

    技術(shù)分享 | AVM合成數(shù)據(jù)仿真驗證方案

    AVM 合成數(shù)據(jù)仿真驗證技術(shù)為自動駕駛環(huán)境感知發(fā)展帶來助力,可借助仿真軟件配置傳感器、搭建環(huán)境、處理圖像,生成 AVM 合成數(shù)據(jù),有效加速算法驗證。然而,如何利用仿真軟件優(yōu)化傳感器外參與多場景驗證,顯著提升AVM算法表現(xiàn)?
    的頭像 發(fā)表于 03-19 09:40 ?3052次閱讀
    技術(shù)分享 | AVM<b class='flag-5'>合成數(shù)據(jù)</b>仿真驗證方案

    FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預測......

    FPGA的硬件加速能力處理傳感器數(shù)據(jù)。? 低功耗設計:針對邊緣設備和物聯(lián)網(wǎng)應用,開發(fā)低功耗的FPGA解決方案,以滿足嚴格的功耗限制。 4.借助先進的開發(fā)工具?
    發(fā)表于 03-03 11:21

    DeepSeek大模型受行業(yè)熱捧,加速AI應用迭代

    趨勢反映出DeepSeek大模型AI領域的強大影響力。通過接入DeepSeek,這些機構(gòu)能夠獲取更先進的AI技術(shù)支持,從而提升其產(chǎn)品的智能
    的頭像 發(fā)表于 02-14 14:14 ?602次閱讀

    AI開發(fā)平臺模型怎么用

    AI開發(fā)平臺極大地簡化了AI應用的開發(fā)流程,從環(huán)境搭建、模型訓練到部署集成,每一步都提供了豐富的工具和資源。那么,
    的頭像 發(fā)表于 02-11 09:53 ?330次閱讀

    英偉達推出基石世界模型Cosmos,解決智駕與機器人具身智能訓練數(shù)據(jù)問題

    。Cosmos 世界基礎模型(WFM)使開發(fā)者能夠輕松生成大量基于物理學的逼真合成數(shù)據(jù),以用于訓練和評估其現(xiàn)有的模型。開發(fā)者還可以
    的頭像 發(fā)表于 01-14 11:04 ?1245次閱讀
    英偉達推出基石世界<b class='flag-5'>模型</b>Cosmos,解決智駕與機器人具身智能訓練<b class='flag-5'>數(shù)據(jù)</b>問題

    NVIDIA推出加速物理AI開發(fā)的Cosmos世界基礎模型

    經(jīng)數(shù)百萬小時的駕駛和機器人視頻數(shù)據(jù)訓練的先進模型,可用于普及物理 AI 開發(fā),并以開放模型許可形式提供。
    的頭像 發(fā)表于 01-09 11:05 ?762次閱讀

    NVIDIA發(fā)布Cosmos?平臺,助力物理AI系統(tǒng)發(fā)展

    基礎模型、高級tokenizer、護欄以及加速視頻處理管線等多項先進技術(shù)。其中,Cosmos世界基礎模型(WFM)是平臺的核心,它使開發(fā)者能夠輕松生成大量基于物理學的逼真
    的頭像 發(fā)表于 01-08 15:36 ?611次閱讀

    AI大語言模型開發(fā)步驟

    開發(fā)一個高效、準確的大語言模型是一個復雜且多階段的過程,涉及數(shù)據(jù)收集與預處理、模型架構(gòu)設計、訓練與優(yōu)化、評估與調(diào)試等多個環(huán)節(jié)。接下來,AI
    的頭像 發(fā)表于 12-19 11:29 ?887次閱讀

    如何使用OpenUSD構(gòu)建支持生成式AI合成數(shù)據(jù)工作流

    訓練用于驅(qū)動自主機器(例如機器人和自動駕駛汽車)的物理 AI 模型需要大量數(shù)據(jù)獲取大量多樣化的訓練數(shù)據(jù)可能很困難、耗時且昂貴。
    的頭像 發(fā)表于 11-20 09:50 ?875次閱讀
    如何使用OpenUSD構(gòu)建支持生成式<b class='flag-5'>AI</b>的<b class='flag-5'>合成數(shù)據(jù)</b>工作流