一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

如何使用合成數(shù)據(jù)測試機器學習

要長高 ? 來源:InfoWorld ? 作者:Isaac Sacolick ? 2022-04-25 17:34 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Devops 團隊旨在提高部署頻率,減少生產(chǎn)中發(fā)現(xiàn)的缺陷數(shù)量,并提高從微服務和面向客戶的應用程序到員工工作流和業(yè)務流程自動化的一切的可靠性。

實施CI/CD(持續(xù)集成和持續(xù)交付)管道可確保構建和部署所有這些應用程序和服務的無縫路徑,自動化測試和實施持續(xù)測試實踐有助于團隊保持質量、可靠性和性能。通過持續(xù)測試,敏捷開發(fā)團隊可以 左移他們的測試,增加測試用例的數(shù)量,并提高測試速度。

[也在 InfoWorld 上:在數(shù)據(jù)科學和機器學習中應用 devops ]

構建測試用例并使其自動化是一回事,擁有足夠數(shù)量和種類的測試數(shù)據(jù)來驗證足夠數(shù)量的用例和邊界場景是另一回事。例如,測試網(wǎng)站注冊表單應驗證輸入模式的排列,包括缺失數(shù)據(jù)、長數(shù)據(jù)條目、特殊字符、多語言輸入和其他場景。

挑戰(zhàn)在于生成測試數(shù)據(jù)。一種方法是合成數(shù)據(jù)生成,它使用不同的技術根據(jù)模型和輸入模式集推斷數(shù)據(jù)集。合成數(shù)據(jù)生成解決了所需數(shù)據(jù)的數(shù)量和種類。在使用真實數(shù)據(jù)可能引發(fā)法律或其他合規(guī)性問題的情況下,您還可以使用合成數(shù)據(jù)生成來創(chuàng)建數(shù)據(jù)集。

“當所需數(shù)據(jù)不存在或原始數(shù)據(jù)集充滿個人身份信息時,合成數(shù)據(jù)提供了一個很好的選擇,”Accelario 的首席技術官兼聯(lián)合創(chuàng)始人 Roman Golod說?!白詈玫姆椒ㄊ腔诂F(xiàn)有模式創(chuàng)建合成數(shù)據(jù)以進行測試數(shù)據(jù)管理或構建規(guī)則,以確保您的 BI、AI 和其他分析提供可操作的結果。對于這兩者,您需要確??梢愿鶕?jù)不斷變化的業(yè)務需求對合成數(shù)據(jù)生成自動化進行微調(diào)?!?/p>

合成數(shù)據(jù)生成用例

雖然合成數(shù)據(jù)生成的最基本需求源于測試應用程序、自動化和集成,但隨著數(shù)據(jù)科學測試需要機器學習和人工智能算法的測試數(shù)據(jù),需求也在增長。數(shù)據(jù)科學家有時會使用合成數(shù)據(jù)來訓練神經(jīng)網(wǎng)絡;在其他時候,他們使用機器生成的數(shù)據(jù)來驗證模型的結果。

其他合成數(shù)據(jù)用例更具體:

[在這份免費的 CIO 路線圖報告中了解 IT 如何利用 5G 的力量和前景。現(xiàn)在下載?。?/p>

通過確保在兩個基礎架構上運行相同的應用程序生成相同的結果來測試云遷移

為安全測試、欺詐檢測和其他實際數(shù)據(jù)可能不存在的實際場景創(chuàng)建數(shù)據(jù)

生成數(shù)據(jù)以測試大規(guī)模 ERP(企業(yè)資源規(guī)劃)和 CRM(客戶關系管理)升級,測試人員希望在遷移實時數(shù)據(jù)之前驗證配置

為決策支持系統(tǒng)生成數(shù)據(jù)以測試邊界條件、驗證特征選擇、提供更廣泛的無偏測試數(shù)據(jù)樣本,并確保AI 結果可解釋

對人工智能和物聯(lián)網(wǎng)系統(tǒng)(例如自動駕駛汽車)進行壓力測試,并驗證它們對不同安全情況的反應

如果您正在開發(fā)具有高維數(shù)據(jù)輸入以及關鍵質量和安全因素的算法或應用程序,那么合成數(shù)據(jù)生成提供了一種以經(jīng)濟高效地創(chuàng)建大型數(shù)據(jù)集的機制。

“合成數(shù)據(jù)有時是唯一的出路,因為真實數(shù)據(jù)要么不可用,要么不可用,”KNIME 的數(shù)據(jù)科學家 Maarit Widman說。

平臺如何生成合成數(shù)據(jù)

您可能想知道平臺如何生成綜合測試數(shù)據(jù)以及如何選擇最佳算法和配置來創(chuàng)建所需數(shù)據(jù)。

Widman 解釋說:“生成合成數(shù)據(jù)有兩種主要策略:基于統(tǒng)計概率或基于機器學習算法。最近,像循環(huán)神經(jīng)網(wǎng)絡這樣的深度學習技術——比如長短期記憶網(wǎng)絡和生成對抗網(wǎng)絡——因其能夠從無到有地生成新的音樂、文本和圖像的能力而越來越受歡迎?!?/p>

當數(shù)據(jù)點之間存在依賴關系時,例如時間序列數(shù)據(jù)和文本分析,數(shù)據(jù)科學家會使用RNN(循環(huán)神經(jīng)網(wǎng)絡) 。LSTM(長期短期記憶)通過一系列重復模塊創(chuàng)建一種形式的長期記憶,每個模塊都有提供類似記憶功能的門。例如,文本分析中的 LSTM可以學習字符和單詞之間的依賴關系以生成新的字符序列。它還用于音樂創(chuàng)作、欺詐檢測和谷歌的 Pixel 6 語法校正。

GAN(生成對抗網(wǎng)絡)已被用于生成多種形式的圖像、破解網(wǎng)絡安全密碼,甚至制作披薩。GANs通過使用一種算法生成數(shù)據(jù)模式和另一種算法來測試它們來創(chuàng)建數(shù)據(jù)。然后他們在兩者之間形成對抗性競爭以找到最佳模式。生成合成數(shù)據(jù)的 GAN 代碼示例包括PyTorch 手寫數(shù)字、用于開發(fā)一維高斯分布的 TensorFlow 模型和用于模擬衛(wèi)星圖像的 R 模型。

選擇機器學習和基于統(tǒng)計的模型是一門藝術和科學。Monitaur的聯(lián)合創(chuàng)始人兼首席技術官 Andrew Clark解釋了如何嘗試合成數(shù)據(jù)生成。他說:“這里的經(jīng)驗法則始終是為工作選擇最簡單的模型,并以可接受的準確度執(zhí)行任務。如果您正在對客戶結賬行進行建模,那么基于泊松分布的單變量隨機過程將是一個很好的起點。另一方面,如果您有大量貸款承銷數(shù)據(jù)集并想要創(chuàng)建測試數(shù)據(jù),GAN 模型可能更適合捕捉各個特征之間的復雜相關性和關系?!?/p>

如果您正在處理數(shù)據(jù)科學用例,那么您可能希望靈活地開發(fā)合成數(shù)據(jù)生成模型。商業(yè)選項包括用于計算機視覺的Chooch 、Datomize和Deep Vision Data。

如果您的目標是應用程序測試,請考慮用于測試數(shù)據(jù)管理或綜合生成測試數(shù)據(jù)的平臺,例如 Accelario、Delphix、GenRocket、Informatica、K2View、Tonic,以及一些測試數(shù)據(jù)工具,例如開源測試數(shù)據(jù)生成器。Microsoft 的Visual Studio Premium也有一個內(nèi)置的測試數(shù)據(jù)生成器,Java 開發(fā)人員應該使用Vaadin 的數(shù)據(jù)生成器查看這個示例。

如今,擁有強大的測試實踐非常重要,因為組織依賴于應用程序的可靠性和機器學習模型的準確性。合成數(shù)據(jù)生成是另一種縮小差距的方法。因此,您不僅擁有測試、訓練或驗證方法,而且還擁有生成足夠數(shù)據(jù)來構建模型和驗證應用程序的方法。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • GaN
    GaN
    +關注

    關注

    19

    文章

    2209

    瀏覽量

    76800
  • 機器學習
    +關注

    關注

    66

    文章

    8503

    瀏覽量

    134613
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    破解數(shù)據(jù)瓶頸:智能汽車合成數(shù)據(jù)架構與應用實踐

    合成數(shù)據(jù)因可控等特性,已成為智能汽車感知系統(tǒng)數(shù)據(jù)成本高、場景覆蓋不足等困境的突破方向!。本文探討其體系原則、分層結構,聚焦艙外道路感知與艙內(nèi)乘員識別場景,闡述生成流程與實踐,助力感知系統(tǒng)開發(fā)!
    的頭像 發(fā)表于 07-16 10:31 ?261次閱讀
    破解<b class='flag-5'>數(shù)據(jù)</b>瓶頸:智能汽車<b class='flag-5'>合成數(shù)據(jù)</b>架構與應用實踐

    破解數(shù)據(jù)瓶頸:智能汽車合成數(shù)據(jù)架構與應用實踐

    智能汽車感知系統(tǒng)面臨數(shù)據(jù)困境,如結構復雜、成本高昂、覆蓋受限、合規(guī)性與隱私風險突出。合成數(shù)據(jù)作為新型數(shù)據(jù)生成方式,以高度可配置性、自動化、可復現(xiàn)為特點,有望解決這些問題。
    的頭像 發(fā)表于 07-15 11:48 ?134次閱讀
    破解<b class='flag-5'>數(shù)據(jù)</b>瓶頸:智能汽車<b class='flag-5'>合成數(shù)據(jù)</b>架構與應用實踐

    51Sim利用NVIDIA Cosmos提升輔助駕駛合成數(shù)據(jù)場景的泛化性

    輔助駕駛領域的經(jīng)驗成功拓展到了具身智能領域,為端到端輔助駕駛仿真測試與具身智能機器人訓練提供了海量高置信度的合成數(shù)據(jù),目前相關成果已在多個主機廠和智能裝備企業(yè)中實現(xiàn)落地應用。
    的頭像 發(fā)表于 06-26 09:09 ?391次閱讀

    康謀分享| 揭秘C-NCAP :合成數(shù)據(jù)如何助力攻克全球安全合規(guī)難關?

    C-NCAP 2024新規(guī)將DMS、RFR納入評分體系,推動中國汽車安全從被動向主動轉型。車企面臨成本、惡劣環(huán)境可靠性等挑戰(zhàn)。如何通過虛擬仿真和合成數(shù)據(jù)技術,助力車企大幅提升驗證效率,滿足合規(guī)標準?
    的頭像 發(fā)表于 06-18 10:07 ?1224次閱讀
    康謀分享| 揭秘C-NCAP :<b class='flag-5'>合成數(shù)據(jù)</b>如何助力攻克全球安全合規(guī)難關?

    技術分享 | 高逼真合成數(shù)據(jù)助力智駕“看得更準、學得更快”

    自動駕駛研發(fā)如何高效獲取海量訓練數(shù)據(jù)?高逼真合成數(shù)據(jù)技術正在提供新解法。通過仿真平臺可生成多場景、多傳感器的精準標注數(shù)據(jù)。文章詳解如何構建符合nuScenes標準的數(shù)據(jù)集,覆蓋復雜交通
    的頭像 發(fā)表于 04-29 10:47 ?2895次閱讀
    技術分享 | 高逼真<b class='flag-5'>合成數(shù)據(jù)</b>助力智駕“看得更準、學得更快”

    借助OpenUSD與合成數(shù)據(jù)推動人形機器人發(fā)展

    適用于合成運動數(shù)據(jù)的 NVIDIA Isaac GR00T Blueprint 大幅加快人形機器人的數(shù)據(jù)生成和訓練速度。
    的頭像 發(fā)表于 04-25 10:04 ?373次閱讀

    技術分享 | AVM合成數(shù)據(jù)仿真驗證方案

    AVM 合成數(shù)據(jù)仿真驗證技術為自動駕駛環(huán)境感知發(fā)展帶來助力,可借助仿真軟件配置傳感器、搭建環(huán)境、處理圖像,生成 AVM 合成數(shù)據(jù),有效加速算法驗證。然而,如何利用仿真軟件優(yōu)化傳感器外參與多場景驗證,顯著提升AVM算法表現(xiàn)?
    的頭像 發(fā)表于 03-19 09:40 ?3057次閱讀
    技術分享 | AVM<b class='flag-5'>合成數(shù)據(jù)</b>仿真驗證方案

    RTX 5880 Ada 驅動51Sim實現(xiàn)端到端仿真與數(shù)據(jù)合成新飛躍

    。 51Sim 由 51WORLD 于 2017 年孵化,是國內(nèi)領先的 AI 合成數(shù)據(jù)及仿真平臺公司,在智能駕駛仿真和數(shù)據(jù)閉環(huán)領域有著卓越的產(chǎn)品競爭力和商業(yè)化能力。現(xiàn)核心產(chǎn)品包括智能駕駛與機器人仿真平臺 SimOne、
    的頭像 發(fā)表于 02-13 12:46 ?566次閱讀
    RTX 5880 Ada 驅動51Sim實現(xiàn)端到端仿真與<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>合成</b>新飛躍

    8600推拉力測試機和8100推拉力測試機對比# 測試#芯片

    測試機
    力標精密設備
    發(fā)布于 :2025年01月11日 10:57:06

    多功能推拉力測試機:原理及應用

    在當今工業(yè)快速發(fā)展的背景下,材料和組件的機械強度對于保障產(chǎn)品性能和安全至關重要。技術的進步和產(chǎn)品復雜性的提升使得對材料和組件測試的要求日益嚴格,推拉力測試機憑借其高精度特性,成為半導體、電子
    的頭像 發(fā)表于 12-26 11:08 ?734次閱讀
    多功能推拉力<b class='flag-5'>測試機</b>:原理及應用

    鍵合拉力試驗led推力測試機倒裝剪切力測試機#元器件精密推拉力測試機

    測試機
    博森源推拉力機
    發(fā)布于 :2024年08月30日 17:19:15

    多功能推拉力測試機測試費用是多少?

    多功能推拉力測試機測試費用由測試機的規(guī)格、產(chǎn)地、品牌和服務等多個因素共同決定,需要具體詢價。一、規(guī)格多功能推拉力測試機的規(guī)格是影響測試費用重
    的頭像 發(fā)表于 08-23 16:17 ?549次閱讀
    多功能推拉力<b class='flag-5'>測試機</b><b class='flag-5'>測試</b>費用是多少?

    加速科技ST2500EX測試機臺再獲封測廠超千萬訂單

    先進機型,具備卓越的高密度、高效率、高性價比等特點。 圖|ST2500EX高性能數(shù)模混合信號測試系統(tǒng) 該測試機臺集成數(shù)字、模擬信號測試功能。單機臺最高支持32塊板卡,最高支持1024
    的頭像 發(fā)表于 07-23 09:48 ?620次閱讀
    加速科技ST2500EX<b class='flag-5'>測試機</b>臺再獲封測廠超千萬訂單

    半導體多功能推拉力測試機出貨了

    全自動化設計半導體多功能推拉力測試機,可進行金線拉力、金球推力、芯片推力的測試應用。工作臺X方向最大行程100毫米和Y方向最大行程100毫米;運動時最大速度2毫米/秒;;Y方向可承受最大力200公斤
    的頭像 發(fā)表于 07-18 09:44 ?140次閱讀
    半導體多功能推拉力<b class='flag-5'>測試機</b>出貨了