一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何解決大數(shù)據(jù)帶來關(guān)于預(yù)測(cè)技術(shù)的挑戰(zhàn)

電子工程師 ? 來源:網(wǎng)絡(luò)整理 ? 作者:工程師飛燕 ? 2018-07-01 10:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

大數(shù)據(jù)分析近年來逐漸成為預(yù)測(cè)分析技術(shù)的代名詞。這使得越來越多的人以為,任何用于預(yù)測(cè)分析的系統(tǒng)都必定涉及大數(shù)據(jù);而反過來,任何大數(shù)據(jù)系統(tǒng)自然也一定會(huì)支持預(yù)測(cè)建模。

而事實(shí)上,這兩者并非一回事。盡管通過訪問海量數(shù)據(jù)與新的數(shù)據(jù)類型,開發(fā)出更好的預(yù)測(cè)模型的能力會(huì)得到顯著增強(qiáng)。但是分析管理人員與其團(tuán)隊(duì)需要更多考慮數(shù)據(jù)的構(gòu)成,以及在大數(shù)據(jù)環(huán)境中如何管理這類基礎(chǔ)性問題。

首先,讓我們審視預(yù)測(cè)分析過程本身。在主流的預(yù)測(cè)分析過程中,會(huì)涉及到某些與業(yè)務(wù)應(yīng)用相集成的統(tǒng)計(jì)分析與模式匹配,從而推動(dòng)運(yùn)營(yíng)決策與操作。但是,預(yù)測(cè)模型的實(shí)時(shí)需要多項(xiàng)步驟,其中包括:

數(shù)據(jù)準(zhǔn)備工作,清理、轉(zhuǎn)換與重組數(shù)據(jù),使其符合預(yù)測(cè)分析或機(jī)器學(xué)習(xí)算法所需的格式。包括分析數(shù)據(jù)、尋找異常、確定應(yīng)用和待修復(fù)的數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)類型、設(shè)計(jì)適合分析的數(shù)據(jù)模型,并執(zhí)行轉(zhuǎn)換,使數(shù)據(jù)集保持一致。

預(yù)測(cè)模型開發(fā),包括創(chuàng)建試用數(shù)據(jù)集,選擇特定算法進(jìn)行處理,從而測(cè)試某些分析模式。這一步需要有計(jì)劃地進(jìn)行,將被分析的數(shù)據(jù)分為不同的子集,包括試用數(shù)據(jù)集和一份或多份測(cè)試數(shù)據(jù)集。

測(cè)試過程,即在各模型上運(yùn)行測(cè)試數(shù)據(jù)集,對(duì)性能加以評(píng)估,從而確定哪種模型能夠得到最佳效果。

集成與實(shí)施,選中的模型被納入生產(chǎn)業(yè)務(wù)流程、實(shí)際上線、并產(chǎn)生真實(shí)的分析結(jié)果,以此采取行動(dòng)。

調(diào)整所選的預(yù)測(cè)模型以確保其持續(xù)有效與準(zhǔn)確,重復(fù)分析、不斷更新。

大數(shù)據(jù)帶來特定的挑戰(zhàn)

接下來,讓我們看看大數(shù)據(jù)環(huán)境中出名的3V數(shù)據(jù)——即容量,多樣性和速度——并思考在大數(shù)據(jù)環(huán)境,預(yù)測(cè)分析過程中必須解決的一些特定挑戰(zhàn)。

數(shù)據(jù)容量。除了那些顯而易見的,與管理與海量數(shù)據(jù)有關(guān)的考量因素,包括數(shù)據(jù)獲取、分段和防止延遲,你必須有精簡(jiǎn)的流程,從而支持各不同階段的分析過程。例如,你需要能夠提取到可以使用不同算法快速分析的試用數(shù)據(jù)集,也需要能夠充分反映整體數(shù)據(jù)的那部分信息。

數(shù)據(jù)的多樣化。企業(yè)越來越多地得到各式各樣的數(shù)據(jù)輸入,從傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)到日益增長(zhǎng)的非結(jié)構(gòu)化數(shù)據(jù)類型。而且,隨著更多的非結(jié)構(gòu)化數(shù)據(jù)流成為業(yè)務(wù)流程中不可或缺的組成部分,例如對(duì)推特信息流的持續(xù)監(jiān)測(cè)可以識(shí)別客戶情緒,非結(jié)構(gòu)化數(shù)據(jù)正成為預(yù)測(cè)模型必不可少的數(shù)據(jù)源。這意味著你必須擁有一套非常強(qiáng)大的流程,用于掃描、分析和處理非結(jié)構(gòu)化數(shù)據(jù),以將其轉(zhuǎn)化為可用作分析算法輸入的數(shù)據(jù)集。

數(shù)據(jù)的速度。處理大量不同數(shù)據(jù)所帶來的復(fù)雜性,與更快速的數(shù)據(jù)流輸入速度疊加。使得你不僅必須能夠處理輸入速度更快的數(shù)據(jù)源,而且需要應(yīng)對(duì)這些數(shù)據(jù)源的結(jié)構(gòu)或格式可能會(huì)發(fā)生的變化。更要命的是,這種變化通常難以預(yù)測(cè),因此迫切需要做好數(shù)據(jù)分析與準(zhǔn)備工作。

智慧的分析策略

設(shè)計(jì)大數(shù)據(jù)系統(tǒng)預(yù)測(cè)分析策略能夠應(yīng)對(duì)上述挑戰(zhàn),以便你可以成功管理或優(yōu)化流程中的關(guān)鍵點(diǎn)。

例如,考慮如何將龐大的數(shù)據(jù)集合轉(zhuǎn)化為容量更為合理的試用數(shù)據(jù)塊。在某些情況下,最佳實(shí)踐是,不要隨機(jī)選擇試用數(shù)據(jù)集,而是通過過濾器來減少數(shù)據(jù)集合的大小,這樣或許會(huì)消除特例的那部分記錄。另外一些情況中,你的目標(biāo)可能是增加大數(shù)據(jù)系統(tǒng)的計(jì)算資源,使分析算法有能力處理更大的訓(xùn)練集——并且無需過濾任何記錄。

另一個(gè)例子是,解決數(shù)據(jù)在速度方面挑戰(zhàn)或許意味著擴(kuò)大系統(tǒng)對(duì)數(shù)據(jù)流的吞吐能力,從而可以讓每個(gè)數(shù)據(jù)逐一進(jìn)入預(yù)測(cè)模型;當(dāng)然,你同樣可以降低模型的復(fù)雜度,以便更快速地加以執(zhí)行。

當(dāng)涉及到設(shè)計(jì)、工程量、復(fù)雜性和成本這些問題時(shí),每一次選擇都意味著相應(yīng)的取舍。一組更精確的預(yù)測(cè)模型可能需要更多的處理和存儲(chǔ)資源,但分析帶來的優(yōu)勢(shì)或許會(huì)超越所增加的成本。又或者,你所在的企業(yè)組織也許可以從并不復(fù)雜的模型中,以較少的處理資源,獲得大數(shù)據(jù)應(yīng)用中的預(yù)測(cè)分析能力。

預(yù)測(cè)分析必須與大數(shù)據(jù)處理相結(jié)合,從而為分析管理人員、甚至企業(yè)高層提供所期待的結(jié)果。要做到這一點(diǎn),就必須弄清楚如何在預(yù)測(cè)分析帶來的收益與大數(shù)據(jù)所需的性能和管理之間做出平衡。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    云計(jì)算、大數(shù)據(jù)處理技術(shù)交流

    云計(jì)算、大數(shù)據(jù)處理技術(shù)交流圖形圖像是數(shù)據(jù)處理量最大的版塊之一,也是當(dāng)今云計(jì)算的重要課題之一,圖形圖像處理大會(huì)給大家帶來諸多名家方案,探究大數(shù)據(jù)
    發(fā)表于 09-16 14:18

    淺談大數(shù)據(jù)視頻圖像處理系統(tǒng)技術(shù)

    淺談大數(shù)據(jù)視頻圖像處理系統(tǒng)技術(shù)近年來,隨著計(jì)算機(jī)、網(wǎng)絡(luò)以及圖像處理、傳輸技術(shù)的飛速發(fā)展,視頻監(jiān)控系統(tǒng)正向著高清化、智能化和網(wǎng)絡(luò)化方向發(fā)展。視頻監(jiān)控系統(tǒng)的高清化、智能化和網(wǎng)絡(luò)化為視頻監(jiān)控圖像處理
    發(fā)表于 09-24 15:22

    探尋大數(shù)據(jù)時(shí)代的商業(yè)變革

    的多階矩陣型連接,通過創(chuàng)造革新的商業(yè)模式,為社會(huì)生產(chǎn)力帶來新的機(jī)遇,為企業(yè)帶來新的發(fā)展空間。 在新經(jīng)濟(jì)新環(huán)境下,隨著“大數(shù)據(jù)”的不斷發(fā)展壯大,更多的數(shù)據(jù)或?qū)?/div>
    發(fā)表于 05-27 17:11

    常見大數(shù)據(jù)應(yīng)用有哪些?

    預(yù)測(cè)數(shù)據(jù)分析結(jié)果展示等,為做出正確決策提供依據(jù),其數(shù)據(jù)級(jí)別通常在PB以上,以下是常用的大數(shù)據(jù)技術(shù):一、
    發(fā)表于 03-13 16:50

    大數(shù)據(jù)運(yùn)用的技術(shù)

    大數(shù)據(jù)是對(duì)海量數(shù)據(jù)進(jìn)行存儲(chǔ)、計(jì)算、統(tǒng)計(jì)、分析處理的一系列處理手段,處理的數(shù)據(jù)量通常是TB級(jí),甚至是PB或EB級(jí)的數(shù)據(jù),這是傳統(tǒng)數(shù)據(jù)處理手段所
    發(fā)表于 04-08 16:50

    大數(shù)據(jù)專業(yè)技術(shù)學(xué)習(xí)之大數(shù)據(jù)處理流程

    隨著互聯(lián)網(wǎng)的發(fā)展,大數(shù)據(jù)也在逐漸彰顯出自己的優(yōu)勢(shì)特點(diǎn),那么關(guān)于大數(shù)據(jù)的處理流程,你是否了解?第一,數(shù)據(jù)采集定義:利用多種輕型數(shù)據(jù)庫來接收發(fā)自
    發(fā)表于 06-11 16:41

    大數(shù)據(jù)開發(fā)核心技術(shù)詳解

    數(shù)據(jù)的核心是云技術(shù)和BI。關(guān)于大數(shù)據(jù)和云計(jì)算的關(guān)系人們通常會(huì)有誤解,而且也會(huì)把它們混起來說,分別做一句話直白解釋就是:云計(jì)算就是硬件資源的虛擬化;
    發(fā)表于 07-26 16:26

    常用大數(shù)據(jù)技術(shù)課程內(nèi)容

    關(guān)于大數(shù)據(jù)的概念,指的是無法在一定時(shí)間內(nèi)用常規(guī)軟件工具對(duì)其內(nèi)容進(jìn)行抓取、管理和處理的數(shù)據(jù)集合。而大數(shù)據(jù)技術(shù),是指從各種各樣類型的
    發(fā)表于 07-26 16:27

    NLPIR系統(tǒng)KGB知識(shí)圖譜技術(shù)助力大數(shù)據(jù)深度挖掘

      大數(shù)據(jù)時(shí)代的到來,意味著海量數(shù)據(jù)的產(chǎn)生,給我們現(xiàn)有的數(shù)據(jù)存儲(chǔ)技術(shù)帶來了巨大的挑戰(zhàn)。而隨著時(shí)代
    發(fā)表于 12-05 11:49

    何解決全雙工通信帶來的測(cè)試挑戰(zhàn)?

    何解決全雙工通信帶來的測(cè)試挑戰(zhàn)?
    發(fā)表于 06-17 06:46

    智能電網(wǎng)預(yù)測(cè)負(fù)荷波動(dòng)的影響

    智能電網(wǎng)預(yù)測(cè)負(fù)荷波動(dòng)和新能源出力方面在整個(gè)電網(wǎng)電量管理系統(tǒng)中,負(fù)荷所占據(jù)的比重極大,它對(duì)于整體運(yùn)行安全性會(huì)帶來直接影響。當(dāng)前,電網(wǎng)數(shù)據(jù)采集范圍正在持續(xù)擴(kuò)大,它也充分涉及有關(guān)于氣象信息、
    發(fā)表于 07-12 06:52

    大數(shù)據(jù)技術(shù)與應(yīng)用是學(xué)什么的?

    大數(shù)據(jù)技術(shù)與應(yīng)用是學(xué)什么的?大數(shù)據(jù)是指無法在一定時(shí)間內(nèi)用常規(guī)軟件工具對(duì)其內(nèi)容進(jìn)行抓取、管理和處理的數(shù)據(jù)集合。大數(shù)據(jù)
    發(fā)表于 07-27 07:47

    大數(shù)據(jù)技術(shù)原理與應(yīng)用

    本文介紹了關(guān)于大數(shù)據(jù)的相關(guān)概念、大數(shù)據(jù)的結(jié)構(gòu)、大數(shù)據(jù)的特點(diǎn)以及大數(shù)據(jù)技術(shù)的十大原理及詳細(xì)的說明了
    發(fā)表于 12-19 14:29 ?11.2w次閱讀
    <b class='flag-5'>大數(shù)據(jù)</b><b class='flag-5'>技術(shù)</b>原理與應(yīng)用

    關(guān)于AI和大數(shù)據(jù)時(shí)代所帶來的機(jī)遇與挑戰(zhàn)

    任何一家公司都不可能獨(dú)立面對(duì)AI和大數(shù)據(jù)時(shí)代所帶來的機(jī)遇與挑戰(zhàn),這需要半導(dǎo)體行業(yè)整個(gè)生態(tài)鏈的合作。應(yīng)用材料公司同樣致力于與行業(yè)生態(tài)共同合作研發(fā)在人工智能時(shí)代提升PPACt所需的新技術(shù)。
    的頭像 發(fā)表于 06-30 17:42 ?5041次閱讀

    醫(yī)療大數(shù)據(jù)面臨的挑戰(zhàn)及相應(yīng)的隱私保護(hù)技術(shù)

    受關(guān)注的重要議題。醫(yī)療大數(shù)據(jù)自身特點(diǎn)以及存儲(chǔ)環(huán)境等都為隱私倸護(hù)帶來了不小的挑戰(zhàn)。首先,介紹了醫(yī)療大數(shù)據(jù)的相關(guān)概念以及特點(diǎn)。然后,圍繞醫(yī)療大數(shù)據(jù)
    發(fā)表于 03-25 11:26 ?16次下載
    醫(yī)療<b class='flag-5'>大數(shù)據(jù)</b>面臨的<b class='flag-5'>挑戰(zhàn)</b>及相應(yīng)的隱私保護(hù)<b class='flag-5'>技術(shù)</b>