一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

大數(shù)據(jù)技術成為企業(yè)長遠發(fā)展的驅動力量?

我快閉嘴 ? 來源:精英數(shù)智科技股份有限公 ? 作者:侯宇輝 ? 2020-09-15 17:47 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在互聯(lián)網(wǎng)領域,大數(shù)據(jù)應用十分廣泛,尤其以企業(yè)為主,企業(yè)作為大數(shù)據(jù)應用的主體,數(shù)據(jù)采集、數(shù)據(jù)存儲、數(shù)據(jù)可視化、數(shù)據(jù)特征提取、數(shù)據(jù)特征選擇、數(shù)據(jù)清洗、數(shù)據(jù)分析、數(shù)據(jù)挖掘、數(shù)據(jù)倉庫、數(shù)據(jù)安全等圍繞大數(shù)據(jù)商業(yè)價值的利用焦點已備受關注。

一、數(shù)據(jù)采集

從數(shù)據(jù)采集層面來看,分為結構化數(shù)據(jù)、非結構化數(shù)據(jù)、半結構化數(shù)據(jù),來源于物聯(lián)網(wǎng)的設備采集數(shù)據(jù)由于成本低、獲取方式容易,成為企業(yè)大數(shù)據(jù)采集數(shù)據(jù)的主要來源之一,實時性相對強,數(shù)據(jù)量從GB、TB、PB、ZB級擴增。然而對于中小企業(yè)或許會受困于沒有數(shù)據(jù)卻又想轉型通過搭建大數(shù)據(jù)平臺來提升競爭力,企業(yè)可以研發(fā)符合市場需求的產(chǎn)品,從新用戶、活躍用戶、粘性用戶到留存用戶,獲取用戶的行為數(shù)據(jù)之后可以進行數(shù)據(jù)分析。此外數(shù)據(jù)采集可以有網(wǎng)絡爬蟲、ETL抽取等。

二、數(shù)據(jù)存儲

有了大量數(shù)據(jù)之后,對于數(shù)據(jù)存儲方式也提出了要求。數(shù)據(jù)存儲分為關系型數(shù)據(jù)庫存儲、分布式數(shù)據(jù)存儲,數(shù)據(jù)級別較大時可以存儲在分布式文件存儲系統(tǒng)中。對于搭建大數(shù)據(jù)平臺的企業(yè)來說,通常是對業(yè)務結果的數(shù)據(jù)存儲于關系型系統(tǒng),對于TB級及以上數(shù)據(jù)量存儲至分布式系統(tǒng)中,這兩種數(shù)據(jù)可以使用Sqoop等類似的工具進行數(shù)據(jù)導入導出。

三、數(shù)據(jù)可視化

在實際工業(yè)生產(chǎn)實踐中,對于待處理的大數(shù)據(jù),首先是數(shù)據(jù)特征探索階段,也就是做數(shù)據(jù)可視化,對數(shù)據(jù)有個初步的了解,才會知道所拿到的數(shù)據(jù)能否解決面臨的實際問題,適用于什么算法。對于無編程能力的人,只需要掌握數(shù)據(jù)分析和處理的能力,即可靈活使用可視化類工具如Tableau,通過拖拉拽形成聯(lián)動,大大縮短數(shù)據(jù)分析流程。從連接數(shù)據(jù)源、建立工作表、構建各種圖表、儀表板進行可視化展示,進行交叉分析。對于有編程能力的人可以使用R、Python進行數(shù)據(jù)可視化。

四、數(shù)據(jù)特征提取及清洗

數(shù)據(jù)可視化之后,需要對數(shù)據(jù)進行清洗,對數(shù)據(jù)中的噪聲進行處理以支持后續(xù)數(shù)據(jù)建模。常見的比如進行降維,提取出對實際問題相關性較高的特征因子后,再回歸到大數(shù)據(jù),或者做相關性分析、主成分分析等。

五、數(shù)據(jù)分析及挖掘

數(shù)據(jù)統(tǒng)計及分析主要是基于存儲的海量數(shù)據(jù)進行普通的分析和分類匯總,以滿足大多數(shù)常見的分析需求。數(shù)據(jù)挖掘一般沒有預先設定好的主題,主要是在現(xiàn)有數(shù)據(jù)上面進行基于各種算法的計算,從而起到預測的效果,實現(xiàn)高級別的數(shù)

據(jù)分析的需求,豐富的歷史數(shù)據(jù)是數(shù)據(jù)挖掘的先決條件。比較典型的算法有回歸、分類、聚類、關聯(lián)分析。機器學習正是如此,分為監(jiān)督式學習算法、無監(jiān)督式學習算法、半監(jiān)督式學習算法。

六、機器學習

監(jiān)督式學習算法是從帶標簽(標注)的訓練樣本中建立的訓練樣本中建立模式,并依此推測新的數(shù)據(jù)標簽的算法。比如回歸、神經(jīng)網(wǎng)絡、決策樹、支持向量機、貝葉斯、隨機森林。無監(jiān)督式學習算法是在學習時并不知道其分類結果,目的是去對原始資料進行分類,以便了解資料內部結構的算法。比如聚類、主成分分析、線性判別分析降維。半監(jiān)督式學習算法是利用少量標注樣本和大量未標注樣本進行機器學習,利用數(shù)據(jù)分布上的模型假設,建立學習器對未標簽樣本進行標簽。

機器學習正被廣泛應用于計算機視覺語音識別、自然語言處理等方面。其中深度學習強調模型深度,通過逐層特征變換,將樣本在原空間的特征表示變換到一個新特征空間,從而使分類或預測更容易準確,更能夠刻畫數(shù)據(jù)的豐富內在信息,其實際應用對象不僅包含語音、圖像、視頻,同樣也包含文本、語言和語義信息。另外,卷積神經(jīng)網(wǎng)絡是神經(jīng)網(wǎng)絡的一種,為識別二維形狀而特殊設計的多層感知器,擅長處理圖像特別是大圖像的相關機器學習問題,對圖像平移、比例縮放、傾斜或者其他形式的變形具有高度不變性,它的布局更接近于實際的生物神經(jīng)網(wǎng)絡,被廣泛應用。當前實現(xiàn)機器學習比較常見的兩種主流方式是Spark和Tensorflow框架。機器學習作為人工智能的核心,是企業(yè)搭建大數(shù)據(jù)平臺的重要節(jié)點,需要結合業(yè)務邏輯,按需選擇合適的算法模型,不斷調參調優(yōu),使機器學習服務于企業(yè)經(jīng)營。

七、數(shù)據(jù)倉庫

數(shù)據(jù)倉庫是為了便于多維分析和多角度展示數(shù)據(jù)按特定模式進行存儲所建立起來的關系型數(shù)據(jù)庫。在商業(yè)智能系統(tǒng)的設計中,數(shù)據(jù)倉庫的構建是關鍵,是商業(yè)智能系統(tǒng)的基礎,承擔對業(yè)務系統(tǒng)數(shù)據(jù)整合的任務,為商業(yè)智能系統(tǒng)提供數(shù)據(jù)抽取、轉換和加載(ETL),并按主題對數(shù)據(jù)進行查詢和訪問,為聯(lián)機數(shù)據(jù)分析和數(shù)據(jù)挖掘提供數(shù)據(jù)平臺。海量的數(shù)據(jù)包括社交網(wǎng)絡、移動設備和傳感器等新渠道以及新技術使用所帶來的半結構化或非結構化的數(shù)據(jù)。大數(shù)據(jù)技術架構可分為存儲、處理、應用、展示以及整合5個部分,并可根據(jù)數(shù)據(jù)的結構化程度對相關技術進行選擇和組合。每個部分包含一些技術要素,而某些要素又可根據(jù)結構化程度共同作用形成特定的功能。

從企業(yè)角度來說,無論是數(shù)據(jù)庫、數(shù)據(jù)倉庫還是大數(shù)據(jù)都是解決不同需求、處理不同級別數(shù)據(jù)量的技術,它們之間并無沖突。針對不同需求和現(xiàn)狀進行技術選擇,各種技術相互補充、相互協(xié)作。目前階段對于大部分企業(yè)來說,想要開展一個全新的大數(shù)據(jù)項目似乎無從下手。從現(xiàn)有數(shù)據(jù)倉庫建設理論和經(jīng)驗入手,引入部分大數(shù)據(jù)技術,特別是實現(xiàn)非結構化數(shù)據(jù)的收集、存儲和處理是一種比較可行的方法。

基于云計算的Hadoop大數(shù)據(jù)框架,利用集群的威力高速運算和存儲,實現(xiàn)了一個分布式運行系統(tǒng),以流的形式提供高傳輸率來訪問數(shù)據(jù),適應了大數(shù)據(jù)的應用程序。將Hadoop技術應用于對數(shù)據(jù)的采集、ETL、存儲、處理,開發(fā)提供給傳統(tǒng)的數(shù)據(jù)倉庫BI工具,其架構如圖所示。利用Hadoop強大的數(shù)據(jù)處理能力,將各類數(shù)據(jù)處理成結構化數(shù)據(jù),向上提供給傳統(tǒng)BI工具,對數(shù)據(jù)進行分析和結果展示。

八、數(shù)據(jù)安全

大數(shù)據(jù)蘊藏著價值信息,但數(shù)據(jù)安全面臨著嚴峻挑戰(zhàn)。一方面,大數(shù)據(jù)本身的安全防護存在漏洞。雖然云計算對大數(shù)據(jù)提供了便利,但對大數(shù)據(jù)的安全控制力度不夠,API訪問權限控制以及密鑰生產(chǎn),存儲和管理方面的不足都可能造成數(shù)據(jù)泄露。另一方面,在用數(shù)據(jù)挖掘和數(shù)據(jù)分析等大數(shù)據(jù)技術獲取價值信息的同時,攻擊者也在利用這些大數(shù)據(jù)技術進行攻擊。

當然大數(shù)據(jù)也為數(shù)據(jù)安全的發(fā)展提供了機會,對海量數(shù)據(jù)的分析有助于更好的跟蹤網(wǎng)絡異常行為,對實時安全和應用數(shù)據(jù)結合在一起的數(shù)據(jù)進行預防性分析,可防止詐騙和黑客入侵。網(wǎng)絡攻擊行為留下的痕跡數(shù)據(jù)以數(shù)據(jù)的形式隱藏在大數(shù)據(jù)中,從大數(shù)據(jù)的存儲,應用和管理方面把關,可以有針對性的應對數(shù)據(jù)安全威脅。企業(yè)需要將大數(shù)據(jù)技術和安全并行,大數(shù)據(jù)才可以真正成為企業(yè)長遠發(fā)展的驅動力量。
責任編輯:tzh

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    RFID無線測溫技術:輸配電設備智能升級的核心驅動力

    在數(shù)字化與智能化飛速發(fā)展的時代,智能升級已成為輸配電領域的必然趨勢。在這一過程中,RFID無線測溫技術正嶄露頭角,成為推動輸配電設備智能升級的核心
    的頭像 發(fā)表于 07-09 15:31 ?63次閱讀
    RFID無線測溫<b class='flag-5'>技術</b>:輸配電設備智能升級的核心<b class='flag-5'>驅動力</b>

    CES Asia 2025 低空經(jīng)濟專館:思想碰撞,引領低空經(jīng)濟規(guī)則升級

    思想的碰撞,共同引領低空經(jīng)濟產(chǎn)業(yè)規(guī)則的升級,為產(chǎn)業(yè)的長遠發(fā)展奠定堅實基礎。 權威力量齊聚,構建產(chǎn)業(yè)規(guī)則創(chuàng)新引擎 CES Asia 2025 低空經(jīng)濟專館成為各方權威力量匯聚的平
    發(fā)表于 07-04 17:04

    醫(yī)療保健領域數(shù)字化轉型的核心驅動力與主要應用場景

    隨著人工智能、大數(shù)據(jù)、云計算和物聯(lián)網(wǎng)等技術的快速發(fā)展,醫(yī)療保健行業(yè)正經(jīng)歷深刻的數(shù)字化變革。傳統(tǒng)醫(yī)療模式面臨資源分配不均、診療效率低下、慢性病管理挑戰(zhàn)等問題,而數(shù)字化技術的應用不僅提升了
    的頭像 發(fā)表于 06-12 14:47 ?1578次閱讀
    醫(yī)療保健領域數(shù)字化轉型的核心<b class='flag-5'>驅動力</b>與主要應用場景

    輪邊驅動電機專利技術發(fā)展

    ,具有較高的靈敏度。 本文主要以 DWPI 專利數(shù)據(jù)庫以及 CNABS 數(shù)據(jù)庫中的檢索結果為分析樣本,從專利文獻的視角對輪邊驅動電機的技術發(fā)展進行了全面的統(tǒng)計分析,總結了與輪邊
    發(fā)表于 06-10 13:15

    英泰斯特入選湖北省數(shù)據(jù)要素型企業(yè)

    湖北省數(shù)據(jù)要素型企業(yè)評選旨在挖掘和培育以數(shù)據(jù)為核心驅動力的標桿企業(yè),推動數(shù)據(jù)要素市場化配置改革,
    的頭像 發(fā)表于 05-30 15:04 ?460次閱讀

    超結MOSFET升級至650V碳化硅MOSFET的根本驅動力分析

    隨著BASiC基本半導體等企業(yè)的650V碳化硅MOSFET技術升級疊加價格低于進口超結MOSFET,不少客戶已經(jīng)開始動手用國產(chǎn)SiC碳化硅MOSFET全面取代超結MOSFET,電源客戶從超結MOSFET升級至650V碳化硅MOSFET的根本
    的頭像 發(fā)表于 03-01 08:53 ?520次閱讀
    超結MOSFET升級至650V碳化硅MOSFET的根本<b class='flag-5'>驅動力</b>分析

    AI芯片:科技變革的核心驅動力

    近年來,人工智能(AI)的飛速發(fā)展對眾多行業(yè)產(chǎn)生了深遠影響,芯片領域也不例外。AI在芯片設計、制造及應用等方面帶來了革新性的改變,成為推動芯片行業(yè)發(fā)展的關鍵力量。
    的頭像 發(fā)表于 02-18 17:45 ?568次閱讀

    如今AI在不斷發(fā)展,做連接器行業(yè)的更應該注意什么?

    在這一浪潮中既面臨著巨大的機遇,也迎來了前所未有的挑戰(zhàn)。 因此作為蓬生電子的一員,很關注諸如此類的問題,如何能在人工智能時代抓住機遇,實現(xiàn)長遠發(fā)展?是我們需要思考的問題。
    發(fā)表于 02-08 17:04

    解鎖機器人數(shù)據(jù)中臺:智能制造的“超級大腦”

    一、智能制造浪潮中的數(shù)據(jù)力量 在當今時代,智能制造正以前所未有的速度席卷全球,成為推動產(chǎn)業(yè)升級和經(jīng)濟發(fā)展的核心驅動力。從汽車制造到電子設備生
    的頭像 發(fā)表于 02-05 17:47 ?408次閱讀
    解鎖機器人<b class='flag-5'>數(shù)據(jù)</b>中臺:智能制造的“超級大腦”

    浪潮信息SATA SSD推動數(shù)據(jù)存儲技術發(fā)展

    在全球數(shù)字化轉型的浪潮中,數(shù)據(jù)成為驅動社會進步和創(chuàng)新的核心動力。隨著互聯(lián)網(wǎng)、人工智能、大數(shù)據(jù)技術
    的頭像 發(fā)表于 01-22 18:02 ?748次閱讀

    開源技術加速金融行業(yè)創(chuàng)新發(fā)展

    在快速變化的數(shù)字時代,每一次技術革新都在深刻塑造人們的生活方式和各行各業(yè)的發(fā)展。金融行業(yè),作為數(shù)字經(jīng)濟的驅動力量,正面臨著一場深刻的結構性變革。傳統(tǒng)金融模式正在被重新塑造,推進數(shù)字經(jīng)濟發(fā)展
    的頭像 發(fā)表于 01-14 10:04 ?503次閱讀

    驅動鈦絲(SMA)的可靠性設計(4) 力量設計

    結構設計第二個要點,力量設計。為了方便描述,我們先做如下定義:鈦絲驅動力,鈦絲通電后產(chǎn)生的收縮力:Fq鈦絲應變力,鈦絲未通電前自身的應力:F0初始載荷力,提前給鈦絲配置的初始拉力:F1鈦絲執(zhí)行后的載荷力量
    發(fā)表于 11-27 17:49

    速程精密直線旋轉執(zhí)行器:工業(yè)自動化的核心驅動力

    速程精密直線旋轉執(zhí)行器:工業(yè)自動化的核心驅動力 在快速發(fā)展的工業(yè)4.0時代,自動化與智能化已成為推動制造業(yè)轉型升級的關鍵力量。而在這一變革的浪潮中,速程精密直線旋轉執(zhí)行器以其卓越的性能
    的頭像 發(fā)表于 09-13 18:04 ?583次閱讀

    PD協(xié)議芯片:快充技術的核心驅動力

    PD協(xié)議芯片作為快充技術的核心驅動力,正以其卓越的性能和廣泛的應用前景引領著行業(yè)的發(fā)展。通過不斷的技術創(chuàng)新和應用拓展,PD芯片將繼續(xù)為用戶帶來更加高效、安全、便捷的充電體驗。隨著物聯(lián)網(wǎng)
    的頭像 發(fā)表于 08-14 09:35 ?1290次閱讀

    歐姆龍自動化攜手格力智能裝備賦能多行業(yè)發(fā)展新契機

    當前,“智改數(shù)轉”正成為眾多工業(yè)制造企業(yè)實現(xiàn)打通生產(chǎn)“快車道”、促進自身產(chǎn)業(yè)升級發(fā)展的核心驅動力。
    的頭像 發(fā)表于 08-05 10:39 ?902次閱讀