一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大數(shù)據(jù)核心技術(shù)/特點/通用應(yīng)用

h1654155282.3538 ? 來源:華章科技 ? 作者:華章科技 ? 2021-01-17 11:51 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

01 大數(shù)據(jù)概念

數(shù)據(jù)發(fā)展推動科技進(jìn)步,海量數(shù)據(jù)給數(shù)據(jù)分析帶來了新的機(jī)遇和挑戰(zhàn)。大數(shù)據(jù)是一種強(qiáng)大到在獲取、存儲、管理、分析方面遠(yuǎn)遠(yuǎn)超出傳統(tǒng)數(shù)據(jù)庫軟件工具能力范圍的數(shù)據(jù)集合,具有海量的數(shù)據(jù)規(guī)模、快速的數(shù)據(jù)流轉(zhuǎn)、多樣的數(shù)據(jù)類型和較低的價值密度這四大特征。

于是,我們需要新的處理模式來實現(xiàn)更強(qiáng)的數(shù)據(jù)處理能力以應(yīng)對多樣化的信息資產(chǎn)。

大數(shù)據(jù)技術(shù)追求的不是精確性的樣本數(shù)據(jù),而是面向全體的數(shù)據(jù),這部分?jǐn)?shù)據(jù)可能是不精確的、非結(jié)構(gòu)化的,但大數(shù)據(jù)技術(shù)正是利用這些之前未被利用的數(shù)據(jù),創(chuàng)造新的價值。

從海量數(shù)據(jù)中獲得的數(shù)據(jù)處理結(jié)果可能是超乎我們的認(rèn)知邏輯的,但是我們并不需要理解結(jié)果背后的因果關(guān)系。簡言之,我們需要用相關(guān)思維替代因果思維。

02 大數(shù)據(jù)核心技術(shù)

大數(shù)據(jù)在信息系統(tǒng)的生命周期中,從數(shù)據(jù)源到最終產(chǎn)生有價值的可視化信息,主要經(jīng)歷6個步驟,分別是數(shù)據(jù)收集、數(shù)據(jù)存儲、資源管理與服務(wù)協(xié)調(diào)、計算框架確定、數(shù)據(jù)分析和數(shù)據(jù)可視化,此過程涵蓋了海量分布式系統(tǒng)、數(shù)據(jù)庫、并行計算框架、數(shù)據(jù)挖掘等方面的技術(shù)。

圖2-1羅列了大數(shù)據(jù)技術(shù)中各個步驟目前所對應(yīng)的主流技術(shù)體系,大數(shù)據(jù)的相關(guān)技術(shù)日新月異、層出不窮,由于篇幅限制,不再一一列舉。

o4YBAGADtGyAMdSEAAHh1vrOIbI674.png

▲圖2-1 大數(shù)據(jù)的主流技術(shù)體系

03 大數(shù)據(jù)特點

大數(shù)據(jù)具有海量的數(shù)據(jù)規(guī)模、快速的數(shù)據(jù)流轉(zhuǎn)、多樣的數(shù)據(jù)類型和較低的價值密度這四大特征,下面將分別進(jìn)行詳細(xì)闡述。

1. 海量的數(shù)據(jù)規(guī)模(Volume)

大數(shù)據(jù)所采集、存儲和計算的數(shù)據(jù)規(guī)模都非常大。隨著互聯(lián)網(wǎng)的廣泛應(yīng)用,使用互聯(lián)網(wǎng)的人和企業(yè)等增多,數(shù)據(jù)的創(chuàng)造者變多,數(shù)據(jù)量呈幾何級增長。近年來,隨著數(shù)據(jù)維度變多、數(shù)據(jù)類型增加、數(shù)據(jù)的描述能力增強(qiáng),數(shù)據(jù)可以傳達(dá)的信息也越來越多,越來越準(zhǔn)確。

2. 快速的數(shù)據(jù)流轉(zhuǎn)(Velocity)

大數(shù)據(jù)不僅增長速度快,處理速度也快,有很強(qiáng)的時效性。在信息時代,人成為網(wǎng)絡(luò)的核心,每個人每天都在制造新的數(shù)據(jù),這些數(shù)據(jù)再被相應(yīng)的機(jī)構(gòu)如政府、互聯(lián)網(wǎng)企業(yè)、銀行、電信運營商等收集,形成了一個個龐大的數(shù)據(jù)體系。

面對如此龐大的數(shù)據(jù)體系,處理數(shù)據(jù)并得到結(jié)果的速度越快,數(shù)據(jù)的時效性就越強(qiáng),價值就越高——而大數(shù)據(jù)和傳統(tǒng)數(shù)據(jù)挖掘最大的區(qū)別也在于此,大數(shù)據(jù)更強(qiáng)調(diào)數(shù)據(jù)處理的實時性和時效性。

3. 多樣的數(shù)據(jù)類型(Variety)

大數(shù)據(jù)的種類和來源多樣化,多樣的數(shù)據(jù)為數(shù)據(jù)處理帶來了挑戰(zhàn)。在數(shù)據(jù)結(jié)構(gòu)上,大數(shù)據(jù)可以分為結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù);在具體形式上,大數(shù)據(jù)可以分為視頻、音頻、圖像、博客、社交網(wǎng)絡(luò)、互聯(lián)網(wǎng)搜索等。大數(shù)據(jù)迎接的挑戰(zhàn)就是要針對這些結(jié)構(gòu)不一、形式多樣的數(shù)據(jù),挖掘其中的相關(guān)性。而這些前所未有的、來自各個領(lǐng)域的、不同形式的數(shù)據(jù),賦予了大數(shù)據(jù)強(qiáng)大的威力。

4. 較低的價值密度(Value)

大數(shù)據(jù)的價值密度相對較低。數(shù)據(jù)的價值密度和數(shù)據(jù)的規(guī)模呈反相關(guān),數(shù)據(jù)的規(guī)模越大,數(shù)據(jù)的價值密度越低。大數(shù)據(jù)最大的價值即在于從大量低價值密度數(shù)據(jù)中挖掘出對分析和預(yù)測等有價值的信息。

相較于傳統(tǒng)數(shù)據(jù)挖掘利用結(jié)構(gòu)化的數(shù)據(jù)類型,大數(shù)據(jù)把目光也投向了非結(jié)構(gòu)化的、非抽樣的、包含全體的數(shù)據(jù)類型。這為大數(shù)據(jù)帶來了更多的有效信息,但同時也增加了大量無價值的甚至是錯誤的信息。

04 大數(shù)據(jù)的通用應(yīng)用

大數(shù)據(jù)已經(jīng)滲透到了全世界市場中的各個領(lǐng)域,彰顯著巨大的價值,其在各個領(lǐng)域的詳細(xì)應(yīng)用情況如下。

1. 金融領(lǐng)域

大數(shù)據(jù)在金融領(lǐng)域應(yīng)用廣泛,如針對個人的信貸風(fēng)險評估,銀行根據(jù)用戶的刷卡、轉(zhuǎn)賬、微信評論等數(shù)據(jù)有針對性地推送廣告;理財軟件通過大數(shù)據(jù)為客戶有針對性地推薦理財產(chǎn)品。總結(jié)來說,大數(shù)據(jù)在金融領(lǐng)域的應(yīng)用可以概括為精準(zhǔn)營銷、風(fēng)險控制、效率提升、決策支持。

2. 醫(yī)療領(lǐng)域

醫(yī)療行業(yè)擁有大量的病例、檢測記錄、藥物記錄、治療結(jié)果記錄等,這些數(shù)據(jù)中蘊含著巨大的價值,如果可以加以利用,將對醫(yī)療界產(chǎn)生不可估量的影響。疾病確診和因人而異的治療方案設(shè)定是醫(yī)療領(lǐng)域的重大問題,大數(shù)據(jù)可以幫助建立針對疾病特點、病人狀況以及治療方案的數(shù)據(jù)庫,為人類健康貢獻(xiàn)巨大的力量。

3. 生物領(lǐng)域

各國研究人員正如火如荼地推進(jìn)著人類基因組計劃,這促進(jìn)了生物數(shù)據(jù)的爆發(fā)式增長?;驒z測可以幫助人們對自己現(xiàn)在的以及未來的健康狀況有更深刻、全面的認(rèn)識,甚至可以幫助父母在寶寶出生前就對其健康狀況進(jìn)行檢測。因此,人類基因組計劃是未來人類戰(zhàn)勝疾病的重要工具。

大數(shù)據(jù)可以整合已有的人類基因的檢測結(jié)果并進(jìn)行分析,加速人類基因組研究的進(jìn)程。

4. 零售領(lǐng)域

零售行業(yè)可以利用大數(shù)據(jù)了解顧客的消費偏好和趨勢,用以商品的精準(zhǔn)營銷和相關(guān)產(chǎn)品的精準(zhǔn)推銷,降低運營成本,提高進(jìn)貨管理和過期產(chǎn)品管理效率。大數(shù)據(jù)可以幫助零售商預(yù)測消費者需求趨勢,更高效地提高供應(yīng)鏈滿足需求的能力。對大數(shù)據(jù)帶來的潛在信息的挖掘和有效利用,將成為未來零售領(lǐng)域的必爭之地。

5. 電商領(lǐng)域

電商行業(yè)的數(shù)據(jù)集中、數(shù)據(jù)規(guī)模大,可以利用大數(shù)據(jù)在很多方面進(jìn)行有效信息的分析提取,如用戶消費趨勢、地域消費特點等。

電商領(lǐng)域中的大數(shù)據(jù)應(yīng)用已經(jīng)頗具規(guī)模,電商也是最早利用大數(shù)據(jù)進(jìn)行精準(zhǔn)營銷的行業(yè)。電商可以根據(jù)顧客消費習(xí)慣提前備貨以提高商品送達(dá)效率,還可以通過對客戶瀏覽、收藏、加入購物車和購買記錄等數(shù)據(jù)的分析,對用戶進(jìn)行有效的商品推薦,提高銷量。
責(zé)任編輯人:CC

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    深圳 SMT:現(xiàn)代電子制造的核心技術(shù)

    深圳 SMT 作為現(xiàn)代電子制造的核心技術(shù),在過去的發(fā)展中取得了輝煌成就,在未來也將繼續(xù)引領(lǐng)電子制造行業(yè)的發(fā)展潮流,為全球電子產(chǎn)品的創(chuàng)新和升級提供堅實的技術(shù)支撐。而晉力達(dá)回流焊設(shè)備也將憑借其卓越的性能和不斷創(chuàng)新的技術(shù),在深圳 SM
    的頭像 發(fā)表于 06-23 14:17 ?621次閱讀

    工業(yè)物聯(lián)網(wǎng)的核心技術(shù)是什么

    工業(yè)物聯(lián)網(wǎng)(IIoT)的核心技術(shù)是實現(xiàn)工業(yè)設(shè)備互聯(lián)、數(shù)據(jù)采集、傳輸、處理與應(yīng)用的關(guān)鍵,以下從設(shè)備連接、數(shù)據(jù)采集、通信傳輸、數(shù)據(jù)處理與分析、安全保障五個維度展開介紹: 設(shè)備連接
    的頭像 發(fā)表于 06-12 09:34 ?291次閱讀

    【書籍評測活動NO.62】一本書讀懂 DeepSeek 全家桶核心技術(shù):DeepSeek 核心技術(shù)揭秘

    , incentivize.”也就是說,不要去“教”模型,而要“激勵”它自主探索。 《DeepSeek核心技術(shù)揭秘》是剖析 DeepSeek 技術(shù)原理的專業(yè)技術(shù)書,以全面的內(nèi)容、深入的技術(shù)
    發(fā)表于 06-09 14:38

    比亞迪 · 超級e平臺 · 技術(shù)方案的全面揭秘 | 第三曲: 30000轉(zhuǎn)驅(qū)動電機(jī) · 12項核心技術(shù)揭秘

    比亞迪 · 超級e平臺 · 技術(shù)方案的全面揭秘 | 第三曲: 30000轉(zhuǎn)驅(qū)動電機(jī) · 12項核心技術(shù)揭秘
    的頭像 發(fā)表于 06-08 07:20 ?953次閱讀
    比亞迪 · 超級e平臺 · <b class='flag-5'>技術(shù)</b>方案的全面揭秘 | 第三曲: 30000轉(zhuǎn)驅(qū)動電機(jī) · 12項<b class='flag-5'>核心技術(shù)</b>揭秘

    RFID系統(tǒng):驅(qū)動智能管理的核心技術(shù)架構(gòu)與應(yīng)用實踐

    在萬物互聯(lián)的數(shù)字化時代,RFID(射頻識別)系統(tǒng)憑借其非接觸式識別、批量讀取與實時數(shù)據(jù)更新等特性,成為企業(yè)實現(xiàn)資產(chǎn)、物料及流程智能化管理的核心技術(shù)。本文從技術(shù)架構(gòu)、行業(yè)應(yīng)用、實施策略三大維度,系統(tǒng)解析RFID系統(tǒng)如何重構(gòu)傳統(tǒng)管理
    的頭像 發(fā)表于 04-25 17:34 ?328次閱讀

    北京君正穿戴式ISP芯片的核心技術(shù)

    芯片的“AI-ISP一體化設(shè)計”方案矩陣,以及十幾年ISP行業(yè)的技術(shù)積累,為行業(yè)穿戴式設(shè)備提供高性價比、低功耗的ISP視覺中樞解決方案,為客戶提供更多選擇空間,為各品牌突圍提供核心技術(shù)支撐。
    的頭像 發(fā)表于 04-07 15:46 ?876次閱讀
    北京君正穿戴式ISP芯片的<b class='flag-5'>核心技術(shù)</b>

    大數(shù)據(jù)與云計算是干嘛的?

    大數(shù)據(jù)與云計算是支撐現(xiàn)代數(shù)字化技術(shù)的兩大核心。大數(shù)據(jù)專注于海量數(shù)據(jù)的采集、存儲、分析與價值挖掘;云計算通過虛擬化資源池提供彈性計算、存儲及服
    的頭像 發(fā)表于 02-20 14:48 ?619次閱讀

    深入探討DeepSeek大模型的核心技術(shù)

    導(dǎo)讀 本文深入探討了DeepSeek大模型的核心技術(shù),從公司背景、模型能力、訓(xùn)推成本到核心技術(shù)細(xì)節(jié)進(jìn)行了全面分析。 ? 一、關(guān)于DeepSeek公司及其大模型 1.1 公司概況 DeepSeek
    的頭像 發(fā)表于 02-10 10:49 ?1480次閱讀
    深入探討DeepSeek大模型的<b class='flag-5'>核心技術(shù)</b>

    入河排污口流量自動監(jiān)測系統(tǒng)方案核心技術(shù)與優(yōu)勢

    入河排污口流量自動監(jiān)測系統(tǒng)方案憑借其先進(jìn)的核心技術(shù)展現(xiàn)出顯著優(yōu)勢。無論是精準(zhǔn)的數(shù)據(jù)采集與傳輸,還是高效的實時監(jiān)控與智能分析,都為水環(huán)境管理提供了有力的技術(shù)保障
    的頭像 發(fā)表于 01-14 10:25 ?425次閱讀
    入河排污口流量自動監(jiān)測系統(tǒng)方案<b class='flag-5'>核心技術(shù)</b>與優(yōu)勢

    工業(yè)物聯(lián)網(wǎng)盒子核心功能與技術(shù)特點

    將這些數(shù)據(jù)上傳至云端或本地服務(wù)器進(jìn)行分析處理。工業(yè)物聯(lián)網(wǎng)盒子不僅是數(shù)據(jù)采集的前端,也是實現(xiàn)設(shè)備遠(yuǎn)程監(jiān)控、預(yù)測性維護(hù)、能效優(yōu)化等高級應(yīng)用的基礎(chǔ)。 一、核心功能與技術(shù)
    的頭像 發(fā)表于 11-22 17:21 ?708次閱讀

    智慧城市與大數(shù)據(jù)的關(guān)系

    智慧城市與大數(shù)據(jù)之間存在著密切的關(guān)系,這種關(guān)系體現(xiàn)在大數(shù)據(jù)對智慧城市建設(shè)的支撐和推動作用,以及智慧城市產(chǎn)生的大量數(shù)據(jù)大數(shù)據(jù)技術(shù)的應(yīng)用需求。
    的頭像 發(fā)表于 10-24 15:27 ?1322次閱讀

    晶沛自主研發(fā)氣液集成滑環(huán)關(guān)鍵核心技術(shù)分析

    晶沛電子深耕滑環(huán)行業(yè)近30年,早已具備自主研制氣液集成滑環(huán)的技術(shù)實力-在氣液電集成方面已掌握多項關(guān)鍵核心技術(shù)。
    的頭像 發(fā)表于 10-23 15:05 ?578次閱讀
    晶沛自主研發(fā)氣液集成滑環(huán)關(guān)鍵<b class='flag-5'>核心技術(shù)</b>分析

    新能源汽車小三電的核心技術(shù)

    新能源汽車的核心在于三電系統(tǒng),即電池、電機(jī)和電控。而在這三電系統(tǒng)中,我們又可以細(xì)分為“大三電”與“小三電”。大三電主要包括驅(qū)動電機(jī)、電控和變速器;而小三電則涵蓋高壓配電盒PDU、車載充電機(jī)OBC以及DC/DC變換器。今天,我們就來深入了解一下小三電的核心技術(shù)。
    的頭像 發(fā)表于 10-16 14:45 ?1011次閱讀
    新能源汽車小三電的<b class='flag-5'>核心技術(shù)</b>

    AI網(wǎng)絡(luò)發(fā)展的四大核心技術(shù)支柱

    在AI大模型時代,隨著模型參數(shù)量與訓(xùn)練集規(guī)模的爆炸性增長,單純依賴GPU單體算力的提升已難以滿足需求,業(yè)界焦點逐漸轉(zhuǎn)向系統(tǒng)架構(gòu)層面的革新,其中,作為底層核心技術(shù)的網(wǎng)絡(luò)成為了突破的關(guān)鍵。全球科技巨頭正競相研發(fā)相關(guān)產(chǎn)品技術(shù),AI網(wǎng)絡(luò)技術(shù)
    的頭像 發(fā)表于 08-14 17:11 ?1783次閱讀

    圖像識別算法的核心技術(shù)是什么

    圖像識別算法是計算機(jī)視覺領(lǐng)域的一個重要研究方向,其目標(biāo)是使計算機(jī)能夠像人類一樣理解和識別圖像中的內(nèi)容。圖像識別算法的核心技術(shù)包括以下幾個方面: 特征提取 特征提取是圖像識別算法的基礎(chǔ),它從原始圖像
    的頭像 發(fā)表于 07-16 11:02 ?1323次閱讀