一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

50億海量數(shù)據(jù)如何高效存儲和分析? 華為云數(shù)據(jù)庫GaussDB (for Cassandra) 3個秘訣搞定

IT科技蘇辭 ? 來源:IT科技蘇辭 ? 作者:IT科技蘇辭 ? 2022-12-01 21:36 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

50億海量數(shù)據(jù)如何高效存儲和分析?

華為云數(shù)據(jù)庫GaussDB (for Cassandra) 3個秘訣搞定

當下,信息社會正在從互聯(lián)網(wǎng)時代走向物聯(lián)網(wǎng)時代,信息交互變得更加龐雜、高效和智能。對于互聯(lián)網(wǎng)公司和IOT企業(yè)來說,既是機遇,也是挑戰(zhàn)。因為,企業(yè)不可避免的要面對數(shù)據(jù)量劇增帶來的一系列問題:如何高效存儲和擴容,如何在對原有業(yè)務(wù)改動最小的情況下做到智能化和實時分析。

針對挑戰(zhàn),華為云GaussDB (for Cassandra)為客戶提供了強擴展、高存儲、高效導(dǎo)入/導(dǎo)出和實時分析等一系列能力,并成功服務(wù)了眾多互聯(lián)網(wǎng)公司和IOT企業(yè),獲得了客戶的高度認可和支持。本文將以其中一個客戶業(yè)務(wù)的痛點問題舉例,聊聊高效存儲和實時分析的3個秘訣。

海量存儲,PB級無感擴展

該用戶在線下本地化部署使用數(shù)據(jù)庫或者使用其他的存儲為云盤的數(shù)據(jù)庫時,常常需要在容量達到閾值時,提前規(guī)劃和申購存儲資源,可能還需要連帶擴容不必要的計算資源。而使用GaussDB (for Cassandra)之后,便再無此煩惱。GaussDB (for Cassandra)采用存算分離架構(gòu),可單獨擴展存儲,高效擴容,業(yè)務(wù)無感,最高可擴展到PB級。

此外,客戶為了做大數(shù)據(jù)分析,將數(shù)據(jù)庫中的數(shù)據(jù)再寫入一份到HDFS中,供MapReduce和Spark分析,同時需要維護兩套資源,維護和資源成本成為了痛點。而客戶使用GaussDB (for Cassandra)之后,可以僅采用GaussDB (for Cassandra)即可完成數(shù)據(jù)庫存儲和對接大數(shù)據(jù)分析的功能,同時GaussDB (for Cassandra)提供了更為易用的CQL接口,讓用戶更加專注功能開發(fā),而不是資源管理。

數(shù)據(jù)變更捕獲和實時分析

客戶的一個使用場景需要將爬蟲或用戶輸入的數(shù)據(jù),進行在線分析和實時推薦業(yè)務(wù),該業(yè)務(wù)中全量數(shù)據(jù)達到了50億條,但增量數(shù)據(jù)不足5億,分析對象主要是每日新增數(shù)據(jù)。在這個場景中,GaussDB (for Cassandra)為客戶提供了streaming服務(wù)+實時分析解決方案,在損失小部分讀寫性能的前提下,客戶端無需改造即可做到數(shù)據(jù)讀寫和實時分析并行,解決方案如下圖,該解決方案主要有以下幾個階段:

1.客戶業(yè)務(wù)用過開源驅(qū)動寫入數(shù)據(jù)到GaussDB (for Cassandra)

2.GaussDB (for Cassandra)對外提供streaming接口,該接口可獲取數(shù)據(jù)變更捕獲

3.客戶構(gòu)建的流服務(wù)組件讀取streaming接口數(shù)據(jù)寫入到指定的Kafka隊列

4.Kafka隊列將streaming數(shù)據(jù)寫入到Spark或者Flink中

5.客戶在Spark中可對增量數(shù)據(jù)做分析,也可合并之后做全量分析

pYYBAGOIraiAcczoAAKXPqDFmpM013.png

全量數(shù)據(jù)導(dǎo)出分析

客戶的另一個業(yè)務(wù)需要周期性對全量數(shù)據(jù)進行分析和處理,但不想影響在線業(yè)務(wù),希望在閑時處理。GaussDB (for Cassandra)提供了全量數(shù)據(jù)導(dǎo)出和分析解決方案,可在業(yè)務(wù)低峰期觸發(fā)任務(wù)進行數(shù)據(jù)導(dǎo)出和冷數(shù)據(jù)分析,數(shù)據(jù)導(dǎo)出速率是開源的10+倍,同時做到對業(yè)務(wù)讀寫基本無影響。如下為互聯(lián)網(wǎng)客戶每周定期導(dǎo)出數(shù)據(jù)分析用戶畫像的解決方案,該方案有以下幾個階段:

1.客戶根據(jù)需求配置ECS規(guī)格,并掛載obsfs并行文件系統(tǒng)

2.客戶在DLF上配置導(dǎo)出作業(yè),包括ECS信息,導(dǎo)出參數(shù)和定時任務(wù)

3.CDM下發(fā)作業(yè)任務(wù)

4.ECS上的導(dǎo)出任務(wù)將GaussDB (for Cassandra)中的指定表指定條件的數(shù)據(jù)導(dǎo)出到obsfs

5.Spark從obsfs中讀取全量數(shù)據(jù)進行數(shù)據(jù)分析

pYYBAGOIrbCABT61AATHjGVJFJs439.png

通過這3個秘訣,華為云GaussDB (for Cassandra)完美解決了難擴展、高成本、變更不及時等問題,實現(xiàn)了海量數(shù)據(jù)的高效存儲和實時分析,為互聯(lián)網(wǎng)公司和IOT企業(yè)的數(shù)字化發(fā)展提供了更多可能。

審核編輯黃昊宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 華為云
    +關(guān)注

    關(guān)注

    3

    文章

    2772

    瀏覽量

    18326
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    HarmonyOS5服務(wù)技術(shù)分享--數(shù)據(jù)庫使用指南

    ??: 敏感數(shù)據(jù)啟用字段級加密(如用戶手機號)。 ? ??總結(jié)?? 華為數(shù)據(jù)庫(CloudDB)讓HarmonyOS應(yīng)用的數(shù)據(jù)管理變得輕
    發(fā)表于 05-22 18:29

    如何保障服務(wù)器數(shù)據(jù)庫的安全與穩(wěn)定

    在數(shù)字化時代,服務(wù)器數(shù)據(jù)庫承載著企業(yè)和個人的海量關(guān)鍵數(shù)據(jù),其安全與穩(wěn)定至關(guān)重要。一旦出現(xiàn)安全漏洞或穩(wěn)定性問題,可能導(dǎo)致數(shù)據(jù)丟失、業(yè)務(wù)中斷等
    的頭像 發(fā)表于 02-12 10:37 ?339次閱讀

    分布式數(shù)據(jù)庫有哪些類型

    分布式數(shù)據(jù)庫有哪些類型?分布式數(shù)據(jù)庫主要類型包括:關(guān)系型分布式數(shù)據(jù)庫、非關(guān)系型分布式數(shù)據(jù)庫
    的頭像 發(fā)表于 01-15 09:43 ?488次閱讀

    構(gòu)建數(shù)據(jù)庫解決方案,基于華為 Flexus X 實例容器化 MySQL 主從同步架構(gòu)

    前言**** 華為 Flexus X 實例,融合柔性算力與智能調(diào)度,為數(shù)據(jù)庫解決方案帶來全新突破。采用容器化 MySQL 主從同步架構(gòu),實現(xiàn)數(shù)據(jù)
    的頭像 發(fā)表于 01-07 17:22 ?613次閱讀
    構(gòu)建<b class='flag-5'>數(shù)據(jù)庫</b>解決方案,基于<b class='flag-5'>華為</b><b class='flag-5'>云</b> Flexus X 實例容器化 MySQL 主從同步架構(gòu)

    數(shù)據(jù)庫是哪種數(shù)據(jù)庫類型?

    數(shù)據(jù)庫是一種部署在虛擬計算環(huán)境中的數(shù)據(jù)庫,它融合了計算的彈性和可擴展性,為用戶提供高效、靈活的數(shù)據(jù)庫
    的頭像 發(fā)表于 01-07 10:22 ?515次閱讀

    一般企業(yè)購買服務(wù)器帶數(shù)據(jù)庫嗎?

    購買服務(wù)器是否帶數(shù)據(jù)庫,這主要取決于所選擇的服務(wù)提供商及其具體的套餐或服務(wù)內(nèi)容。一般來說,服務(wù)器本身是一提供計算能力、
    的頭像 發(fā)表于 01-06 10:25 ?420次閱讀

    華為榮登Gartner?數(shù)據(jù)庫挑戰(zhàn)者象限

    近日,全球知名的信息技術(shù)研究與顧問公司Gartner?正式發(fā)布了其備受矚目的2024年度《數(shù)據(jù)庫管理系統(tǒng)魔力象限報告》。在這份權(quán)威報告中,華為憑借其卓越的表現(xiàn)成功入選挑戰(zhàn)者象限,彰
    的頭像 發(fā)表于 12-31 13:57 ?542次閱讀

    使用華為 X 實例部署圖數(shù)據(jù)庫 Virtuoso 并存儲 6500 萬條大數(shù)據(jù)的完整過程與性能測評

    前言 ? 1. 部署Virtuoso圖數(shù)據(jù)庫的準備工作 ? 1.1 選擇華為X實例的原因 ? 1.2 Virtuoso圖數(shù)據(jù)庫簡介 ? 1.3 環(huán)境準備與系統(tǒng)配置 ? 2. Virt
    的頭像 發(fā)表于 12-25 17:51 ?587次閱讀
    使用<b class='flag-5'>華為</b><b class='flag-5'>云</b> X 實例部署圖<b class='flag-5'>數(shù)據(jù)庫</b> Virtuoso 并<b class='flag-5'>存儲</b> 6500 萬條大<b class='flag-5'>數(shù)據(jù)</b>的完整過程與性能測評

    數(shù)據(jù)庫主機哪個好一點?

    數(shù)據(jù)庫主機哪個好一點?主機和數(shù)據(jù)庫各有優(yōu)勢,選擇哪個更好取決于具體需求。
    的頭像 發(fā)表于 12-04 13:50 ?461次閱讀

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—通過拼接數(shù)據(jù)庫碎片恢復(fù)SQLserver數(shù)據(jù)庫

    運行在存儲上的SQLServer數(shù)據(jù)庫,有1000多個文件,大小幾十TB。數(shù)據(jù)庫每10天生成一NDF文件,每個NDF幾百GB大小。
    的頭像 發(fā)表于 10-31 13:21 ?702次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—通過拼接<b class='flag-5'>數(shù)據(jù)庫</b>碎片恢復(fù)SQLserver<b class='flag-5'>數(shù)據(jù)庫</b>

    服務(wù)器還需要租用數(shù)據(jù)庫嗎?

    如果你的應(yīng)用程序需要處理大量的數(shù)據(jù),并且這些數(shù)據(jù)需要高效的查詢和分析能力,那么租用專業(yè)的數(shù)據(jù)庫服務(wù)可能是更好的選擇。這些服務(wù)通常提供了更高的
    的頭像 發(fā)表于 10-31 10:50 ?340次閱讀

    數(shù)據(jù)庫可以租用嗎?完整租用流程來了

    數(shù)據(jù)庫是可以租用的,這是一種合法且便捷的數(shù)據(jù)存儲和管理方式。數(shù)據(jù)庫
    的頭像 發(fā)表于 10-28 09:54 ?507次閱讀

    一文講清什么是分布式數(shù)據(jù)庫!

    分布式數(shù)據(jù)庫是一種先進的數(shù)據(jù)管理系統(tǒng),它將傳統(tǒng)的數(shù)據(jù)庫技術(shù)與分布式計算、計算和大數(shù)據(jù)處理技
    的頭像 發(fā)表于 10-14 10:06 ?484次閱讀

    恒訊科技分析數(shù)據(jù)庫rds和redis區(qū)別是什么如何選擇?

    數(shù)據(jù)庫RDS(Relational Database Service)和Redis是兩種不同類型的數(shù)據(jù)庫服務(wù),它們有各自的特點和適用場景: 1、數(shù)據(jù)模型:RDS是一種關(guān)系型
    的頭像 發(fā)表于 08-19 15:31 ?837次閱讀

    基于分布式存儲WDS的金融信創(chuàng)承載數(shù)據(jù)庫類關(guān)鍵應(yīng)用

    基于分布式存儲WDS的金融信創(chuàng)承載數(shù)據(jù)庫類關(guān)鍵應(yīng)用
    的頭像 發(fā)表于 08-16 09:42 ?578次閱讀
    基于分布式<b class='flag-5'>存儲</b>WDS的金融信創(chuàng)<b class='flag-5'>云</b>承載<b class='flag-5'>數(shù)據(jù)庫</b>類關(guān)鍵應(yīng)用