一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

淺析 KV 存儲之長尾時延問題,探尋行業(yè)更優(yōu)解決方案!

jf_21561199 ? 來源:jf_21561199 ? 作者:jf_21561199 ? 2024-04-08 18:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

技術(shù)背景

目前,KV 存儲的廣泛使用極大程度上源于快速訪問的業(yè)務(wù)需求,而這種業(yè)務(wù)通常對時延敏感度高,在較好的平均性能下,還需要解決特定場景下的性能抖動。開源 Redis 在 AOF 重寫、RDB、主從同步等操作時,為不影響主線程,采用 fork 創(chuàng)建子線程去執(zhí)行,但由于主線程仍在提供服務(wù),觸發(fā) Copy-On-Write 時會引起性能抖動,導致長尾時延。

華為云 GeminiDB(原華為云 GaussDBNoSQL,后統(tǒng)稱為 GeminiDB)是采用存算分離架構(gòu)的 NoSQL 多模數(shù)據(jù)庫,在性能、穩(wěn)定性方面業(yè)界領(lǐng)先。KV 接口上,GeminiDB 100%兼容 Redis 5.0 協(xié)議,用戶無需修改代碼即可平遷到 GeminiDB。針對業(yè)界的 Redisfork 技術(shù)痛點,GeminiDB 提供了終極的優(yōu)化方案。

我們先來看下業(yè)界的兩種通用解法:

業(yè)界解法一

實現(xiàn)層面優(yōu)化 fork 問題

常規(guī)的解決方案是在 fork 實現(xiàn)層進行魔改,也就是找到造成 fork 長尾時延的代碼所在然后對其進行優(yōu)化。通過多次實驗發(fā)現(xiàn),fork 的執(zhí)行時間隨著實例大小增長而劇增,其中最耗時的是頁表拷貝操作,如下圖(a)所示,在 Invoke Fork 操作之后,主進程需要花時間進行頁表拷貝,服務(wù)出現(xiàn)毛刺現(xiàn)象。

wKgaomYELrGAUNgDAAF-iQZwWm497.webp

由此產(chǎn)生 fork 重寫的核心思路:由于父進程在 fork 原生內(nèi)部實現(xiàn)中并不純粹,其在頁表復制時仍需陷入內(nèi)核態(tài),出現(xiàn)短暫阻塞現(xiàn)象。通過將父進程耗時占比最高的頁拷貝操作移至子進程去執(zhí)行,足以大幅削弱父進程在 fork 過程中的阻塞現(xiàn)象,從而可以在對程序無任何修改的條件下解決原生 fork 帶來的長尾時延。

業(yè)界有種算法,如上圖(b)所示,可以通過讓子進程去異步完成頁表拷貝動作(Copy Page Table)和主進程主動同步頁表(Proactively Synchronize)來解決毛刺以及主子進程的可能不一致問題,可以做到主進程近乎零阻塞。不難看出,修改 fork 算法有以下幾點優(yōu)勢:

1.實現(xiàn)層面消除了 fork 場景帶來的長尾時延。

2.對內(nèi)存型鍵值存儲服務(wù)完全透明。

但由于涉及魔改操作系統(tǒng) fork 實現(xiàn),導致維護和演進成本較高,向前兼容性較差。相比之下,在架構(gòu)層面去解決這個問題,或許更加簡單且自然。

業(yè)界解法二

架構(gòu)層面優(yōu)化 fork 問題

除了針對 fork 的優(yōu)化,直接消除 fork 或許是工程上更加迫切的需要。

我們分析一下,之所以會有 fork 的引入,是因為 Redis 做了 AOF 重寫、RDB、主從同步的操作。恰恰對于 Redis 這種內(nèi)存型 KV 存儲而言,AOF 操作可以保證了數(shù)據(jù)不丟,而 RDB 和主從同步也是其持久化需要。但如果是非易失型 KV 存儲,從內(nèi)存到持久化介質(zhì)的鏈路就不存在,類 RDB 和類主從同步操作也就可以交給存儲層獨立解決,從而徹底消除 fork 所帶來的長尾時延。

基于此,業(yè)界有些數(shù)據(jù)庫將 KV 數(shù)據(jù)通過其存儲引擎直接寫入持久化介質(zhì)中,且在計算層做了性能上的高度優(yōu)化,達到了不劣于開源 Redis 的性能:

以 PMem 為存儲底座的存算分離架構(gòu)

采用 PMem 作為其主要持久化存儲介質(zhì)的存儲引擎,在某種程度上來說,其兼具 DRAM 的性能和字節(jié)尋址能力以及 SSD 的可持久化特性。下圖是幾種存儲介質(zhì)的對比:

wKgZomYELrKAeBi8AACjoe9IDR818.webp

同時,通過實現(xiàn)存儲引擎的 Cache 模塊,在服務(wù)運行期間存放業(yè)務(wù)熱數(shù)據(jù)的數(shù)據(jù)頁會被加載到 PMem 上,在處理用戶請求期間不再直接操作 SSD 上的數(shù)據(jù)頁,而是操作讀寫延遲更低的 PMem,使得計算層的性能以及吞吐量得到了進一步的提升。

總的來說,使用 PMem 存儲底座的優(yōu)勢在于:

1.沒有 fork 場景,不存在 fork 帶來的長尾時延。

2.提供了比開源 Redis 更大的容量。

3.數(shù)據(jù)可冷熱分級存儲。

但是,強依賴 PMem 也帶來了一些難以解決的問題:

1.非易失型內(nèi)存編程難度高且魯棒性差,需要框架和工具層面去降低其開發(fā)難度,總的來說,開發(fā)和維護成本過高。

2.由于編程復雜,而且 Redis 索引結(jié)構(gòu)繁多,數(shù)據(jù)模型相關(guān) API 高達 300 多個,造成 Redis 命令兼容的實現(xiàn)可靠性極具下降,同樣面臨如何降低編碼復雜度的問題。

3.PMem 相比于 DRAM 有數(shù)量級的性能下降,在讀性能上有 3 倍以上的性能下降以及 10 倍以上的帶寬減少,性能問題不可忽視。

在可靠性和開發(fā)維護成本上,以 PMem 為存儲底座的架構(gòu)還是有一定不足之處。

華為云的 NoSQL 數(shù)據(jù)庫 GeminiDB 在這方面有更加強大的實現(xiàn)方案。GeminiDB 兼容 Redis 接口(原 GaussDB(for Redis),后統(tǒng)稱為 GeminiDB 兼容 Redis 接口),以 RocksDB+分布式文件系統(tǒng)+高性能存儲池為底座,實現(xiàn)了領(lǐng)先的存算分離架構(gòu),綜合表現(xiàn)更佳。

三、華為云 GeminiDB 方案介紹

GeminiDB 存算分離架構(gòu)

華為云 GeminiDB 兼容 Redis 接口,存儲架構(gòu)采用 RocksDB+分布式文件系統(tǒng)+高性能存儲池,如下圖所示,在架構(gòu)層面消除了長尾時延的影響外,通過高性能存儲池提供高可靠存儲特性,分布式文件系統(tǒng)封裝高性能存儲池向外暴露類標準文件系統(tǒng)接口,降低開發(fā)難度。

wKgaomYELrOAbK2iAAGP1pnsyks83.webp

而在性能選擇方面,選擇 RocksDB 作為存儲引擎。它針對快速、低延遲的存儲進行了優(yōu)化,具有極高的寫入吞吐。同時,RocksDB 支持預(yù)寫日志,范圍掃描和前綴搜索,在高并發(fā)讀寫以及大容量存儲時能夠提供一致性的保證。RockDB 的追加寫特征恰好解決了磁盤 I/O 最耗時磁盤尋道時間,達到了接近內(nèi)存隨機讀寫的性能。

高可靠的實現(xiàn),選擇華為研發(fā)的高性能存儲池分布式存儲,最高支持 128TB 的海量存儲,支持跨 AZ 部署、故障秒級切換,保證了在極度惡劣的情況的數(shù)據(jù)無損和快速恢復,支持數(shù)據(jù)的自動備份。

除此之外,分布式文件系統(tǒng)借助 HDFS Snapshot 實現(xiàn)了秒級快照,產(chǎn)生整個文件系統(tǒng)或某個目錄在某個時刻的鏡像,向用戶提供了數(shù)據(jù)恢復、數(shù)據(jù)備份、數(shù)據(jù)測試的能力。

簡言之,通過 RocksDB+分布式文件系統(tǒng)+高性能存儲池的存儲架構(gòu),已經(jīng)做到:

1.低時延,基于高性能的存儲架構(gòu),訪問時延有了高度保障。

2.大容量,基于存算分離,存儲層可自由擴容。

3.低成本,基于冷熱數(shù)據(jù)分級存儲,貼合客戶訴求。

4.高可靠, 基于分布式文件系統(tǒng)+高性能存儲池,支持優(yōu)秀的數(shù)據(jù)備份和數(shù)據(jù)同步特性,且不對主進程造成時延影響。

不過,RocksDB 的數(shù)據(jù)存儲模式也會帶來一些復雜性。由于 RocksDB 存在讀、寫和空間放大的問題,且三者相互制約。盡管 RocksDB 提供了多種 Compaction 策略和參數(shù)以適應(yīng)不同應(yīng)用場景,但由于影響因子過多,策略的選擇和調(diào)參成本會比較高。

小結(jié)

通過不同解決方案之間的對比,在解決長尾時延的問題上,架構(gòu)解決方案更加貼合大多數(shù)客戶訴求。同時,在大部分場景下,GeminiDB 兼容 Redis 接口的架構(gòu)相比于業(yè)界方案提供了更高的可靠性和良好的性能表現(xiàn),預(yù)計年底可達到單片百萬 QPS 的性能水平。

開年采購季云數(shù)據(jù)庫特惠
活動時間:3月1日-31日
云數(shù)據(jù)庫新用戶1年19元起
不限新老1年6.5折起

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 存儲
    +關(guān)注

    關(guān)注

    13

    文章

    4518

    瀏覽量

    87266
  • Gemini
    +關(guān)注

    關(guān)注

    0

    文章

    66

    瀏覽量

    7888
  • 華為云
    +關(guān)注

    關(guān)注

    3

    文章

    2765

    瀏覽量

    18218
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    通信基站中 SMA 插頭的防松解決方案

    未來,我們德索工程師團隊將繼續(xù)秉持對品質(zhì)的執(zhí)著追求,不斷探索技術(shù)創(chuàng)新,為通信基站行業(yè)提供更優(yōu)質(zhì)、更可靠的SMA插頭產(chǎn)品及防松解決方案,助力通信行業(yè)邁向新的高度。?
    的頭像 發(fā)表于 04-03 09:31 ?335次閱讀
    通信基站中 SMA 插頭的防松<b class='flag-5'>解決方案</b>

    曙光超智融合解決方案已落地30多個行業(yè)

    近日,“超智融合”技術(shù)成行業(yè)新熱點,而曙光超智融合解決方案已在氣象、石油、生物醫(yī)藥等30多個行業(yè)落地,支持前沿AI應(yīng)用創(chuàng)新。
    的頭像 發(fā)表于 03-18 09:13 ?511次閱讀

    新能源行業(yè)配套保護監(jiān)測產(chǎn)品解決方案

    新能源行業(yè)配套保護監(jiān)測產(chǎn)品解決方案
    的頭像 發(fā)表于 02-10 08:49 ?473次閱讀
    新能源<b class='flag-5'>行業(yè)</b>配套保護監(jiān)測產(chǎn)品<b class='flag-5'>解決方案</b>

    信而泰網(wǎng)絡(luò)測試儀校準解決方案

    效、更精準的網(wǎng)絡(luò)測試儀校準解決方案。 1、時測量 (1)測量原理:通過線纜將被校儀表與時發(fā)生標準器連接起來形成一個回環(huán)的鏈路拓撲,時發(fā)生器根據(jù)《校準規(guī)范》設(shè)置固定時
    發(fā)表于 01-13 15:29

    軌道交通行業(yè) ICY DOCK硬盤抽取盒解決方案 #軌道交通 #車載 #存儲 #RAID

    存儲
    ICY DOCK硬盤盒
    發(fā)布于 :2024年12月20日 17:38:08

    存儲、高效率、更靈活,拆解聯(lián)核科技“前揀后存”解決方案

    為了解決傳統(tǒng)倉庫低矮、空間小儲量小,庫位不足等行業(yè)痛點,聯(lián)核科技重磅推出四向穿梭車,向密集存儲場景的拓展結(jié)合無人叉車,打造高存儲、高效率的創(chuàng)新四向車前揀后存解決方案
    的頭像 發(fā)表于 12-02 16:01 ?403次閱讀

    安科瑞新能源行業(yè)配套解決方案

    安科瑞新能源行業(yè)配套解決方案
    的頭像 發(fā)表于 11-24 01:01 ?286次閱讀
    安科瑞新能源<b class='flag-5'>行業(yè)</b>配套<b class='flag-5'>解決方案</b>

    美光科技推出新款存儲解決方案

    隨著人工智能(AI)不斷改變行業(yè)并推動創(chuàng)新,數(shù)據(jù)中心需要能夠跟上存儲解決方案的發(fā)展步伐。為滿足這一需求,我很高興地宣布推出新款存儲解決方案
    的頭像 發(fā)表于 11-18 10:32 ?587次閱讀
    美光科技推出新款<b class='flag-5'>存儲</b><b class='flag-5'>解決方案</b>

    emc存儲解決方案的優(yōu)勢

    在當今這個數(shù)據(jù)驅(qū)動的時代,企業(yè)對于數(shù)據(jù)存儲的需求日益增長。EMC,作為全球領(lǐng)先的數(shù)據(jù)存儲解決方案提供商,以其創(chuàng)新的技術(shù)、高性能的產(chǎn)品和全面的服務(wù),幫助企業(yè)實現(xiàn)數(shù)據(jù)的高效管理和利用。 1. 高性能和可
    的頭像 發(fā)表于 11-01 15:16 ?993次閱讀

    基于分布式存儲系統(tǒng)醫(yī)療影像數(shù)據(jù)存儲解決方案

    基于分布式存儲系統(tǒng)醫(yī)療影像數(shù)據(jù)存儲解決方案
    的頭像 發(fā)表于 09-14 09:53 ?658次閱讀
    基于分布式<b class='flag-5'>存儲</b>系統(tǒng)醫(yī)療影像數(shù)據(jù)<b class='flag-5'>存儲</b><b class='flag-5'>解決方案</b>

    基于CSS融合存儲系統(tǒng)的自動化制造服務(wù)平臺存儲解決方案

    基于CSS融合存儲系統(tǒng)的自動化制造服務(wù)平臺存儲解決方案
    的頭像 發(fā)表于 09-10 10:15 ?591次閱讀
    基于CSS融合<b class='flag-5'>存儲</b>系統(tǒng)的自動化制造服務(wù)平臺<b class='flag-5'>存儲</b><b class='flag-5'>解決方案</b>

    西部數(shù)據(jù)亮相P I SHANGHAI 2024:優(yōu)質(zhì)存儲產(chǎn)品組合和豐富影像解決方案

    閃迪大師通過其專業(yè)級的高性能、高可靠性存儲解決方案,滿足了廣泛內(nèi)容創(chuàng)作者和新興行業(yè)的需求。無論是便攜式硬盤、桌面硬盤還是模塊化固態(tài)硬盤系統(tǒng),閃迪大師都致力于為用戶提供高效、可靠的數(shù)據(jù)存儲
    的頭像 發(fā)表于 08-09 16:36 ?573次閱讀
    西部數(shù)據(jù)亮相P I SHANGHAI 2024:優(yōu)質(zhì)<b class='flag-5'>存儲</b>產(chǎn)品組合和豐富影像<b class='flag-5'>解決方案</b>

    液氮罐運輸和存儲溫度監(jiān)測解決方案

    在上篇文章中,我們提到評估液氮罐的尺寸和靜態(tài)持續(xù)時間的重要性不能被低估。接下來讓我們進一步了解在液氮罐運輸充滿各種挑戰(zhàn)的情況下,如何超越傳統(tǒng)溫度監(jiān)測解決方案,提供高精度和可靠性?液氮罐運輸和存儲溫度
    的頭像 發(fā)表于 07-26 14:28 ?740次閱讀
    液氮罐運輸和<b class='flag-5'>存儲</b>溫度監(jiān)測<b class='flag-5'>解決方案</b>

    憶聯(lián)SSD存儲解決方案亮相2024中國國際金融展

    7月19日,為期三天的2024中國國際金融展(簡稱:金融展)在北京國家會議中心開幕。作為國內(nèi)領(lǐng)先的存儲解決方案提供商,憶聯(lián)攜其最新一代PCIe Gen5企業(yè)級SSD及全場景解決方案亮相,并將以“金融
    的頭像 發(fā)表于 07-22 10:52 ?1053次閱讀
    憶聯(lián)SSD<b class='flag-5'>存儲</b><b class='flag-5'>解決方案</b>亮相2024中國國際金融展

    黑龍江電力高性能WDS分布式存儲系統(tǒng)解決方案

    黑龍江電力高性能WDS分布式存儲系統(tǒng)解決方案
    的頭像 發(fā)表于 07-01 09:54 ?653次閱讀
    黑龍江電力高性能WDS分布式<b class='flag-5'>存儲</b>系統(tǒng)<b class='flag-5'>解決方案</b>