略談kafka的存儲機制

一、kafka的存儲機制

kafka通過topic來分主題存放數(shù)據(jù)，主題內有分區(qū)，分區(qū)可以有多個副本，分區(qū)的內部還細分為若干個segment。

所謂的分區(qū)其實就是在kafka對應存儲目錄下創(chuàng)建的文件夾，文件夾的名字是主題名加上分區(qū)編號，編號從0開始。

1、segment

所謂的segment其實就是在分區(qū)對應的文件夾下產(chǎn)生的文件。

一個分區(qū)會被劃分成大小相等的若干segment，這樣一方面保證了分區(qū)的數(shù)據(jù)被劃分到多個文件中保證不會產(chǎn)生體積過大的文件；另一方面可以基于這些segment文件進行歷史數(shù)據(jù)的刪除，提高效率。

一個segment又由一個.log和一個.index文件組成。

1．.log

.log文件為數(shù)據(jù)文件用來存放數(shù)據(jù)分段數(shù)據(jù)。

2．.index

.index為索引文件保存對對應的.log文件的索引信息。

在.index文件中，保存了對對應.log文件的索引信息，通過查找.index文件可以獲知每個存儲在當前segment中的offset在.log文件中的開始位置，而每條日志有其固定格式，保存了包括offset編號、日志長度、key的長度等相關信息，通過這個固定格式中的數(shù)據(jù)可以確定出當前offset的結束位置，從而對數(shù)據(jù)進行讀取。

3．命名規(guī)則

這兩個文件的命名規(guī)則為：

partition全局的第一個segment從0開始，后續(xù)每個segment文件名為上一個segment文件最后一條消息的offset值，數(shù)值大小為64位，20位數(shù)字字符長度，沒有數(shù)字用0填充。

2、讀取數(shù)據(jù)

開始讀取指定分區(qū)中某個offset對應的數(shù)據(jù)時，先根據(jù)offset和當前分區(qū)的所有segment的名稱做比較，確定出數(shù)據(jù)在哪個segment中，再查找該segment的索引文件，確定當前offset在數(shù)據(jù)文件中的開始位置，最后從該位置開始讀取數(shù)據(jù)文件，在根據(jù)數(shù)據(jù)格式判斷結果，獲取完整數(shù)據(jù)。

二、可靠性保證

1、AR

在Kafka中維護了一個AR列表，包括所有的分區(qū)的副本。AR又分為ISR和OSR。

AR = ISR + OSR。

AR、ISR、OSR、LEO、HW這些信息都被保存在Zookeeper中。

1．ISR

ISR中的副本都要同步leader中的數(shù)據(jù)，只有都同步完成了數(shù)據(jù)才認為是成功提交了，成功提交之后才能供外界訪問。

在這個同步的過程中，數(shù)據(jù)即使已經(jīng)寫入也不能被外界訪問，這個過程是通過LEO-HW機制來實現(xiàn)的。

2．OSR

OSR內的副本是否同步了leader的數(shù)據(jù)，不影響數(shù)據(jù)的提交，OSR內的follower盡力的去同步leader，可能數(shù)據(jù)版本會落后。

最開始所有的副本都在ISR中，在kafka工作的過程中，如果某個副本同步速度慢于replica.lag.time.max.ms指定的閾值，則被踢出ISR存入OSR，如果后續(xù)速度恢復可以回到ISR中。

3．LEO

LogEndOffset：分區(qū)的最新的數(shù)據(jù)的offset，當數(shù)據(jù)寫入leader后，LEO就立即執(zhí)行該最新數(shù)據(jù)。相當于最新數(shù)據(jù)標識位。

4．HW

HighWatermark：只有寫入的數(shù)據(jù)被同步到所有的ISR中的副本后，數(shù)據(jù)才認為已提交，HW更新到該位置，HW之前的數(shù)據(jù)才可以被消費者訪問，保證沒有同步完成的數(shù)據(jù)不會被消費者訪問到。相當于所有副本同步數(shù)據(jù)標識位。

在leader宕機后，只能從ISR列表中選取新的leader，無論ISR中哪個副本被選為新的leader，它都知道HW之前的數(shù)據(jù)，可以保證在切換了leader后，消費者可以繼續(xù)看到HW之前已經(jīng)提交的數(shù)據(jù)。

所以LEO代表已經(jīng)寫入的最新數(shù)據(jù)位置，而HW表示已經(jīng)同步完成的數(shù)據(jù)，只有HW之前的數(shù)據(jù)才能被外界訪問。

5．HW截斷機制

如果leader宕機，選出了新的leader，而新的leader并不能保證已經(jīng)完全同步了之前l(fā)eader的所有數(shù)據(jù)，只能保證HW之前的數(shù)據(jù)是同步過的，此時所有的follower都要將數(shù)據(jù)截斷到HW的位置，再和新的leader同步數(shù)據(jù)，來保證數(shù)據(jù)一致。

當宕機的leader恢復，發(fā)現(xiàn)新的leader中的數(shù)據(jù)和自己持有的數(shù)據(jù)不一致，此時宕機的leader會將自己的數(shù)據(jù)截斷到宕機之前的hw位置，然后同步新leader的數(shù)據(jù)。宕機的leader活過來也像follower一樣同步數(shù)據(jù)，來保證數(shù)據(jù)的一致性。

2、生產(chǎn)者可靠性級別

通過以上的講解，已經(jīng)可以保證kafka集群內部的可靠性，但是在生產(chǎn)者向kafka集群發(fā)送時，數(shù)據(jù)經(jīng)過網(wǎng)絡傳輸，也是不可靠的，可能因為網(wǎng)絡延遲、閃斷等原因造成數(shù)據(jù)的丟失。

kafka為生產(chǎn)者提供了如下的三種可靠性級別，通過不同策略保證不同的可靠性保障。

其實此策略配置的就是leader將成功接收消息信息響應給客戶端的時機。

通過request.required.acks參數(shù)配置：

1：生產(chǎn)者發(fā)送數(shù)據(jù)給leader，leader收到數(shù)據(jù)后發(fā)送成功信息，生產(chǎn)者收到后認為發(fā)送數(shù)據(jù)成功，如果一直收不到成功消息，則生產(chǎn)者認為發(fā)送數(shù)據(jù)失敗會自動重發(fā)數(shù)據(jù)。

當leader宕機時，可能丟失數(shù)據(jù)。

0：生產(chǎn)者不停向leader發(fā)送數(shù)據(jù)，而不需要leader反饋成功消息。

這種模式效率最高，可靠性最低。可能在發(fā)送過程中丟失數(shù)據(jù)，也可能在leader宕機時丟失數(shù)據(jù)。

-1：生產(chǎn)者發(fā)送數(shù)據(jù)給leader，leader收到數(shù)據(jù)后要等到ISR列表中的所有副本都同步數(shù)據(jù)完成后，才向生產(chǎn)者發(fā)送成功消息，如果一只收不到成功消息，則認為發(fā)送數(shù)據(jù)失敗會自動重發(fā)數(shù)據(jù)。

這種模式下可靠性很高，但是當ISR列表中只剩下leader時，當leader宕機讓然有可能丟數(shù)據(jù)。

此時可以配置min.insync.replicas指定要求觀察ISR中至少要有指定數(shù)量的副本，默認該值為1，需要改為大于等于2的值

這樣當生產(chǎn)者發(fā)送數(shù)據(jù)給leader但是發(fā)現(xiàn)ISR中只有l(wèi)eader自己時，會收到異常表明數(shù)據(jù)寫入失敗，此時無法寫入數(shù)據(jù)，保證了數(shù)據(jù)絕對不丟。

雖然不丟但是可能會產(chǎn)生冗余數(shù)據(jù)，例如生產(chǎn)者發(fā)送數(shù)據(jù)給leader，leader同步數(shù)據(jù)給ISR中的follower，同步到一半leader宕機，此時選出新的leader，可能具有部分此次提交的數(shù)據(jù)，而生產(chǎn)者收到失敗消息重發(fā)數(shù)據(jù)，新的leader接受數(shù)據(jù)則數(shù)據(jù)重復了。

3、leader選舉

當leader宕機時會選擇ISR中的一個follower成為新的leader，如果ISR中的所有副本都宕機，怎么辦？

有如下配置可以解決此問題：

unclean.leader.election.enable=false

策略1：必須等待ISR列表中的副本活過來才選擇其成為leader繼續(xù)工作。

unclean.leader.election.enable=true

策略2：選擇任何一個活過來的副本，成為leader繼續(xù)工作，此follower可能不在ISR中。

策略1，可靠性有保證，但是可用性低，只有最后掛了leader活過來kafka才能恢復。

策略2，可用性高，可靠性沒有保證，任何一個副本活過來就可以繼續(xù)工作，但是有可能存在數(shù)據(jù)不一致的情況。

4、kafka可靠性的保證

At most once：消息可能會丟，但絕不會重復傳輸。

At least once：消息絕不會丟，但可能會重復傳輸。

Exactly once：每條消息肯定會被傳輸一次且僅傳輸一次。

kafka最多保證At least once，可以保證不丟，但是可能會重復，為了解決重復需要引入唯一標識和去重機制，kafka提供了GUID實現(xiàn)了唯一標識，但是并沒有提供自帶的去重機制，需要開發(fā)人員基于業(yè)務規(guī)則自己去重。

閱讀全文

存儲機制(6749) 存儲機制(6749)
kafka(5139) kafka(5139)

kafka設計原理的深度探討

Kafka簡介 Kafka是一種分布式的，基于發(fā)布/訂閱的消息系統(tǒng)。主要設計目標如下：以時間復雜度為O(1)的方式提供消息持久化能力，即使對TB級以上數(shù)據(jù)也能保證常數(shù)時間的訪問性能高吞吐率。即使

2020-10-08 07:50:00

1804

Kafka存儲機制詳解

kafka通過topic來分主題存放數(shù)據(jù)，主題內有分區(qū)，分區(qū)可以有多個副本，分區(qū)的內部還細分為若干個segment。所謂的分區(qū)其實就是在kafka對應存儲目錄下創(chuàng)建的文件夾，文件夾的名字是主題名加上

2018-05-08 16:26:09

Kafka存儲數(shù)據(jù)學習

Kafka學習筆記（一）

2020-04-03 11:34:48

Kafka幾個比較重要的配置參數(shù)

Kafka在彈性、容錯性以及高吞吐量方面有著很大的優(yōu)勢。想要達到生產(chǎn)環(huán)境最優(yōu)，發(fā)揮這些特性，需要我們進行一系列的配置。Kafka提供了非常多的配置屬性，對于初學者而言，很容易陷入困惑。其實，多數(shù)

2020-11-04 08:10:24

Kafka基礎入門文檔

kafka系統(tǒng)入門教程（原理、配置、集群搭建、Java應用、Kafka-manager）

2020-03-12 07:22:57

Kafka特性和應用場景

Kafka簡介及部署

2019-06-17 09:31:07

Kafka的全局有序

Kafka如何做到全局有序

2019-10-24 13:51:15

Kafka設計原理的詳細剖析

Kafka設計原理分析

2019-07-11 07:30:45

Kafka配置文件

Kafka基本配置

2019-06-14 13:02:39

Kafka集群環(huán)境的搭建

1、環(huán)境版本版本：kafka2.11，zookeeper3.4注意：這里zookeeper3.4也是基于集群模式部署。2、解壓重命名tar -zxvf

2021-01-05 17:55:37

kafka安裝與測試

kafka安裝及問題解決

2019-10-24 10:44:10

kafka數(shù)據(jù)可靠性深度解讀

At least once，可以保證不丟，但是可能會重復，為了解決重復需要引入唯一標識和去重機制，kafka提供了GUID實現(xiàn)了唯一標識，但是并沒有提供自帶的去重機制，需要開發(fā)人員基于業(yè)務規(guī)則自己去重。

2018-05-08 16:29:29

kafka架構與集群搭建

kafka入門+集群搭建

2019-04-29 17:06:38

kafka消息的保存路徑

kafka消息存儲機制和原理

2019-04-15 17:29:10

kafka相關問題解答

常見的kafka面試題

2019-10-25 06:16:29

kafka集群設置shell腳本一鍵啟動經(jīng)驗總結

kafka集群設置shell腳本一鍵啟動和關閉

2019-09-18 08:54:10

EFK63+kafka+logstash架構解讀

EFK63+kafka+logstash日志分析平臺集群

2019-08-15 11:35:04

Elasticsearch+Fluentd+Kafka數(shù)據(jù)的采集流程講述

的展示,這一塊不做演示,本文只講述數(shù)據(jù)的采集流程.架構數(shù)據(jù)采集流程數(shù)據(jù)的產(chǎn)生使用cadvisor采集容器的監(jiān)控數(shù)據(jù)并將數(shù)據(jù)傳輸?shù)?b class="flag-6" style="color: red">Kafka.數(shù)據(jù)的傳輸鏈路是這樣: Cadvisor-&gt

2022-11-11 16:26:08

STM32_FSMC機制的NORFlash存儲器擴展技術

2014-03-24 15:17:17

Spark Streaming和Kafka做實時計算的注意點

Spark-Streaming 和 Kafka 做實時計算需要注意的點

2020-04-17 06:00:03

Spark Streaming消費Kafka偏移量的管理

如何管理Spark Streaming消費Kafka的偏移量（二）

2019-05-09 09:13:03

從Kafka讀取數(shù)據(jù)操作指南

Kafka消費者——從 Kafka讀取數(shù)據(jù)

2019-09-16 06:42:52

在Spark Streaming集成Kafka時的offset狀態(tài)的管理

如何管理Spark Streaming消費Kafka的偏移量（一）

2019-05-05 09:27:25

基于kafka和zookeeper高可用集群的shell腳本使用步驟

kafka+zookeeper高可用集群搭建shell腳本使用教程

2019-03-11 16:50:36

基于rdKafKa封裝的簡單舒適PHP-KafKa拓展

See-KafKa 簡單舒適的PHP-KafKa拓展

2019-03-12 09:59:54

基于發(fā)布與訂閱的消息系統(tǒng)Kafka

《Kafka權威指南》——初識 Kafka

2020-03-05 13:46:36

基于閃存存儲的Apache Kafka性能提升方法

據(jù)生態(tài)系統(tǒng)中最常用的分布式消息傳遞系統(tǒng)之一的Apache Kafka進行評估，測試如何以最佳方式將美光固態(tài)存儲應用于 Apache Kafka，以及將產(chǎn)生怎樣的收益。A

2019-07-24 06:58:39

大數(shù)據(jù)Kafka數(shù)據(jù)處理過程

大數(shù)據(jù)-Kafka數(shù)據(jù)處理

2020-03-27 11:42:41

如何實時讀取Kafka信息計算存儲？

數(shù)據(jù)日期不是當日數(shù)據(jù)2、運行數(shù)據(jù)風速為空||=-902||風速在 3～12之外3、運行數(shù)據(jù)功率為空||=-902||功率在 -0.5*1500~2*1500之外二、清洗數(shù)據(jù)后存儲HBase1、正常數(shù)...

2021-07-07 07:06:55

手動管理kafka的offset的方法

如何管理Spark Streaming消費Kafka的偏移量（三）

2019-05-16 14:54:43

淺析Kafka的存儲機制

Kafka存儲機制(轉)

2019-11-05 09:24:50

淺析kafka

kafka常見問題

2019-09-29 10:09:31

淺析kafka中相關組件

kafka 中相關組件topic、broker、producer、consumer原理及負載均衡策略

2020-04-03 11:34:48

詳解Kafka學習

Kafka學習筆記

2019-10-12 15:11:03

詳解消息中間件&Kafka

消息中間件&Kafka

2019-09-11 07:54:17

請問英飛凌XC878的存儲器擴展機制誰知道嗎？

大俠幫忙簡述一下英飛凌XC878的存儲器擴展機制{:10:}

2018-12-18 09:43:54

飛思卡爾S12X存儲器分頁機制分析

飛思卡爾S12X存儲器分頁機制分析學習bootloader的童鞋可以看看

2013-10-18 10:01:40

基于雙存儲機制的實時圖像采集存儲系統(tǒng)

針對實時圖像采集和存儲的要求和困難，設計了一個基于 CMOS 圖像傳感器和雙存儲機制的實時圖像采集存儲系統(tǒng)，采用OV7640CMOS 圖像傳感器作為成像器件，在S3C44B0X 處理器控制下

2009-07-30 10:44:07

略談積分中值定理及其應用

略談積分中值定理及其應用:積分中值定理是定積分的一個重要性質，它建立了定積分與被積函數(shù)之間的關系，從而使我們可以通過被積函數(shù)的性質來研究積分的性質，有較高的理

2009-10-11 17:38:19

基于環(huán)結構的傳感器網(wǎng)絡多分辨率數(shù)據(jù)存儲機制

提出了一套基于環(huán)結構的傳感器網(wǎng)絡多分辨率數(shù)據(jù)存儲機制,結合層次結構的存儲查詢方案,有效地利用了環(huán)結構的特性高效、節(jié)能地支持事件信息的不同分辨率的存儲和查詢操作,并

2009-12-30 10:38:28

略談電解電容

略談電解電容一、電解電容在電路中的作用 1，濾波作用，在電源電路中，整流電路將交流變成

2006-04-16 23:46:27

1090

略談變壓器的在線監(jiān)測

略談變壓器的在線監(jiān)測論文關鍵詞：電力變壓器；局部放電；變壓器油色譜；在線監(jiān)測　　論文摘要：文章論述了國內外變壓器在線監(jiān)測的基礎研究領域近期的

2009-11-07 16:41:02

563

非易失性半導體存儲器的相變機制

非易失性半導體存儲器的相變機制非易失性存儲器(NVM)在半導體市場占有重要的一席之地，特別是主要用于手機和其它便攜電子設備的閃存芯片。今后幾年便攜電

2009-12-19 10:37:46

634

非易失性半導體存儲器的相變機制

非易失性半導體存儲器的相變機制非易失性存儲器(NVM)在半導體市場占有重要的一席之地，特別是主要用于手機和

2010-01-11 10:02:22

630

嵌入式Linux文件系統(tǒng)及存儲機制

本文分析了嵌入式系統(tǒng)中常用的存儲設備及其管理機制，介紹了常用的基于FLASH的文件系統(tǒng)類型

2011-05-14 10:22:15

1448

略談4G發(fā)展背景下網(wǎng)絡通信的發(fā)展走向

略談4G發(fā)展背景下網(wǎng)絡通信的發(fā)展走向，網(wǎng)絡通信的技術資料，很好很實用。

2016-03-28 10:43:59

非易失性半導體存儲器的相變機制

2017-01-19 21:22:54

飛思卡爾S12X存儲器分頁機制分析_李翠霞

2017-03-19 11:29:00

Kafka文件存儲機制分析

機制設計是衡量一個消息隊列服務技術水平和最關鍵指標之一。《br》下面將從Kafka文件存儲機制和物理結

2017-09-28 15:40:51

Kafka和消息隊列的關系

本文的目的是讓讀者快速了解Kafka與消息隊列之間的關系，告訴讀者為什么會考慮使用它的原因。以下為譯文。 Kafka最初是由Linkedin社區(qū)開發(fā)的一項技術。簡而言之，它有點像消息隊列系統(tǒng)，但它

2017-09-28 17:15:15

一文讀懂什么是分布式流處理系統(tǒng)Kafka

Kafka是一個分布式流處理系統(tǒng)，流處理系統(tǒng)使它可以像消息隊列一樣publish或者subscribe消息，分布式提供了容錯性，并發(fā)處理消息的機制。

2017-12-12 09:14:52

6296

海量數(shù)據(jù)的非關系型存儲管理機制

針對傳統(tǒng)的關系數(shù)據(jù)存儲系統(tǒng)性能不足、容錯性差，無法適應海量非結構化數(shù)據(jù)管理的問題，提出一種高性能、高可用非關系型存儲管理機制。首先，設計了良好的用戶訪問服務接口，通過高效的一致性哈希算法支持數(shù)據(jù)分發(fā)

2017-12-21 16:54:22

基于云存儲密文安全共享機制

云存儲環(huán)境為海量數(shù)據(jù)的存儲和共享提供方便的同時也帶了安全隱患。為保證數(shù)據(jù)安全，用戶將自己的隱私數(shù)據(jù)加密后存儲在開放的云存儲環(huán)境中，如何建立云存儲環(huán)境下的密文訪問控制機制是亟需

2018-03-07 14:53:49

適用動態(tài)存儲的自適應刷新機制算法設計

為滿足航天應用中數(shù)據(jù)傳輸與存儲中高可靠以及低功耗的要求，實現(xiàn)了一種自適應刷新機制的同步動態(tài)隨機存儲（Synchronous Dynamic Random Access MemorySDRAM）控制器

2018-04-03 16:00:44

阿里云消息隊列Kafka商業(yè)化：支持消息無縫遷移到云上

列Kafka徹底解決了開源產(chǎn)品穩(wěn)定性不足的痛點，可用性達99.9%，數(shù)據(jù)可靠性99.999999%，并且支持消息無縫遷移到云上。7月25日，阿里云宣布正式推出消息隊列Kafka，全面融合開源生態(tài)

2018-07-27 10:49:55

216

阿里云正式推出消息隊列Kafka：兼容開源，數(shù)據(jù)可靠性99.999999%

，消息會持久化落盤到消息隊列，在磁盤容量足夠的情況下，未到期數(shù)據(jù)保障存儲，數(shù)據(jù)可靠性達到99.999999%，服務可用性達99.9%。此外，阿里云消息隊列Kafka還支持數(shù)萬級topic高并發(fā)讀寫

2018-07-31 16:53:03

376

消息隊列服務Kafka揭秘：痛點、優(yōu)勢以及適用場景

在同機房或者多機房的情況下保證其一定可用，而這些往往需要運維人員的思考和權衡。而ZooKeeper上面會存儲Kafka的重要數(shù)據(jù)，當ZK不可用的情況下，整個集群的災備選組以及存儲的數(shù)據(jù)都會受到影響。帶寬

2018-08-09 16:57:26

Kafka的四個基礎概念學習

Kafka 是一個消息系統(tǒng)，原本開發(fā)自 LinkedIn，用作 LinkedIn 的活動流（Activity Stream）和運營數(shù)據(jù)處理管道（Pipeline）的基礎?，F(xiàn)在它已被多家不同類型的公司作為多種類型的數(shù)據(jù)管道和消息系統(tǒng)使用。

2020-05-03 18:20:00

2633

Kafka的再平衡機制的三種分區(qū)重分配

所謂的再平衡，指的是在kafka consumer所訂閱的topic發(fā)生變化時發(fā)生的一種分區(qū)重分配機制。一般有三種情況會觸發(fā)再平衡：

2020-05-03 18:29:00

5510

如何將物聯(lián)網(wǎng)數(shù)據(jù)從設備連接到Kafka集群？

Apache Kafka是一個實時流平臺，在大大小小的組織中得到了廣泛的采用。Kafka的分布式微服務架構和發(fā)布/訂閱協(xié)議使得它非常適合在企業(yè)系統(tǒng)和應用程序之間實時移動數(shù)據(jù)。據(jù)統(tǒng)計，超過三分之一

2020-07-20 09:10:19

1943

如何將物聯(lián)網(wǎng)數(shù)據(jù)從設備連接到Kafka集群？

在與HiveMQ客戶的對話中，一些操作集群具有數(shù)百萬臺設備和非常高的消息吞吐量，我們看到需要為Kafka創(chuàng)建MQTT代理擴展。我們的客戶希望從MQTT和Kafka協(xié)議的本地實現(xiàn)中受益，因為這兩個協(xié)議都有所有的交付保證。因此，我們很高興地宣布Kafka的HiveMQ企業(yè)擴展。

2020-07-28 11:53:38

1332

Aiven使企業(yè)能夠更輕松地訪問Apache Kafka生態(tài)系統(tǒng)

借助Apache Kafka，Kafka Connect和現(xiàn)在的MirrorMaker 2作為服務，Aiven客戶可以專門化其工作負載，在提高彈性的同時減少依賴性。MirrorMaker 2允許企業(yè)輕松地在Kafka集群之間復制數(shù)據(jù)

2020-09-10 16:22:14

1533

Rocket MQ存儲與Kafka存儲對比分析

Kafka單機超過64個隊列/分區(qū)，Load會發(fā)生明顯的飆高現(xiàn)象，隊列越多，load越高，發(fā)送消息響應時間變長。Kafka分區(qū)數(shù)無法過多的問題，RocketMQ單機支持最高5萬個隊列，負載不會發(fā)生明顯變化。

2021-01-14 10:13:39

3144

Kafka框架的工作原理及工作流程

Kafka在大數(shù)據(jù)技術生態(tài)當中，以作為消息系統(tǒng)而聞名，面對活躍的流式數(shù)據(jù)，提供高吞吐量的服務，在實時大數(shù)據(jù)處理場景下，可以說是一大利器，國內外大廠都有應用。今天的大數(shù)據(jù)開發(fā)技術分享，我們就主要來講講Kafka框架的工作原理。

2021-01-15 09:49:56

4742

數(shù)據(jù)庫存儲的內部機制詳解

在這篇文章中，我將會講解一些數(shù)據(jù)庫存儲的內部機制，數(shù)據(jù)庫是如何進行優(yōu)化操作來提供驚人速度及其優(yōu)勢和缺點。

2021-01-20 10:23:51

3917

存儲器陣列間接訪問的機制

MMC設備是一種受管理的存儲器，它定義了一種對存儲器陣列間接訪問的機制。這種間接訪問通常是由分立的控制器使能的。簡介存儲器訪問的優(yōu)點是，存儲器設備可以執(zhí)行幾種后臺存儲器管理任務而不牽涉主機軟件。這使得主機系統(tǒng)的flash管理層更簡單。

2021-03-26 14:43:27

云數(shù)據(jù)的存儲安全審計機制綜述

，使得用戶對保存在云端數(shù)據(jù)安全性及可控性的關注日益増長，國內外學者對此進行了大量的硏究。文中論述了云數(shù)據(jù)在其生命周期各階段的安全風險及其安全審計需求;構建了云存儲數(shù)據(jù)安全審計機制的框架結構，并提岀了審計機制的主

2021-05-10 14:21:49

基于臭氧的Kafka自適應調優(yōu)方法ENLHS

Kafka應用在生產(chǎn)環(huán)境中時，除機器的硬件環(huán)境和系統(tǒng)平臺影響其性能外，Kaka自身的配置項決定著其能否在硬件資源有限的情況下達到理想的性能，但人為修改和調優(yōu)配置項的效率極差。海量數(shù)據(jù)發(fā)送到Kak

2021-05-13 11:39:52

分布式發(fā)布與訂閱系統(tǒng)Apache Kafka在即將發(fā)布的2.8版本

分布式發(fā)布與訂閱系統(tǒng)Apache Kafka在即將發(fā)布的2.8版本，使用Kafka內部的Quorum控制器來取代ZooKeeper，因此用戶第一次可在完全不需要ZooKeeper的情況下執(zhí)行

2021-05-31 09:58:39

1326

為什么Kafka會怎么快 Kafka 的應用場景

“Kafka 是由 LinkedIn 公司推出的一個高吞吐的分布式消息系統(tǒng)，通俗地說就是一個基于發(fā)布和訂閱的消息隊列，溫故而知新，反復學習優(yōu)秀的框架，定有所獲。應用場景 Kafka 的應用場景如下

2021-06-04 16:12:11

1806

Kafka的概念及Kafka的宕機

問題要從一次Kafka的宕機開始說起。筆者所在的是一家金融科技公司，但公司內部并沒有采用在金融支付領域更為流行的 RabbitMQ ，而是采用了設計之初就為日志處理而生的 Kafka ，所以我一直

2021-08-27 11:21:01

1586

探究Kafka宕機引發(fā)的高可用問題

一、Kafka宕機引發(fā)的高可用問題問題要從一次Kafka的宕機開始說起。筆者所在的是一家金融科技公司，但公司內部并沒有采用在金融支付領域更為流行的RabbitMQ ，而是采用了設計之初就為日志

2021-10-20 15:41:11

1249

kafkaUI-lite Kafka UI界面客戶端工具

./oschina_soft/gitee-kafka-ui-lite.zip

2022-06-14 11:07:36

Kafka的核心概念

Kafka 是主流的消息流系統(tǒng)，其中的概念還是比較多的，下面通過圖示的方式來梳理一下 Kafka 的核心概念，以便在我們的頭腦中有一個清晰的認識。

2022-06-20 14:24:32

624

Kafka如何做到那么高的性能

有人說：他曾在一臺配置較好的機子上對 Kafka 進行性能壓測，壓測結果是 Kafka 單個節(jié)點的極限處理能力接近每秒 2000萬條消息，吞吐量達到每秒 600MB。

2022-09-14 17:03:25

782

怎樣去減少Confluent Cloud Kafka運營成本呢

流式數(shù)據(jù)已成為企業(yè)構建和運營出色數(shù)據(jù)產(chǎn)品的必要條件，而 Apache Kafka 已成為實時流式傳輸?shù)臉藴省?/div>

2022-09-23 17:23:43

672

使用數(shù)據(jù)可觀測性減少Confluent Cloud Kafka 運營成本的五種方式

流式數(shù)據(jù)已成為企業(yè)構建和運營出色數(shù)據(jù)產(chǎn)品的必要條件，而 Apache Kafka 已成為實時流式傳輸?shù)臉藴省? 雖然采用 Kafka 變得至關重要，但在如何部署 Kafka 時，數(shù)據(jù)團隊有多種選擇。

2022-09-27 11:50:45

607

MySQL各存儲引擎使用了三種類型的鎖定機制

MySQL數(shù)據(jù)庫由于其自身架構的特點，存在多種數(shù)據(jù)存儲引擎，每種存儲引擎的鎖定機制都是為各自所面對的特定場景而優(yōu)化設計，所以各存儲引擎的鎖定機制也有較大區(qū)別。

2022-11-17 14:09:13

1870

Kafka萬億級消息實戰(zhàn)

這里總結內容主要針對Kafka2.1.1版本，包括集群版本升級、數(shù)據(jù)遷移、流量限制、監(jiān)控告警、負載均衡、集群擴/縮容、資源隔離、集群容災、集群安全、性能優(yōu)化、平臺化、開源版本缺陷、社區(qū)動態(tài)等方面。

2022-11-25 10:31:12

369

什么情況下使用RabbitMQ或 Kafka

如果你問自己是否Apache Kafka比RabbitMQ更好或RabbitMQ是否比Apache Kafka更可靠，我想在這里阻止你。本文將從更廣泛的角度討論這兩種情況。它關注的是這兩個系統(tǒng)提供的功能，并將指導您做出正確的決定，決定何時使用哪個系統(tǒng)。

2023-02-22 10:35:47

378

什么情況下使用RabbitMQ或 Kafka

2023-02-24 11:12:45

398

想要kafka好用你就得知道這些工具

工欲善其事，必先利其器。本文主要分享一下消息中間件kafka安裝部署的過程，以及我平時在工作中針對kafka用的一些客戶端工具和監(jiān)控工具。

2023-05-22 16:33:27

980

Kafka 的簡介

? 1 kafka簡介 2 為什么要用消息系統(tǒng) 3 kafka基礎知識 4 kafka集群架構 5 總結 ? 1 kafka簡介其主要設計目標如下：以時間復雜度為O(1)的方式提供消息持久化能力

2023-07-03 11:10:26

308

物通博聯(lián)5G-kafka工業(yè)網(wǎng)關實現(xiàn)kafka協(xié)議對接到云平臺

Kafka協(xié)議是一種基于TCP層的網(wǎng)絡協(xié)議，用于在分布式消息傳遞系統(tǒng)Apache Kafka中發(fā)送和接收消息。Kafka協(xié)議定義了客戶端和服務器之間的通信方式和數(shù)據(jù)格式，允許客戶端發(fā)送消息到Kafka集群并從中讀取消息。

2023-07-11 10:44:33

271