談起網(wǎng)絡(luò)擁塞控制,大家可能很熟悉八股文中的“加法增大“、”乘法減小“、”慢開始“、“擁塞避免”、“快重傳”、“快恢復(fù)”等概念。沒(méi)錯(cuò),這是一種經(jīng)典網(wǎng)絡(luò)擁塞控制算法的基礎(chǔ)理論,但在實(shí)際的實(shí)現(xiàn)時(shí)不同的擁塞控制算法,有很大差別。本文從Linux內(nèi)核源碼中學(xué)習(xí)網(wǎng)絡(luò)擁塞控制算法的具體實(shí)現(xiàn)框架。從當(dāng)前網(wǎng)絡(luò)擁塞控制算法的發(fā)展歷程上看,網(wǎng)絡(luò)擁塞控制算法的類型主要有以下四種:
基于丟包的擁塞控制算法,這類算法將丟包視為發(fā)生了網(wǎng)絡(luò)擁塞。采取緩慢的探測(cè)方式,逐漸增大擁塞窗口,當(dāng)出現(xiàn)丟包時(shí),將擁塞窗口減少,代表的算法有Tahoe、Reno、NewReno、BIC、Cubic等。
基于延時(shí)的擁塞控制算法,這類算法將延時(shí)增大視為發(fā)生了網(wǎng)絡(luò)擁塞,延時(shí)增大時(shí)減少擁塞窗口,延時(shí)減少時(shí)增大擁塞窗口,代表的算法有Vegas、Westwood等。
基于鏈路容量的擁塞控制算法,代表算法是BBR,其采用了另類的方式,不再使用丟包、延時(shí)等信號(hào)去衡量擁塞是否發(fā)生,而是直接對(duì)網(wǎng)絡(luò)建模來(lái)避免以及應(yīng)對(duì)真實(shí)的網(wǎng)絡(luò)擁塞。
基于學(xué)習(xí)的擁塞控制算法,這類算法也沒(méi)有特定的擁塞信號(hào),一般是基于訓(xùn)練數(shù)據(jù)、評(píng)價(jià)函數(shù),通過(guò)機(jī)器學(xué)習(xí)生成網(wǎng)絡(luò)擁塞控制策略模型,代表算法有Remy、PCC、Aurora、DRL-CC、Orca等。
由于每類擁塞控制算法的核心理念有很大差別,關(guān)于每種算法的實(shí)現(xiàn)與原理在后續(xù)的文章中進(jìn)行呈現(xiàn)。
本次文章先對(duì)Linux內(nèi)核中網(wǎng)絡(luò)擁塞控制實(shí)現(xiàn)細(xì)節(jié)、大致框架,進(jìn)行分析和大概學(xué)習(xí)。在進(jìn)行正式的分析前先簡(jiǎn)單梳理一下常識(shí)與概念:
什么是網(wǎng)絡(luò)擁塞:網(wǎng)絡(luò)擁塞是指在網(wǎng)絡(luò)中傳輸?shù)臄?shù)據(jù)量超過(guò)網(wǎng)絡(luò)鏈路或節(jié)點(diǎn)的處理能力,導(dǎo)致網(wǎng)絡(luò)延遲增加、丟包率升高和帶寬利用率下降的現(xiàn)象。
窗口(Window):如下圖的TCP協(xié)議頭中占據(jù)16位,用于接收端告訴發(fā)送端還有多少緩沖區(qū)可以接收數(shù)據(jù)。
滑動(dòng)窗口、發(fā)送窗口:下圖所示黑色方框代表發(fā)送窗口?;瑒?dòng)窗口只是一種形象的稱呼,即發(fā)送窗口一直移動(dòng)從而達(dá)到發(fā)送新的數(shù)據(jù)的目的,如下圖當(dāng)接收到接收端發(fā)來(lái)的ACK數(shù)據(jù)包后發(fā)送窗口向右移動(dòng)。圖中灰色的方框代表已經(jīng)發(fā)送且確認(rèn)的數(shù)據(jù),紅色代表已發(fā)送且剛剛確認(rèn)的數(shù)據(jù),正是因?yàn)閯倓偞_認(rèn)了5byte的數(shù)據(jù),才驅(qū)動(dòng)發(fā)送窗口可以向右移動(dòng)5個(gè)單位,使得序號(hào)52~56的數(shù)據(jù)(綠色方框,代表允許發(fā)送的待發(fā)送數(shù)據(jù))可以發(fā)送,當(dāng)37 ~51區(qū)間的數(shù)據(jù)(藍(lán)色方框,代表發(fā)送但未確認(rèn)的數(shù)據(jù)包)能夠被確認(rèn)時(shí),發(fā)送窗口才能向右滑動(dòng)。發(fā)送窗口前方的數(shù)據(jù)(黃色方框,不允許發(fā)送的待發(fā)送數(shù)據(jù))只能等待發(fā)送窗窗口區(qū)間內(nèi)才能發(fā)送。TCP的滑動(dòng)窗口是動(dòng)態(tài)的,我們可以想象成小學(xué)常見(jiàn)的一個(gè)數(shù)學(xué)題,一個(gè)水池,體積V,每小時(shí)進(jìn)水量V1,出水量V2。當(dāng)水池滿了就不允許再注入了,如果有個(gè)液壓系統(tǒng)控制水池大小,那么就可以控制水的注入速率和量。這樣的水池就類似TCP的窗口。應(yīng)用根據(jù)自身的處理能力變化,通過(guò)本端TCP接收窗口大小控制來(lái)對(duì)對(duì)對(duì)端的發(fā)送窗口流量限制。
擁塞窗口:上面介紹了發(fā)送窗口的概念,在TCP協(xié)議中有一個(gè)反映網(wǎng)絡(luò)傳輸能力的變量,叫做擁塞窗口(congestion
window),記作cwnd。發(fā)送端實(shí)際的發(fā)送窗口大小實(shí)際是為 接收端通告窗口 rwnd 與 擁塞窗口 cwnd 較小的那個(gè)值。
W=min(cwnd,rwnd)
-
內(nèi)核
+關(guān)注
關(guān)注
3文章
1416瀏覽量
41451 -
Linux
+關(guān)注
關(guān)注
87文章
11511瀏覽量
213882 -
網(wǎng)絡(luò)
+關(guān)注
關(guān)注
14文章
7815瀏覽量
90989
發(fā)布評(píng)論請(qǐng)先 登錄
Linux內(nèi)核網(wǎng)絡(luò)的TCP傳輸控制塊相關(guān)資料分享
基于衛(wèi)星網(wǎng)絡(luò)的TCP擁塞控制算法
Linux中傳輸控制協(xié)議的擁塞控制分析
高速網(wǎng)絡(luò)中TCP擁塞控制算法的研究
嵌入式LINUX內(nèi)核網(wǎng)絡(luò)棧(源代碼)

基于模糊控制和壓縮感知的無(wú)線傳感網(wǎng)絡(luò)擁塞算法

具有預(yù)測(cè)與自我調(diào)節(jié)能力的擁塞控制算法

防止網(wǎng)絡(luò)擁塞現(xiàn)象的TCP擁塞控制算法
如何使用Linux內(nèi)核實(shí)現(xiàn)USB驅(qū)動(dòng)程序框架

如何用eBPF寫TCP擁塞控制算法?
伙伴算法如何才能在Linux內(nèi)核中實(shí)現(xiàn)應(yīng)用及其改進(jìn)

Linux內(nèi)核配置的網(wǎng)絡(luò)資料說(shuō)明
Linux內(nèi)核網(wǎng)絡(luò)擁塞控制算法的實(shí)現(xiàn)框架(二)

Linux內(nèi)核網(wǎng)絡(luò)擁塞控制算法的實(shí)現(xiàn)框架(三)

評(píng)論