一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

減少包頭處理開銷最直接的方法:減少數(shù)據(jù)包數(shù)量

Linux閱碼場(chǎng) ? 來源:Linuxer ? 2020-08-03 16:20 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

背景

目前,有大量的網(wǎng)絡(luò)應(yīng)用在處理數(shù)據(jù)包的時(shí)候只需要處理數(shù)據(jù)包頭,而不會(huì)操作數(shù)據(jù)負(fù)載部分,例如防火墻、TCP/IP協(xié)議棧和軟件交換機(jī)。對(duì)這類網(wǎng)絡(luò)應(yīng)用而言, 包頭處理產(chǎn)生的開銷(稱為“per-packet overhead”)占了整體開銷的大部分。因此,如何減少包頭處理開銷是優(yōu)化這類應(yīng)用性能的關(guān)鍵。

減少包頭處理開銷最直接的方法:減少數(shù)據(jù)包數(shù)量

如何減少包數(shù)量?

增大Maximum Transmission Unit (MTU)。在數(shù)據(jù)量一定的情況下,使用大MTU的數(shù)據(jù)包可攜帶更多數(shù)據(jù),從而減少了包的總量。但MTU值依賴于物理鏈路,我們無法保證數(shù)據(jù)包經(jīng)過的所有鏈路均使用大MTU。

利用網(wǎng)卡特性:Large Receive Offload (LRO),UDP Fragmentation Offload (UFO)和TCP Segmentation Offload (TSO)。如圖1所示,LRO將從物理鏈路收到的TCP包(如1500B)合并為長度更長的TCP包(如64KB);UFO和TSO將上層應(yīng)用發(fā)送的長數(shù)據(jù)負(fù)載的UDP和TCP包(如64KB)拆分成長度更短的數(shù)據(jù)包(如1500B),以滿足物理鏈路的MTU限制。通過在網(wǎng)卡上進(jìn)行包合并和拆分,在不需要任何CPU開銷的情況下,上層應(yīng)用就可以處理數(shù)量大大減少的大包。然而,LRO、TSO和UFO通常只能處理TCP和UDP包,而且并非所有的網(wǎng)卡都支持這些特性。

軟件包合并 (Generic Receive Offload,GRO)和包拆分 (Generic Segmentation Offload,GSO)。與前兩種方法相比,GRO和GSO有兩個(gè)優(yōu)點(diǎn):第一,不依賴于物理鏈路和網(wǎng)卡;第二,能夠支持更多的協(xié)議類型,如VxLAN和GRE。

圖1. LRO、UFO和TSO工作原理

為了幫助基于DPDK的應(yīng)用程序(如Open vSwitch)減少包頭處理開銷,DPDK分別于17.08和17.11支持了GRO和GSO。如圖2所示, GRO和GSO是DPDK中的兩個(gè)用戶庫,應(yīng)用程序直接調(diào)用它們進(jìn)行包合并和分片。

圖2. DPDK GRO和DPDK GSO

1

GRO庫和GSO庫結(jié)構(gòu)

圖3描繪了GRO庫和GSO庫的結(jié)構(gòu)。根據(jù)數(shù)據(jù)包類型,GRO庫定義了不同的GRO類型。每一種GRO類型負(fù)責(zé)合并一種類型的數(shù)據(jù)包,如TCP/IPv4 GRO處理TCP/IPv4數(shù)據(jù)包。同樣的,GSO庫也定義了不同的GSO類型。GRO庫和GSO庫分別根據(jù)MBUF的packet_type域和ol_flags域?qū)⑤斎氲臄?shù)據(jù)包交給對(duì)應(yīng)的GRO和GSO類型處理。

圖3. GRO庫和GSO庫的框架

2

如何使用GRO庫和GSO庫?

使用GRO和GSO庫十分簡(jiǎn)單。如圖4所示,只需要調(diào)用一個(gè)函數(shù)便可以對(duì)包進(jìn)行合并和分片。

圖4. 代碼示例

為了支持不同的用戶場(chǎng)景,GRO庫提供了兩組API:輕量模式API和重量模式API,如圖5所示。輕量模式API應(yīng)用于需要快速合并少量數(shù)據(jù)包的場(chǎng)景,而重量模式API則用于需要細(xì)粒度地控制合包并需要合并大量數(shù)據(jù)包的場(chǎng)景。

圖5. 輕量模式API和重量模式API

3

DPDK GRO的合包算法

算法挑戰(zhàn)

在高速的網(wǎng)絡(luò)環(huán)境下,高開銷的合包算法很可能會(huì)導(dǎo)致網(wǎng)卡丟包。

包亂序(“Packet Reordering”)增加了合包難度。例如Linux GRO無法合并亂序的數(shù)據(jù)包。

這就要求DPDK GRO的合包算法:

足夠輕量以適應(yīng)高速的網(wǎng)絡(luò)環(huán)境

能夠合并亂序包

基于Key的合包算法

為解決上述兩點(diǎn)挑戰(zhàn),DPDK GRO采用基于Key的合包算法,其流程如圖6所示。對(duì)新到的數(shù)據(jù)包,首先按照流(“flow”)對(duì)其進(jìn)行分類,再在其所在的流中尋找相鄰的數(shù)據(jù)包(“neighbor”)進(jìn)行合并。若無法找到匹配的流,就插入一條新流并將數(shù)據(jù)包存儲(chǔ)到新流中。若無法找到鄰居,則將數(shù)據(jù)包存儲(chǔ)到對(duì)應(yīng)的流中。

基于Key的合包算法有兩個(gè)特點(diǎn)。首先,通過流分類來加速數(shù)據(jù)包的合并是十分輕量的一種做法;其次,保存無法合并的數(shù)據(jù)包(如亂序包)使得之后對(duì)其進(jìn)行合并成為可能,故減輕了包亂序?qū)习鼛淼挠绊憽?/p>

圖6. 基于Key的合包算法流程

例如,TCP/IPv4 GRO使用源和目的Ethernet地址、IP地址、TCP端口號(hào)以及TCP Acknowledge Number定義流,使用TCP Sequence Number和IP ID決定TCP/IPv4包是否為鄰居。若兩個(gè)TCP/IPv4的數(shù)據(jù)包能夠合并,則它們必須屬于同一個(gè)流,并且TCP序號(hào)和IP ID必須連續(xù)。

4

DPDK GSO的分片策略

分片流程

如圖7所示,將一個(gè)數(shù)據(jù)包分片有3個(gè)步驟。首先,將包的數(shù)據(jù)負(fù)載分成許多長度更小的部分;其次,為每一個(gè)數(shù)據(jù)負(fù)載部分添加包頭(新形成的數(shù)據(jù)包稱為GSO Segment);最后,為每個(gè)GSO segment更新包頭(如TCP Sequence Number)。

圖7. GSO分片流程

GSO Segment的結(jié)構(gòu)

生成一個(gè)GSO Segment的最簡(jiǎn)單方法就是拷貝包頭和數(shù)據(jù)負(fù)載部分。但頻繁的數(shù)據(jù)拷貝會(huì)降低GSO性能,因此,DPDK GSO采用了一種基于零拷貝的數(shù)據(jù)結(jié)構(gòu)——Two-part MBUF——來組織GSO Segment。如圖8所示,一個(gè)Two-part MBUF由一個(gè)Direct MBUF和多個(gè)Indirect MBUF組成。Direct MBUF用來存儲(chǔ)包頭,Indirect MBUF則類似于指針,指向數(shù)據(jù)負(fù)載部分。利用Two-part MBUF,生成一個(gè)GSO Segment僅需拷貝長度較短的包頭,而不需要拷貝較長的數(shù)據(jù)負(fù)載部分。

圖8. Two-part MBUF的結(jié)構(gòu)

GRO庫和GSO庫的狀態(tài)

目前,GRO庫還處于一個(gè)初期階段,僅對(duì)使用最廣泛的TCP/IPv4數(shù)據(jù)包提供了合包支持。GSO庫則支持更豐富的包類型,包括TCP/IPv4、VxLAN和GRE。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11074

    瀏覽量

    216909
  • 網(wǎng)卡
    +關(guān)注

    關(guān)注

    4

    文章

    326

    瀏覽量

    28032
  • 交換機(jī)
    +關(guān)注

    關(guān)注

    22

    文章

    2740

    瀏覽量

    101866

原文標(biāo)題:怎么提高網(wǎng)絡(luò)應(yīng)用性能?讓DPDK GRO和GSO來幫你!

文章出處:【微信號(hào):LinuxDev,微信公眾號(hào):Linux閱碼場(chǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    藍(lán)牙數(shù)據(jù)通道空口數(shù)據(jù)包

    channel packet的一種。在不引起上下文歧義的時(shí)候,我們把他們統(tǒng)一稱作“數(shù)據(jù)包”。 ? 編輯 LL Control PDU是在Link layer層直接進(jìn)行交互的,也就是說他們不會(huì)
    發(fā)表于 06-03 10:51

    I2C總線數(shù)據(jù)包結(jié)構(gòu)詳解

    。以下是I2C總線數(shù)據(jù)包結(jié)構(gòu)的詳解: 一、I2C總線數(shù)據(jù)包的基本組成 I2C總線上的數(shù)據(jù)傳輸以數(shù)據(jù)包為單位進(jìn)行,每個(gè)數(shù)據(jù)包包含起始信號(hào)、設(shè)備
    的頭像 發(fā)表于 01-17 15:46 ?791次閱讀

    使用tlk2711發(fā)現(xiàn)每次接受的數(shù)據(jù)包頭對(duì),但內(nèi)容錯(cuò)誤,為什么?

    我在使用tlk2711的時(shí)候。發(fā)現(xiàn)每次接受的數(shù)據(jù)包頭對(duì),但內(nèi)容錯(cuò)誤,后來發(fā)現(xiàn)PCB板上芯片底部中心的焊盤是懸空的,沒有接地,請(qǐng)問這會(huì)影響工作嗎?
    發(fā)表于 01-10 07:43

    CAN通信節(jié)點(diǎn)多時(shí),如何減少寄生電容和保障節(jié)點(diǎn)數(shù)量

    導(dǎo)讀在汽車電子與工業(yè)控制等領(lǐng)域,CAN通信至關(guān)重要。本文圍繞CAN通信,闡述節(jié)點(diǎn)增多時(shí)如何減少寄生電容的策略,同時(shí)從發(fā)送、接收節(jié)點(diǎn)等方面,講解保障節(jié)點(diǎn)數(shù)量及通信可靠性的方法。如何減少
    的頭像 發(fā)表于 01-03 11:41 ?3039次閱讀
    CAN通信節(jié)點(diǎn)多時(shí),如何<b class='flag-5'>減少</b>寄生電容和保障節(jié)點(diǎn)<b class='flag-5'>數(shù)量</b>?

    mtu配置步驟詳解 mtu與數(shù)據(jù)包丟失的關(guān)系

    最大的、無需拆即可通過的數(shù)據(jù)包長度。這個(gè)長度加上數(shù)據(jù)包頭(通常為28字節(jié))即為MTU值。 訪問設(shè)備配置
    的頭像 發(fā)表于 12-16 14:33 ?2555次閱讀

    利用P4與Vivado工具簡(jiǎn)化數(shù)據(jù)包處理設(shè)計(jì)

    為設(shè)備就緒的 RTL 代碼,以實(shí)現(xiàn)最佳的硬件實(shí)現(xiàn)。使用 VNP4,您可以顯著減少開發(fā)基于設(shè)備的數(shù)據(jù)包處理系統(tǒng)所需的工程工作量,同時(shí)仍能實(shí)現(xiàn)每 LUT 或每 RAM 的高性能。本白皮書概述了
    的頭像 發(fā)表于 12-04 09:55 ?687次閱讀
    利用P4與Vivado工具簡(jiǎn)化<b class='flag-5'>數(shù)據(jù)包</b><b class='flag-5'>處理</b>設(shè)計(jì)

    設(shè)計(jì)帶ADC電路時(shí),如何用模擬地與數(shù)字地進(jìn)行分割來減少數(shù)字地對(duì)模擬地的影響?

    我在設(shè)計(jì)帶ADC 電路時(shí),希望用模擬地與數(shù)字地進(jìn)行分割來減少數(shù)字地對(duì)模擬地的影響。但是,查詢一些資料得知推薦在ADC 的附近將數(shù)字地與模擬地進(jìn)行單點(diǎn)連接。 但是,數(shù)字地與模擬地難道不是應(yīng)該在總電源
    發(fā)表于 12-03 07:56

    華納云:服務(wù)器平均響應(yīng)時(shí)間和數(shù)據(jù)包大小之間的影響

    的時(shí)間在網(wǎng)絡(luò)上傳輸,因此會(huì)增加整體的響應(yīng)時(shí)間。 解決方法: 對(duì)數(shù)據(jù)進(jìn)行壓縮(如使用 Gzip 或 Brotli),減少傳輸?shù)?b class='flag-5'>數(shù)據(jù)量。 2.網(wǎng)絡(luò)帶寬 影響: 帶寬決定了單位時(shí)間內(nèi)可以傳輸
    的頭像 發(fā)表于 10-10 14:01 ?600次閱讀

    艾體寶干貨 OIDA之四:掌握數(shù)據(jù)包分析-分析的藝術(shù)

    本文是OIDA方法系列的最后一部分,重點(diǎn)介紹了數(shù)據(jù)包分析的“分析”階段。這一最后階段將剖析階段的精煉數(shù)據(jù)轉(zhuǎn)化為可操作的見解,使網(wǎng)絡(luò)管理員和安全專業(yè)人員能夠解決問題、優(yōu)化性能并增強(qiáng)安全性。分析是實(shí)現(xiàn)
    的頭像 發(fā)表于 09-24 11:47 ?466次閱讀
    艾體寶干貨 OIDA之四:掌握<b class='flag-5'>數(shù)據(jù)包</b>分析-分析的藝術(shù)

    請(qǐng)問DCTCP與DCUDP 的登錄數(shù)據(jù)包和心跳數(shù)據(jù)包與服務(wù)器端是如何交互的?

    DCTCP與DCUDP的登錄數(shù)據(jù)包和心跳數(shù)據(jù)包與服務(wù)器端是如何交互的?
    發(fā)表于 07-25 06:37

    使用AT SAVETRANSLINK時(shí)UDP數(shù)據(jù)包丟失怎么解決?

    Android 發(fā)送一個(gè)小 UDP 數(shù)據(jù)包(5 字節(jié))。這個(gè)小數(shù)據(jù)包被我的微控制器在UART上接收到。微控制器將更大的數(shù)據(jù)包(可變長度,約 100 字節(jié))發(fā)送回 UART。ESP在UART上接
    發(fā)表于 07-18 07:17

    能否在ESP結(jié)束之前通過串行端口停止傳入的UDP數(shù)據(jù)包的傳輸以解析下一個(gè)UDP數(shù)據(jù)包?

    丟棄在ESP完成之前不需要的數(shù)據(jù)包,以便通過串行端口發(fā)送它以接收下一個(gè)數(shù)據(jù)包, 如果沒有,我必須按順序讀取所有傳入的數(shù)據(jù)包,需要的和不需要的, 而且波特率不足,主機(jī)處理
    發(fā)表于 07-16 06:18

    將UDP數(shù)據(jù)包發(fā)送到廣播IP地址時(shí)遇到的疑問求解

    保持不變,包括傳輸?shù)?b class='flag-5'>數(shù)據(jù)。 此外,當(dāng) wroom 充當(dāng)客戶端時(shí),我們可以通過遠(yuǎn)程主機(jī)(WIFI 路由器)廣播 UDP 數(shù)據(jù)包方法是使用主機(jī) IP 在 wroom 上創(chuàng)建到主機(jī)的 UDP 連接,并將
    發(fā)表于 07-16 06:07

    如何直接從phy mac層發(fā)送和接收802.11數(shù)據(jù)包?

    我閱讀了完整的文檔(espressif_iot_esp8266ex_development_kit_v0.9.4.zip),但我沒有找到答案: 是否可以訪問 802.11 數(shù)據(jù)包,并通過應(yīng)用程序處理它們? 我希望能夠直接從 p
    發(fā)表于 07-15 08:03

    請(qǐng)問如何使用AT CIPSEND或AT CIPSENDBUF發(fā)送多個(gè)數(shù)據(jù)包

    我可以使用 AT CIPSEND 發(fā)送單個(gè)數(shù)據(jù)包。但是我必須發(fā)送一系列二進(jìn)制數(shù)據(jù)包。如何使用AT CISEND或AT CIPSENDBUF發(fā)送多個(gè)數(shù)據(jù)包,什么是正確的算法? 到目前為止,我嘗試
    發(fā)表于 07-15 07:37