近期,鄢貴海團隊研究成果在計算機體系結構領域國際頂級期刊《IEEE Transactions on Computers》中發(fā)表。該研究主要圍繞KPU敏捷計算架構展開,KPU具有超強異構核集成和調度能力,在降低了規(guī)模限制的硬件成本和設計周期的同時,又可通過軟件編程實現(xiàn)不同功能的計算,具有較高的可擴展性和靈活性。中科馭數(shù)DPU芯片基于自研KPU架構設計。以下是部分研究內容:
————————
領域特定架構技術顯著提升了計算性能。然而,隨著數(shù)據(jù)量呈指數(shù)增長以及應用類型的豐富,面向某一特定計算操作的加速器難以處理復雜的工作負載和應用需求,現(xiàn)有的加速器設計也難以滿足大規(guī)模數(shù)據(jù)計算需求。主要挑戰(zhàn)在于建立一個靈活的框架,能夠充分利用這些粗粒度的特定計算加速單元執(zhí)行復雜計算,同時避免硬件集成、編程、系統(tǒng)編譯和運行等引入的額外開銷。
核處理單元(Kernel Processing Unit, KPU)架構基于“軟件定義加速器”方法實現(xiàn),是一種為加速特定領域核心功能計算而設計的協(xié)處理器架構,能夠有效解決“專用”的困境。KPU以功能核作為基本單元,直接對應用中計算密集型應用進行抽象核和高層綜合,實現(xiàn)以數(shù)據(jù)為中心的架構“定制”。KPU具有超強異構核集成和調度能力,一顆 KPU根據(jù)需求可以集成數(shù)十至數(shù)百個功能核。在運行機制上,KPU采用“數(shù)據(jù)驅動并行計算”的方式,運行過程中通過數(shù)據(jù)流來激活不同的功能核進行相應計算。通過高層次綜合,既實現(xiàn)了領域內硬件的統(tǒng)一,降低了規(guī)模限制的硬件成本和設計周期,又能通過軟件編程實現(xiàn)不同功能的計算;特定需求只需要增刪功能核的種類和數(shù)量即可。在整體計算效率提升百倍的前提下,仍然具有非常高的可擴展性和靈活性。
基于KPU架構的思想,面向數(shù)據(jù)庫的KPU-SQL架構的核心是設計統(tǒng)一的接口以整合所有數(shù)據(jù)查詢操作。在硬件架構方面,KPU-SQL集成了多個獨立設計的查詢操作計算單元,通過對這些特定功能計算核的充分優(yōu)化,最大程度上提升數(shù)據(jù)查詢性能。在數(shù)據(jù)管理方面,KPU-SQL集成一種高效數(shù)據(jù)管理系統(tǒng)(DMS)充分優(yōu)化數(shù)據(jù)流,利用流式計算方法最大化片上內存帶寬的利用率。面向數(shù)據(jù)庫查詢這一典型的應用場景,設計KPU指令集架構KISA,從查詢關鍵操作的層次抽象關鍵算子,實現(xiàn)KPU-SQL的并行編程。在上層軟件的支持方面,KPU-SQL提供了一個完整的軟件編程工具并充分優(yōu)化數(shù)據(jù)庫查詢操作執(zhí)行。設計了一種自適應卸載機制,充分協(xié)同CPU和加速器的計算能力,優(yōu)化執(zhí)行中的計算和數(shù)據(jù)傳輸開銷。在數(shù)據(jù)查詢標準測試集TPC的典型實驗中,KPU-SQL比通用CPU和GPU取得24.5倍和8.75倍性能提升。
審核編輯 黃宇
-
IEEE
+關注
關注
7文章
390瀏覽量
48178 -
數(shù)據(jù)庫
+關注
關注
7文章
3907瀏覽量
65957 -
DPU
+關注
關注
0文章
393瀏覽量
24808
發(fā)布評論請先 登錄
【書籍評測活動NO.62】一本書讀懂 DeepSeek 全家桶核心技術:DeepSeek 核心技術揭秘
睿創(chuàng)微納AI芯片技術登上國際計算機體系結構領域頂級會議
美國倍捷連接器再次登陸日本智慧能源周
智己汽車B輪融資94億元,加速核心技術研發(fā)
【「RISC-V體系結構編程與實踐」閱讀體驗】-- SBI及NEMU環(huán)境
【「RISC-V體系結構編程與實踐」閱讀體驗】-- 前言與開篇
2024瑞薩MCU/MPU工業(yè)技術研討會將登陸深滬

評論