AI聊天機(jī)器人、自動(dòng)化制造設(shè)備、自動(dòng)駕駛汽車(chē)……各種帶寬密集型應(yīng)用蓬勃發(fā)展,推動(dòng)芯片設(shè)計(jì)從單片式片上系統(tǒng)(SoC)轉(zhuǎn)向Multi-Die系統(tǒng)。通過(guò)將多個(gè)裸片或小芯片集成到單個(gè)封裝中,開(kāi)發(fā)者可以擴(kuò)展系統(tǒng)功能,降低風(fēng)險(xiǎn)并縮短產(chǎn)品上市時(shí)間。
但是,Multi-Die系統(tǒng)開(kāi)發(fā)本身也有挑戰(zhàn),驗(yàn)證方面尤其困難重重。驗(yàn)證過(guò)程必須非常詳盡,才能發(fā)現(xiàn)嚴(yán)重錯(cuò)誤并實(shí)現(xiàn)高性能設(shè)計(jì)。因此,2.5D或3D芯片技術(shù)對(duì)驗(yàn)證過(guò)程的影響可能超乎人們的想象。
不過(guò),新思科技的VCS功能驗(yàn)證解決方案的原生框架支持分布式仿真,讓開(kāi)發(fā)者能夠?qū)⒋笮头抡嫒蝿?wù)分成若干較小任務(wù)運(yùn)行,從而擺脫容量限制,最大限度減少錯(cuò)誤,打造更出色的Multi-Die系統(tǒng)。本文將詳細(xì)介紹分布式仿真的相關(guān)內(nèi)容并說(shuō)明英偉達(dá)如何借此提升仿真性能。
分布式仿真助力功能驗(yàn)證
仿真是功能驗(yàn)證的主要方法,能夠發(fā)現(xiàn)設(shè)計(jì)中的大多數(shù)錯(cuò)誤。隨著Multi-Die系統(tǒng)日益成為主流,芯片制造商已研究出了多種方法應(yīng)對(duì)開(kāi)發(fā)過(guò)程中的各類(lèi)挑戰(zhàn)。Multi-Die系統(tǒng)規(guī)模龐大,仿真工作繁多,無(wú)法一次完成,因此許多芯片制造商選擇“拆分”運(yùn)行。但是,這種手動(dòng)方法需要編寫(xiě)腳本,還需將多次運(yùn)行的結(jié)果進(jìn)行整合,非常耗時(shí)且容易出錯(cuò)。此外,該方法通常不支持復(fù)用。
分布式仿真技術(shù)允許多個(gè)可執(zhí)行文件并行仿真,且無(wú)身份限制。換言之,同一仿真可執(zhí)行文件(simv)可以運(yùn)行N次,每次與不同的simv一起運(yùn)行,也可根據(jù)需要組合運(yùn)行。它同時(shí)支持寄存器傳輸級(jí)(RTL)互連和測(cè)試平臺(tái)互連,較采用單一可執(zhí)行文件的方法性能更佳。設(shè)置內(nèi)部解決方案可能需要耗費(fèi)數(shù)周時(shí)間,而分布式仿真只需短短幾天即可完成準(zhǔn)備并開(kāi)始運(yùn)行,所需內(nèi)存資源較少,因而可以節(jié)省與大容量主機(jī)和集群計(jì)算機(jī)相關(guān)的成本。
分布式仿真的工作方式相當(dāng)簡(jiǎn)單。首先,用戶(hù)將仿真任務(wù)分為多個(gè)可執(zhí)行文件,每個(gè)simv均使用一個(gè)額外的開(kāi)關(guān)進(jìn)行編譯。運(yùn)行時(shí)配置文件指定要連接的RTL和測(cè)試平臺(tái)部分。運(yùn)行期間:
simv實(shí)例實(shí)際上就是單片式SoC,可以按任意順序獨(dú)立啟動(dòng),并將特定選項(xiàng)作為開(kāi)關(guān)傳遞
主simv使用單獨(dú)的開(kāi)關(guān),負(fù)責(zé)控制仿真并承擔(dān)主要工作
主simv調(diào)用單獨(dú)的服務(wù)器進(jìn)程來(lái)控制通信
運(yùn)行結(jié)束時(shí),所有仿真均生成單獨(dú)的可執(zhí)行文件,從而提供單個(gè)仿真結(jié)果
分布式仿真的使用模型
在今年春季舉辦的2023年SUNG硅谷大會(huì)上,英偉達(dá)介紹了其使用分布式仿真驗(yàn)證多芯片GPU系統(tǒng)的情況。傳統(tǒng)方法涉及多個(gè)步驟,并需要大量時(shí)間和內(nèi)存資源。對(duì)每個(gè)獨(dú)立的芯片進(jìn)行仿真本就需要消耗大量資源,而對(duì)整個(gè)Multi-Die系統(tǒng)進(jìn)行仿真所需的內(nèi)存和運(yùn)行時(shí)間則是預(yù)期的2倍以上。
英偉達(dá)高級(jí)驗(yàn)證開(kāi)發(fā)者Kartik Mankad在會(huì)上的演講中指出:“借助新思科技的分布式仿真技術(shù),我們可以輕松地對(duì)不同類(lèi)型的Multi-Die系統(tǒng)進(jìn)行仿真,參與團(tuán)隊(duì)無(wú)需投入更多精力,也無(wú)需擔(dān)心集成和復(fù)用問(wèn)題,并可保留每個(gè)單芯片環(huán)境的全部功能。與傳統(tǒng)方法相比,新思科技VCS功能驗(yàn)證解決方案的分布式仿真功能將仿真速度提高了2倍?!?/p>
總結(jié)
隨著AI和高性能計(jì)算等應(yīng)用的激增,Multi-Die系統(tǒng)能夠幫助芯片制造商應(yīng)對(duì)日益繁重的計(jì)算工作負(fù)載難題。在芯片開(kāi)發(fā)過(guò)程中,仿真長(zhǎng)期以來(lái)一直都是功能驗(yàn)證的主要方法,可以詳盡檢測(cè)出各種錯(cuò)誤,確保設(shè)計(jì)如期進(jìn)行。但Multi-Die系統(tǒng)也帶來(lái)了新的挑戰(zhàn)。
Multi-Die系統(tǒng)復(fù)雜且規(guī)模龐大,仿真工作量巨大,無(wú)法在一次運(yùn)行中完成,因此,芯片制造商轉(zhuǎn)而采用內(nèi)部開(kāi)發(fā)的解決方案來(lái)拆分仿真工作,但這種方法需要手動(dòng)操作,并且非常耗時(shí)。目前,市場(chǎng)領(lǐng)先的新思科技VCS功能驗(yàn)證解決方案提供了全新的技術(shù),相比傳統(tǒng)方法,可將Multi-Die系統(tǒng)的仿真速度提高2倍。借助分布式仿真,設(shè)計(jì)團(tuán)隊(duì)可以將大型仿真作業(yè)分成若干部分運(yùn)行,從而節(jié)省時(shí)間,減少工程工作量,并降低與大容量主機(jī)和集群計(jì)算機(jī)相關(guān)的成本。Multi-Die系統(tǒng)為半導(dǎo)體創(chuàng)新指明了方向,而分布式仿真等驗(yàn)證技術(shù)可以幫助芯片制造商優(yōu)化設(shè)計(jì)結(jié)果。
-
芯片技術(shù)
+關(guān)注
關(guān)注
1文章
165瀏覽量
18076 -
英偉達(dá)
+關(guān)注
關(guān)注
22文章
3952瀏覽量
93750 -
聊天機(jī)器人
+關(guān)注
關(guān)注
0文章
348瀏覽量
12797
原文標(biāo)題:VCS:助力英偉達(dá)開(kāi)啟Multi-Die系統(tǒng)仿真二倍速
文章出處:【微信號(hào):Synopsys_CN,微信公眾號(hào):新思科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
英偉達(dá)GTC25亮點(diǎn):NVIDIA Blackwell Ultra 開(kāi)啟 AI 推理新時(shí)代
新思科技攜手英偉達(dá)加速芯片設(shè)計(jì),提升芯片電子設(shè)計(jì)自動(dòng)化效率
利用新思科技Multi-Die解決方案加快創(chuàng)新速度

新思科技全新40G UCIe IP解決方案助力Multi-Die設(shè)計(jì)
利用Multi-Die設(shè)計(jì)的AI數(shù)據(jù)中心芯片對(duì)40G UCIe IP的需求

新思科技Multi-Die系統(tǒng)如何滿(mǎn)足現(xiàn)代計(jì)算需求

加速拋棄英偉達(dá),微軟又發(fā)布一顆芯片 #微軟 #英偉達(dá) #半導(dǎo)體 #芯片 #電路知識(shí)
英偉達(dá)超越蘋(píng)果成為市值最高 英偉達(dá)取代英特爾加入道指
英偉達(dá)市值躍升全球第二
用OPA340仿真出來(lái)的效果和硬件調(diào)試基本相符,二倍時(shí)150K增益開(kāi)始下降,為什么?
英偉達(dá)擬1.65億美元收購(gòu)OctoAI
英偉達(dá)高管解讀Q2財(cái)報(bào) 但是英偉達(dá)市值暴跌1.4萬(wàn)億元

英偉達(dá)Blackwell架構(gòu)揭秘:下一個(gè)AI計(jì)算里程碑?# 英偉達(dá)# 英偉達(dá)Blackwell
英偉達(dá):Hopper芯片需求強(qiáng)勁 英偉達(dá)發(fā)言人談生產(chǎn)增長(zhǎng)

評(píng)論