一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

“一億”是“一千萬(wàn)”的十倍嗎?顯然不是

CAE學(xué)習(xí)之家 ? 來(lái)源:恩宇科技 ? 作者:CAE學(xué)習(xí)之家 ? 2021-10-28 11:14 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

-----1億是1千萬(wàn)的10倍?-----

早期筆者使用矩量法求解線性方程組,在不使用快速多級(jí)方法,自由度達(dá)到3萬(wàn)時(shí),臺(tái)式機(jī)上已經(jīng)無(wú)法求解出,8G的機(jī)器內(nèi)存不夠用。對(duì)于滿秩矩陣的線性方程組,常規(guī)求解方法時(shí)間復(fù)雜度為n^3(n的3次方)。

對(duì)于自由度1千萬(wàn)以下稀疏矩陣的求解,好的臺(tái)式機(jī)基本能應(yīng)付,而當(dāng)自由度達(dá)到1億的時(shí)候,簡(jiǎn)單的將硬件乘以10倍完全不能滿足要求。因?yàn)橛?jì)算的空間復(fù)雜度,時(shí)間復(fù)雜度并不是線性,通常是NlogN,N^2或者更高。當(dāng)自由度達(dá)到1億時(shí),不僅需要對(duì)硬件核心部件CPU,內(nèi)存擴(kuò)容,而且在磁盤(pán)陣列,I/O,并發(fā)計(jì)算,GPU,網(wǎng)絡(luò),帶寬等方面都提出了更苛刻的要求。

算法方面看,減少網(wǎng)格密度,在物理量梯度大的地方加密,無(wú)變化的地方將網(wǎng)格變稀疏,可以有效減少計(jì)算量;另外優(yōu)化求解算法本身,使其更加易于并行化計(jì)算。

從目前來(lái)看,計(jì)算機(jī)硬件計(jì)算能力的更新速度,跟不上指數(shù)級(jí)求解規(guī)模的增加速度。這也是量子力學(xué)發(fā)展的最大推動(dòng)力!

-----------------

針對(duì)該問(wèn)題,本文稍微展開(kāi)一下。

這里的1億,主要指仿真中最終求解線性方程組的自由度個(gè)數(shù),就是剛度矩陣的規(guī)模,即在方程Kx=b中,K的規(guī)模為1億*1億的方陣。

從硬件角度看,性能瓶頸首先在內(nèi)存。目前臺(tái)式機(jī)的內(nèi)存普遍在64G以下。對(duì)于1千萬(wàn)的稀疏矩陣,存儲(chǔ)勉強(qiáng)夠用,加上計(jì)算,一般都不夠用,在windows系統(tǒng)上如果內(nèi)存不夠用,會(huì)啟用虛擬內(nèi)存,也就是用頁(yè)面交換把硬盤(pán)當(dāng)內(nèi)存使用,頻繁讀寫(xiě)磁盤(pán),這時(shí)候性能會(huì)大大降低。而對(duì)于1億自由度的矩陣,可能剛度矩陣組裝都不夠用。對(duì)于一億自由度的矩陣,首先要保證內(nèi)存能夠存儲(chǔ),一般的方法是使用具有超大內(nèi)存的工作站服務(wù)器。

內(nèi)存問(wèn)題解決后,再就是CPU性能。前面講過(guò),通常矩陣計(jì)算的空間復(fù)雜度,時(shí)間復(fù)雜度并不是線性,而是NlogN,N^2或者更高。使用單核單線程,耗費(fèi)的時(shí)間是條曲線上升趨勢(shì)。雖然稀疏矩陣采用了CSR等方法壓縮數(shù)據(jù),但自由度的平方數(shù)據(jù)仍然還是海量數(shù)據(jù)。現(xiàn)在的CPU普遍多核多個(gè)邏輯線程。這也要求在進(jìn)行迭代法求解方程組時(shí),合理的進(jìn)行矩陣分解,參考一篇文章入門(mén)仿真軟件性能優(yōu)化,采用分治的方法適應(yīng)硬件的需求。

這里需要注意的是單核CPU的性能以及CPU的數(shù)量。根據(jù)實(shí)際情況進(jìn)行分治!

在滿足了單機(jī)CPU運(yùn)行之后,再就是集群分布式計(jì)算。采用多臺(tái)計(jì)算設(shè)備,比如刀片等專(zhuān)業(yè)服務(wù)器,超算等等,這里需要考量的是負(fù)載均衡和網(wǎng)絡(luò)帶寬,即保證單臺(tái)設(shè)備的利用率和整體進(jìn)度保持一致。對(duì)于超大量的計(jì)算,最好能軟件實(shí)現(xiàn)動(dòng)態(tài)規(guī)劃,對(duì)于頻繁交換數(shù)據(jù)的計(jì)算,要注意網(wǎng)絡(luò)帶寬的瓶頸。

再?gòu)能浖矫鎭?lái)看,根據(jù)筆者的研發(fā)經(jīng)驗(yàn),相當(dāng)一部分仿真的性能問(wèn)題可以通過(guò)軟件以及改進(jìn)算法解決。在前處理中,盡量避免軟件中高頻操作,大數(shù)據(jù)拷貝,大量細(xì)小數(shù)據(jù)操作等。如果必須有,對(duì)操作進(jìn)行采樣性能評(píng)估,保證在可接受范圍內(nèi)。在求解線性方程組前,提取矩陣特征,盡可能在最細(xì)度上根據(jù)矩陣特征,同時(shí)結(jié)合模型和業(yè)務(wù)的特點(diǎn),選取最合適的求解方法。

其實(shí)目前對(duì)于數(shù)值計(jì)算方法而言,其算法都是公開(kāi)透明的,商業(yè)軟件之間真正較量的是業(yè)務(wù)模型的準(zhǔn)確性,算法的穩(wěn)定性以及效率。而這也恰恰是每個(gè)軟件可以改進(jìn)和提升的地方

2004年,ANSYS解出了1億自由度的模型,2008年,ANSYS解出了10億自由度的模型。即使現(xiàn)在來(lái)看,我們認(rèn)為自由度超過(guò)1千萬(wàn)的模型是個(gè)大模型,所以1億自由度的模型仍然可以認(rèn)為是超大模型,且只能在超大的服務(wù)器上運(yùn)行,可以想象,隨著硬件的提升和算法的改進(jìn),實(shí)際應(yīng)用中會(huì)有越來(lái)越多的超1億自由度的模型求解。

回到開(kāi)始的問(wèn)題,“一億”是“一千萬(wàn)”的十倍嗎?顯然不是。

最后還是以業(yè)內(nèi)的一句話作為結(jié)束語(yǔ):

“如果你的仿真還沒(méi)有受到硬件的限制,那說(shuō)明你的仿真還沒(méi)有入門(mén)”。

編輯:fqj

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • CAE技術(shù)
    +關(guān)注

    關(guān)注

    0

    文章

    9

    瀏覽量

    7042
  • 數(shù)值計(jì)算
    +關(guān)注

    關(guān)注

    3

    文章

    5

    瀏覽量

    6925
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    AD8429無(wú)法放大成理想的倍數(shù),如何解決?

    增益公式為G=1+6KΩ/R1 ,R1設(shè)置為650Ω時(shí),電壓放大十倍還是比較理想的,但改為60.5時(shí)輸出電壓為15.546mV,放大了77.7,不是理想的100,請(qǐng)問(wèn)如何解決?請(qǐng)大
    發(fā)表于 04-24 07:45

    MAX1978為什么測(cè)試誤差放大五十倍的DIFOUT點(diǎn)會(huì)在直流偏置的基礎(chǔ)上疊加一個(gè)交流信號(hào)?

    你好,ADI,最近我們?cè)谑褂肕AX1978這款芯片的時(shí)候遇到一些問(wèn)題如下: 測(cè)試環(huán)境為: +5V供電,開(kāi)關(guān)頻率選擇1M,采用內(nèi)部參考源1.5V,進(jìn)行TEC控溫實(shí)驗(yàn), 問(wèn)題為:為什么測(cè)試誤差放大五十倍的DIFOUT 點(diǎn)會(huì)在直流偏置的基礎(chǔ)上疊加一個(gè)交流信號(hào),這個(gè)是由于我PID控制沒(méi)有控穩(wěn)造成的嗎?
    發(fā)表于 04-18 06:57

    百度李彥宏稱(chēng)自動(dòng)駕駛比人類(lèi)司機(jī)安全十倍

    在近日于阿聯(lián)酋迪拜開(kāi)幕的“世界政府峰會(huì)”上,百度創(chuàng)始人李彥宏發(fā)表了關(guān)于自動(dòng)駕駛技術(shù)的看法。他表示,隨著技術(shù)的飛速進(jìn)步,自動(dòng)駕駛的安全性已經(jīng)遠(yuǎn)超人類(lèi)司機(jī),其安全性可以達(dá)到人類(lèi)司機(jī)的十倍。
    的頭像 發(fā)表于 02-13 16:10 ?414次閱讀

    信號(hào)差值經(jīng)INA143放大10送入ADS8505后,INA143的輸入偏執(zhí)電壓對(duì)ADC的采集結(jié)果有沒(méi)有影響?

    十倍后,萬(wàn)用表測(cè)是10V,沒(méi)什么問(wèn)題; b、Vin+=5V,Vin-=4V,ref腳輸入1V,放大十倍后,萬(wàn)用表測(cè)是11V; c、Vin+=5V,Vin-=4.5V,ref腳輸入2V,放大10
    發(fā)表于 12-26 07:31

    精科技”獲近千萬(wàn)元天使輪融資

    近日,“精科技”成功完成了近千萬(wàn)元的天使輪融資,本輪融資由麒麟創(chuàng)投及其基金聯(lián)合投資,德太資本則擔(dān)任公司的長(zhǎng)期財(cái)務(wù)顧問(wèn)。 這筆資金將主要用于公司的日常運(yùn)營(yíng)、產(chǎn)品研發(fā)和生產(chǎn)制造以及市場(chǎng)開(kāi)拓等方面。隨著
    的頭像 發(fā)表于 12-18 10:48 ?523次閱讀

    馬斯克xAI計(jì)劃:孟菲斯超算集群將擴(kuò)大十倍

    個(gè)增加到至少100萬(wàn)個(gè)。這一舉措將標(biāo)志著Colossus超級(jí)計(jì)算機(jī)集群的十倍擴(kuò)張,彰顯出xAI在人工智能領(lǐng)域的雄心壯志。 據(jù)了解,Colossus超級(jí)計(jì)算機(jī)集群目前主要用于訓(xùn)練xAI的聊天機(jī)器人Grok。通過(guò)大幅增加GPU數(shù)量,xAI將能夠顯著提升Grok的訓(xùn)練速度和性能,使其能夠更快
    的頭像 發(fā)表于 12-05 11:23 ?763次閱讀

    求助,關(guān)于opa842單位增益的問(wèn)題求解

    請(qǐng)問(wèn)opa842單位增益,但它在輸出為100mv,帶寬為14MHz時(shí),增益能到10,那么我如果需要輸出再大一些,這些指標(biāo)不知是否滿足,關(guān)鍵我現(xiàn)在已經(jīng)把opa842放大十倍的電路做出來(lái),換芯片還要重新繪圖,望各位前輩給點(diǎn)意見(jiàn)???
    發(fā)表于 09-20 08:12

    做寬帶直流放大器末級(jí)功放,前三級(jí)放大輸出穩(wěn)定波形,只要連接THS3091就會(huì)輸出失真,為什么?

    什么問(wèn)題引起的不穩(wěn)定,怎么解決?首先可以確定的是不是因?yàn)橄嘁埔鸬牟环€(wěn)定,因?yàn)闇y(cè)過(guò)輸入信號(hào)和輸出信號(hào)基本沒(méi)有相位差;其次THS3091我是按照手冊(cè)選的反饋電阻,十倍放大。TINA仿真圖見(jiàn)附件。
    發(fā)表于 09-12 07:21

    INA333 RG接100歐不是放大1000嗎?怎么輸出才2左右?

    RG接100歐不是放大1000嗎?怎么輸出才2左右?請(qǐng)問(wèn)要放大1000如何接才正確?
    發(fā)表于 09-11 07:25

    OPA657搭了數(shù)據(jù)手冊(cè)中提供的放大十倍的測(cè)試電路,結(jié)果輸出一直是7V多,為什么?

    我用OPA657,搭了數(shù)據(jù)手冊(cè)中提供的放大十倍的測(cè)試電路,結(jié)果輸出一直是7V多什么情況 , 求指教?。?!
    發(fā)表于 09-05 08:21

    兩級(jí)AD603放大電路不能放大到所需值,最大十倍,這是為什么

    兩級(jí)AD603放大電路不能放大到所需值,最大十倍,這是為什么,用1M歐的示波器測(cè)得,沒(méi)加功率放大級(jí)???
    發(fā)表于 09-04 06:48

    使用THS3201遇到的問(wèn)題求解

    今天調(diào)試了一塊THS3201的PCB,0.3MHZ~100MHZ,放大十倍,遇到了很多問(wèn)題,雖然最后大致滿足了要求,但是還有一部分問(wèn)題沒(méi)有想通: (信號(hào)源內(nèi)阻50歐姆,示波器1M歐姆) 1.按照
    發(fā)表于 08-26 07:58

    請(qǐng)問(wèn)FilterPro設(shè)計(jì)帶通濾波器需要如何設(shè)置?

    帶通濾波器設(shè)計(jì)要求:50~11000hz為帶通信號(hào),放大倍數(shù)為40(32dB),帶通外的信號(hào)需要-40dB/十倍頻程的衰減。 我的設(shè)置為:中心頻率:(11000-50)/2=5475 通帶
    發(fā)表于 08-16 12:14

    INA132u的兩個(gè)輸入端都有個(gè)90K+10K的十倍衰減電阻,會(huì)不會(huì)對(duì)采集的信號(hào)有影響?

    INA132u的共模輸入阻抗只有80K,感覺(jué)輸入阻抗不是很大。而INA132u的兩個(gè)輸入端都有個(gè)90K+10K的十倍衰減電阻,不知道會(huì)不會(huì)對(duì)采集的信號(hào)有影響啊。這是第一個(gè)問(wèn)題。 第二個(gè)問(wèn)題就是,如果我們對(duì)運(yùn)放
    發(fā)表于 08-12 06:41

    opa380異常損壞,放大倍數(shù)衰減到百,不可恢復(fù),為什么?

    在使用opa380時(shí),經(jīng)常出現(xiàn)原先正常工作的電路,突然信號(hào)值直線下降,輸出信號(hào)衰減到百,但是變化趨勢(shì)一致,不可恢復(fù),更換opa380芯片后正常
    發(fā)表于 07-29 06:51