一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

做通用GPU究竟有多難?

硬件設(shè)計 ? 2019-12-31 23:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

根據(jù)“牧村波動”(Makimoto’s Wave)顯示,半導(dǎo)體產(chǎn)品未來可能將沿著“標準化”與“定制化”交替發(fā)展的路線前進,每十年波動一次。2020 年將至,過去數(shù)年我們一直在呼喚AI 芯片和高性能計算芯片,如果 “牧村波動”仍然奏效,那么下一個波峰將是超高靈活度集成的芯片。而這也解釋了為什么英偉達所開創(chuàng)的GPGPU在過去幾年里賺的缽滿盆滿。

其實仔細想想,除了“牧村波動”所昭示的進化規(guī)則,通用GPU之所以能夠成為當前的主流趨勢,并引來眾多企業(yè)趨之若鶩,至少有一明一潛兩大驅(qū)動因素。明面上,現(xiàn)在是異構(gòu)計算的天下,近年來傳統(tǒng)以CPU為核心的服務(wù)器市場增長比較平緩,而GPU服務(wù)器的增速迅猛,年增長率據(jù)稱超60%。

潛在因素,5G時代的到來推動了物聯(lián)網(wǎng)的迅猛發(fā)展,應(yīng)用場景更加豐富多元,這要求云端的計算資源能應(yīng)對各種復(fù)雜場景的需求提供豐富靈活的計算支撐,工程師們肯定更愿意將能“通吃”的芯片焊在服務(wù)器上。

打鐵還需自身硬

想要吃到通用GPU這份蛋糕還是需要企業(yè)有足夠深厚的功底。相較于開發(fā)定制化的AI芯片等,通用GPU在技術(shù)上有更高的難度。從硬件角度看,最核心的是指令集。指令集的覆蓋面、顆粒度、效率等決定一款芯片能否覆蓋到足夠?qū)挼膽?yīng)用市場領(lǐng)域,并對軟件開發(fā)和產(chǎn)品迭代足夠友好。無論是英偉達還是AMD的GPGPU,指令集都在千條量級,而目前國內(nèi)的AI芯片指令集大多數(shù)都在百條以內(nèi)。類型與數(shù)量的差別映射到硬件高效實現(xiàn)的復(fù)雜程度,差距是巨大的,在這方面國內(nèi)的團隊還存在著一定的差距。另一個重要方面就是基于硬件層的任務(wù)管理和智能調(diào)度,這可以讓芯片從硬件層即提高算力的利用率,也就是大家常說的實際算力。大多數(shù)AI芯片的做法是完全依賴于軟件層的調(diào)度實現(xiàn),但這種方式第一增加了軟件開發(fā)的復(fù)雜度,第二降低了硬件算力的利用率,第三減緩了軟件棧迭代更新的速度,這在AI領(lǐng)域,面向算法模型、開發(fā)環(huán)境、應(yīng)用場景加速更新的大背景下無疑大大增加了產(chǎn)品落地與工程化的難度。

在軟件方面,毫無疑問,最重要的必然是開發(fā)生態(tài),GPGPU通過英偉達十多年的耕耘,已經(jīng)建立起了一個超過160萬開發(fā)用戶的龐大而成熟的生態(tài)-CUDA。AI芯片則需要搭建全新的生態(tài),它會帶來兩個維度顯著的問題,第一個維度是客戶端,客戶需要冗長的適配期,從原有的開發(fā)環(huán)境切換到新的軟件生態(tài),這不僅帶來了資源投入,推遲了業(yè)務(wù)部署時間窗口,增加了業(yè)務(wù)的不確定性,更嚴重的是不利于保護已有的軟件投資,軟件的很多部分都要重新來寫并適配,這對企業(yè)級用戶來講恰恰是非常敏感與慎重的事情。另一個維度是產(chǎn)品開發(fā)端,從底層芯片與系統(tǒng)軟件,跳過CUDA層去直接支持開發(fā)框架,必然帶來巨大的軟件投入,不停得追趕現(xiàn)有框架的新版本,以及生態(tài)巨頭的新框架,這在底層軟件人員缺乏的背景下矛盾顯得尤其突出。

而以上兩點說到底都是需要人來解決的,恰恰在這方面的人才是目前中國企業(yè)最缺少的。目前只有英偉達和AMD擁有豐富的團隊,這也側(cè)面證明了為什么Intel自己折騰幾年,最后還是請了原AMD RTG顯卡部門負責人Raja、Zen架構(gòu)的功勛領(lǐng)袖Jim Keller、顯卡技術(shù)市場總監(jiān)Damien Triolet這幾位大神。

曲線救國還是正面突破?

圍繞GPGPU,國外已是龍爭虎斗,反觀國內(nèi),能夠洞悉GPGPU發(fā)展機遇并付諸行動的芯片廠商少之又少。

華為是為數(shù)不多看到通用GPU趨勢的芯片廠商之一,而且看起來正在嘗試兩條腿走路通往GPGPU的路上。一條路是,華為通過其在手機芯片方面的積累,希望從移動端GPU出發(fā),逐步延展至平板電腦端、桌面端、服務(wù)器端,走這種從簡單到復(fù)雜、從小芯片到大芯片的路徑。

另一條路有點“天龍寺眾高僧合練六脈神劍”的意思。通用GPU復(fù)雜、難做,華為就“化繁為簡”,今天先做AI-GPU,明天再做“區(qū)塊鏈GPU”,后天再做“超算GPU”……到最后再來個“集大成”,“六脈神劍”通用GPU就成了??雌饋砗馨魧Π桑康沁@種想法可能過于理想化了。通用GPU不是簡單的“1+1”,十個人會一陽指,也及不上一個人會六脈神劍,一個道理。

筆者還聽說,阿里旗下的芯片部門也想做GPGPU,只不過阿里巴巴的野心大則大矣,只是眼下還沒有足夠大的技術(shù)團隊能支持這件事。

其他廠商中,包括寒武紀、依圖、比特大陸、燧原科技等企業(yè),目前也都重點布局于AI芯片,并分別利用自身的優(yōu)勢走出了自己的風(fēng)格和水平。

而在GPGPU賽道上,一家名為“天數(shù)智芯”的公司選擇了正面“剛”。這家公司目前圍繞GPGPU的系統(tǒng)研發(fā)已聚集了一支百余人的技術(shù)團隊,其中不乏AMD在美國和上海做 GPU的核心團隊成員、行業(yè)經(jīng)驗超20年的世界級技術(shù)專家。今年剛剛試水發(fā)布了一款邊緣端芯片,并計劃明年正式發(fā)布GPGPU大芯片產(chǎn)品。

國內(nèi)企業(yè)的機遇與挑戰(zhàn)

有一點毋庸置疑,算力經(jīng)濟時代,整個世界正面臨半導(dǎo)體市場的增長大潮,市場上也涌現(xiàn)出越來越多的半導(dǎo)體企業(yè)百舸爭流。而英偉達早早憑借強大的GPU+CUDA方案切入各個領(lǐng)域,用大筆研發(fā)投入和時間堆積起堅不可摧的生態(tài)城墻,而這恰恰是國內(nèi)外其他玩家的薄弱環(huán)節(jié)。

國產(chǎn)芯片企業(yè),特別是處在創(chuàng)業(yè)初期的那些,“正確選擇勝過百倍努力”。筆者認為可通用的GPU確然是個非常值得投入的方向。GPGPU誕生也只有十數(shù)年時間,“護城河”并非堅不可摧。

只不過在現(xiàn)階段,國產(chǎn)替代方案還要在CUDA生態(tài)的基礎(chǔ)上推廣自己的芯片產(chǎn)品,在兼容CUDA的同時,建設(shè)新生態(tài)。在這個過程中,每一步都關(guān)鍵且充滿挑戰(zhàn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    GPU架構(gòu)深度解析

    GPU架構(gòu)深度解析從圖形處理到通用計算的進化之路圖形處理單元(GPU),作為現(xiàn)代計算機中不可或缺的一部分,已經(jīng)從最初的圖形渲染專用處理器,發(fā)展成為強大的并行計算引擎,廣泛應(yīng)用于人工智能、科學(xué)計算
    的頭像 發(fā)表于 05-30 10:36 ?386次閱讀
    <b class='flag-5'>GPU</b>架構(gòu)深度解析

    福祿克ST20MAX紅外測溫儀究竟有多好用

    “精準測量、智能預(yù)約、堅固耐用、貼心設(shè)計…” 小福帶著首批ST20MAX客戶試用心得來啦!ST20MAX 究竟有多好用?讓我們一探究竟!
    的頭像 發(fā)表于 04-10 13:55 ?324次閱讀

    可以手動構(gòu)建imx-gpu-viv嗎?

    使用 imx-gpu-viv-6.4.3.p4.2.aarch64.bin。 https://www.nxp.com/lgfiles/NMG/MAD/YOCTO//imx-gpu-viv-6.4.3.p4.2-aarch64.bin 我需要
    發(fā)表于 03-28 06:35

    串口服務(wù)器究竟有何用途?看完這個你就恍然大悟了!

    在當今數(shù)字化快速發(fā)展的時代,串口服務(wù)器作為一種重要的網(wǎng)絡(luò)設(shè)備,正悄然在各個領(lǐng)域發(fā)揮著關(guān)鍵作用。今天,我們就來深入了解一下串口服務(wù)器究竟有何用途。 工業(yè)自動化領(lǐng)域:保障生產(chǎn)高效穩(wěn)定運行 在工業(yè)生產(chǎn)
    的頭像 發(fā)表于 03-25 12:43 ?299次閱讀

    無法在GPU上運行ONNX模型的Benchmark_app怎么解決?

    在 CPU 和 GPU 上運行OpenVINO? 2023.0 Benchmark_app推斷的 ONNX 模型。 在 CPU 上推理成功,但在 GPU 上失敗。
    發(fā)表于 03-06 08:02

    OpenVINO?檢測到GPU,但網(wǎng)絡(luò)無法加載到GPU插件,為什么?

    OpenVINO?安裝在舊的 Windows 10 版本 Windows? 10 (RS1) 上。 已安裝 GPU 驅(qū)動程序版本 25.20.100.6373,檢測到 GPU,但網(wǎng)絡(luò)無法加載
    發(fā)表于 03-05 06:01

    澎峰科技計算軟件棧與沐曦GPU完成適配和互認證

    ?近期,澎峰科技與沐曦完成了對PerfXLM(推理引擎)、PerfXCloud(大模型服務(wù)平臺)與沐曦的曦云系列通用計算GPU的聯(lián)合測試,測試結(jié)果表明PerfXLM、PerfXCloud軟件與沐曦GPU產(chǎn)品實現(xiàn)了全面兼容。
    的頭像 發(fā)表于 01-21 09:51 ?627次閱讀

    《CST Studio Suite 2024 GPU加速計算指南》

    GPU Computing Guide》是由Dassault Systèmes Deutschland GmbH發(fā)布的有關(guān)CST Studio Suite 2024的GPU計算指南。涵蓋GPU計算
    發(fā)表于 12-16 14:25

    谷景科普封裝一樣的磁棒電感究竟能不能通用

    谷景告訴你封裝一樣的磁棒電感究竟能不能通用編輯:谷景電子磁棒電感的選型的時候,我們通常會先關(guān)注它的封裝尺寸,因為這是確保電感能夠適配電路板的關(guān)鍵因素。但是,有些人可能會誤以為只要封裝尺寸相同,任何
    發(fā)表于 11-13 22:36 ?0次下載

    【一文看懂】大白話解釋“GPUGPU算力”

    隨著大模型的興起,“GPU算力”這個詞正頻繁出現(xiàn)在人工智能、游戲、圖形設(shè)計等工作場景中,什么是GPU,它與CPU的區(qū)別是什么?以及到底什么是GPU算力?本篇文章主要從以下5個角度,讓您全方位了解
    的頭像 發(fā)表于 10-29 08:05 ?2601次閱讀
    【一文看懂】大白話解釋“<b class='flag-5'>GPU</b>與<b class='flag-5'>GPU</b>算力”

    常見GPU問題及解決方法

    GPU(圖形處理單元)是計算機硬件的重要組成部分,負責處理圖形和視頻渲染任務(wù)。隨著技術(shù)的發(fā)展,GPU在深度學(xué)習(xí)、游戲、視頻編輯等領(lǐng)域扮演著越來越重要的角色。然而,在使用GPU的過程中,我們可能會遇到
    的頭像 發(fā)表于 10-27 14:12 ?3684次閱讀

    請問通用有源低通濾波器應(yīng)該用什么芯片比較好呢?

    通用有源低通濾波器應(yīng)該用什么芯片比較好呢?我用的OPA820的效果不太理想啊
    發(fā)表于 09-12 07:06

    芯片元器件的儲存壽命究竟有多長呢?

    元器件
    芯廣場
    發(fā)布于 :2024年09月05日 18:13:16

    2024年芯片行業(yè)有多難?用數(shù)據(jù)說話

    2024年芯片行業(yè)有多難?用數(shù)據(jù)說話
    的頭像 發(fā)表于 08-10 18:20 ?5880次閱讀

    暴漲預(yù)警!NVIDIA GPU供應(yīng)大跳水

    gpu
    jf_02331860
    發(fā)布于 :2024年07月26日 09:41:42