一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GPGPU市場增長強(qiáng)勁 創(chuàng)新性架構(gòu)大幅提升AI計(jì)算效率!

Carol Li ? 來源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2022-01-19 11:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)GPU中文叫圖形處理單元,是一種并行處理的硬件,早起只用來渲染復(fù)雜的計(jì)算機(jī)圖形環(huán)境。隨著技術(shù)進(jìn)步,GPU不再局限于圖形領(lǐng)域,擴(kuò)展應(yīng)用到其他計(jì)算密集的領(lǐng)域,被稱為GPGPU,成為AI 芯片領(lǐng)域的代表。

GPU具有很好的通用性,同時(shí)傳統(tǒng)的架構(gòu)也存在一定局限,比如計(jì)算密度低、效率低,如何在保證通用性的情況下,又提高它的計(jì)算效率成為業(yè)界關(guān)注的重點(diǎn)。

創(chuàng)新架構(gòu)提高AI計(jì)算效率

那么應(yīng)該如何做呢?為了提高GPU的計(jì)算效率,GPU知名企業(yè)英偉達(dá)也進(jìn)行的相應(yīng)的嘗試,即對原來的GPU架構(gòu)進(jìn)行修改,比如增加專門的張量計(jì)算單元、增加片上內(nèi)存器等,這一定程度可以提高AI的計(jì)算效率,不過受限于GPU整體架構(gòu),問題并沒有得到很好的解決。

圖:傳統(tǒng)GPU對AI加速的局限體現(xiàn)在哪些方面(圖片來自登臨科技分享)


成立于2017年的登臨科技,從2018年自主研發(fā)創(chuàng)新性的GPU+架構(gòu),一款由軟件定義的、片內(nèi)異構(gòu)的支持并行化計(jì)算的架構(gòu)。GPU+架構(gòu)針對AI應(yīng)用,具備和GPU一樣的可編程能力和通用性。同時(shí)通過架構(gòu)創(chuàng)新,提供更高的計(jì)算密度,更快的計(jì)算速度,同時(shí)大幅降低對外部帶寬的需求。而這些是傳統(tǒng)GPU芯片無法兼顧的。


由于GPU良好的通用性,在服務(wù)器及云端等使用場景中,會(huì)大規(guī)模應(yīng)用 GPU。運(yùn)行各類神經(jīng)網(wǎng)絡(luò)。大量開源生態(tài)的應(yīng)用、大量客戶定制化的軟件,都是在主流的GPU軟件生態(tài)上完成。如何保持客戶已有的投入,即如何減少客戶的使用成本,也是AI技術(shù)產(chǎn)業(yè)化的重要課題。

怎么做呢?登臨科技在接受電子發(fā)燒友采訪的時(shí)候表示,登臨自主創(chuàng)新的GPU+架構(gòu),通過對高效的Tensor引擎和可編程的GPGPU引擎的有機(jī)配合,硬件直接兼容CUDA/OpenCL,可無縫接入現(xiàn)有軟件生態(tài),大大降低了客戶的遷移成本。

通過片內(nèi)異構(gòu),GPU+解決了傳統(tǒng)的系統(tǒng)級異構(gòu)計(jì)算調(diào)度,數(shù)據(jù)交換的開銷大,以及數(shù)據(jù)的連貫相干性的難題。在整個(gè)系統(tǒng)的計(jì)算密度極高的基礎(chǔ)上,通過軟件定義,使針對不同神經(jīng)網(wǎng)絡(luò)的應(yīng)用場景,都能達(dá)到硬件性能和能效最大化。

登臨科技表示,通過大規(guī)??蛻魧?shí)測,在同等功耗下,GPU+的性能可以達(dá)到國際主流產(chǎn)品3倍以上的能效。

打造真正符合市場需求的產(chǎn)品

登臨科技成立以后,一直思考如何制定真正符合市場需求的技術(shù)路線,即上文所談的如何保持客戶已有的投入,減少客戶的使用成本,這是登臨科技制定產(chǎn)品的價(jià)值導(dǎo)向。

2018年登臨確定了產(chǎn)品的方向:基于GPGPU的高能效計(jì)算,并自主研發(fā)創(chuàng)新的GPU+架構(gòu)。經(jīng)過團(tuán)隊(duì)一年多的工作,于2019年6月,公司完成了首款基于GPU+架構(gòu)的Goldwasser設(shè)計(jì),并mpw流片成功。

2020年6月Goldwasser成功回片通過測試,開始客戶送樣,Goldwasser目前已在成熟的12nm/14nm工藝上實(shí)現(xiàn)量產(chǎn)。登臨Goldwasser已于2021年在智慧城市、互聯(lián)網(wǎng)等領(lǐng)域順利實(shí)現(xiàn)了商業(yè)化落地,并同時(shí)與數(shù)十家客戶在邊緣至云端的不同應(yīng)用場景中進(jìn)行產(chǎn)品開發(fā)、測試。


登臨科技的Goldwasser 系列產(chǎn)品包括:邊緣計(jì)算產(chǎn)品 Goldwasser UL,功率 25-35W,INT8 算力 32-64TOPS;半高半長的服務(wù)器計(jì)算卡 Goldwasser L,功耗 40-70W,提供 128-256TOPS 算力;另有一種全高全長的 Goldwasser XL,輸出 512TOPS 算力。多種規(guī)格的產(chǎn)品,使得客戶可以根據(jù)自身需求分別部署在邊緣側(cè)、云端的各種計(jì)算設(shè)備中。

登臨科技方案架構(gòu)總監(jiān)鄭韜此前在某論壇上也介紹過,Goldwasser覆蓋主流系統(tǒng)生態(tài),登臨Hamming軟件開發(fā)包支持主流GPU編程語言,包括CUDA、OpenCL等;適配國內(nèi)外主流服務(wù)器廠家;支持主流國內(nèi)外AI計(jì)算框架,包括PyTorch、百度飛漿、TensorFlow等;適配國內(nèi)外主流CPU廠家,包括飛騰、龍芯、英特爾AMD等。

在不同的應(yīng)用場景下,Goldwasser可以支持多種不同的算法實(shí)現(xiàn)和落地,如智慧城市、智能交通、語音識別、虛擬客服、智慧工地、智慧車站、機(jī)器翻譯、工業(yè)視覺等,場景覆蓋CV、NLP、知識圖譜、信號處理和計(jì)算等多個(gè)領(lǐng)域。Goldwasser可以同時(shí)支持訓(xùn)練和推理。

登臨科技表示,目前Goldwasser正與30多家不同行業(yè)的頭部企業(yè)進(jìn)行量產(chǎn)導(dǎo)入。同時(shí),登臨科技打通供應(yīng)鏈上下游相關(guān)企業(yè)和合作伙伴,確保產(chǎn)品正常交付。

小結(jié)

當(dāng)前AI技術(shù)正快速發(fā)展,GPGPU呈現(xiàn)出強(qiáng)勁的增長勢頭,根據(jù)有關(guān)數(shù)據(jù)預(yù)測,到2025年,我國GPGPU芯片板卡的市場規(guī)模將達(dá)458億元,年復(fù)合增長率高達(dá)32%,未來市場可觀。

目前國際巨頭占據(jù)大部分市場,與之相比國內(nèi)廠商還存在差距,不過近幾年不少國內(nèi)GPU廠商通過自主創(chuàng)新,在技術(shù)上逐漸取得進(jìn)展,產(chǎn)品也逐步走向落地商用,比如登臨科技。

另外,對于政府目前重點(diǎn)關(guān)注的降碳增效,登臨科技表示,對計(jì)算芯片而言關(guān)鍵指標(biāo)是能效比,而這也是公司產(chǎn)品的最重要的優(yōu)勢之一,登臨將繼續(xù)通過對傳統(tǒng)GPU的架構(gòu)創(chuàng)新,不斷提升異構(gòu)硬件的算力,達(dá)到非常顯著的能效比優(yōu)勢,為降碳和增效做貢獻(xiàn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    AI芯片:加速人工智能計(jì)算的專用硬件引擎

    處理等應(yīng)用落地的關(guān)鍵硬件基礎(chǔ)。 ? AI芯片的核心技術(shù)特點(diǎn) ? ? AI芯片的設(shè)計(jì)重點(diǎn)在于提升計(jì)算效率,主要技術(shù)特點(diǎn)包括: ? 1. ? 并
    的頭像 發(fā)表于 07-09 15:59 ?167次閱讀

    全球各大品牌利用NVIDIA AI技術(shù)提升運(yùn)營效率

    歐萊雅、LVMH 集團(tuán)和雀巢利用 NVIDIA 加速的智能體 AI 和物理 AI,大幅提升產(chǎn)品設(shè)計(jì)、營銷及物流等方面的運(yùn)營效率。
    的頭像 發(fā)表于 06-19 14:36 ?491次閱讀

    芯原可擴(kuò)展的高性能GPGPU-AI計(jì)算IP賦能汽車與邊緣服務(wù)器AI解決方案

    芯原股份 (芯原,股票代碼:688521.SH) 日前宣布其 高性能、可擴(kuò)展的GPGPU-AI計(jì)算IP的最新進(jìn)展,這些IP現(xiàn)已為新一代汽車電子和邊緣服務(wù)器應(yīng)用提供強(qiáng)勁賦能 。通過將可編程并行計(jì)
    的頭像 發(fā)表于 06-16 10:44 ?746次閱讀

    Intel-Altera FPGA:通信行業(yè)的加速引擎,開啟高速互聯(lián)新時(shí)代

    ,強(qiáng)化與AI、5G等技術(shù)的融合,同時(shí)通過獨(dú)立運(yùn)營提升戰(zhàn)略專注度。市場機(jī)遇:AI、邊緣計(jì)算等領(lǐng)域的爆發(fā)式
    發(fā)表于 04-25 10:19

    DevEco Studio AI輔助開發(fā)工具兩大升級功能 鴻蒙應(yīng)用開發(fā)效率提升

    HarmonyOS應(yīng)用的AI智能輔助開發(fā)助手——CodeGenie,該AI助手深度集成在DevEco Studio中,提供鴻蒙知識智能問答、鴻蒙ArkTS代碼補(bǔ)全/生成和萬能卡片生成等功能,提升了開發(fā)
    發(fā)表于 04-18 14:43

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    的端側(cè)部署,Token產(chǎn)生速度提升了40%,讓端側(cè)大模型擁有更高的計(jì)算效率和推理性能,使端側(cè)AI交互響應(yīng)更及時(shí),用戶體驗(yàn)更貼心。 聯(lián)發(fā)科還與vivo和全民K歌攜手,借助天璣
    發(fā)表于 04-13 19:52

    DeepSeek推動(dòng)AI算力需求:800G光模塊的關(guān)鍵作用

    數(shù)據(jù)傳輸速率,減少帶寬瓶頸,成為數(shù)據(jù)中心和AI集群架構(gòu)優(yōu)化的重點(diǎn)。光模塊速率的躍升不僅提升了傳輸效率,也為大規(guī)模并行計(jì)算任務(wù)提供了必要的帶寬
    發(fā)表于 03-25 12:00

    FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預(yù)測......

    ...... 2) AI超算革命:FPGA集群功耗比GPU降低62%;混合精度計(jì)算效率提升5.8倍...... 3) 6G通信突破:軟件無線電實(shí)現(xiàn)Sub-6GHz/毫米波全頻段覆蓋;M
    發(fā)表于 03-03 11:21

    AI賦能邊緣網(wǎng)關(guān):開啟智能時(shí)代的新藍(lán)海

    。這一變革不僅帶來了技術(shù)架構(gòu)的革新,更為產(chǎn)業(yè)發(fā)展開辟了新的增長空間。 傳統(tǒng)邊緣網(wǎng)關(guān)受限于計(jì)算能力和算法支持,往往只能完成數(shù)據(jù)采集和簡單處理,大量原始數(shù)據(jù)需要回傳云端處理,導(dǎo)致響應(yīng)延遲和帶寬壓力。
    發(fā)表于 02-15 11:41

    AI需求助力DISCO營收大幅增長

    日本晶圓切割機(jī)大廠DISCO近日發(fā)布了其本財(cái)年度前三季的財(cái)務(wù)業(yè)績報(bào)告。報(bào)告顯示,受到AI相關(guān)需求的強(qiáng)勁推動(dòng)以及日圓匯率走貶的影響,DISCO的營收和盈利均實(shí)現(xiàn)了大幅增長。
    的頭像 發(fā)表于 01-22 15:55 ?480次閱讀

    英國政府計(jì)劃大幅提升AI算力

    滿足學(xué)術(shù)界和公共服務(wù)領(lǐng)域?qū)Ω咝阅?b class='flag-5'>計(jì)算能力的迫切需求。隨著人工智能技術(shù)的快速發(fā)展,GPU作為AI計(jì)算的核心硬件之一,其重要日益凸顯。 斯塔默首相表示,通過采購這些GPU,英國將能夠加速
    的頭像 發(fā)表于 01-14 14:18 ?456次閱讀

    國芯科技:已結(jié)束基于RISC-V架構(gòu)GPGPU研發(fā)

    電子發(fā)燒友網(wǎng)報(bào)道(文/吳子鵬)近日,有投資者在互動(dòng)平臺向國芯科技提問:請問貴公司是否有GPU研發(fā)計(jì)劃? ? 對此,國芯科技回答稱,“公司與上海清華國際創(chuàng)新中心合作開展了基于開源RISC-V指令架構(gòu)
    的頭像 發(fā)表于 12-20 00:15 ?3123次閱讀

    《算力芯片 高性能 CPUGPUNPU 微架構(gòu)分析》第3篇閱讀心得:GPU革命:從圖形引擎到AI加速器的蛻變

    標(biāo)量、向量、矩陣的表示;從硬件實(shí)現(xiàn)看,不同廠商各顯神通。谷歌TPU采用脈動(dòng)陣列計(jì)算單元,通過數(shù)據(jù)流向的精心編排提升計(jì)算密度;NVIDIA張量核心支持多精度計(jì)算,Hopper
    發(fā)表于 11-24 17:12

    NPU技術(shù)如何提升AI性能

    設(shè)計(jì)的處理器,與傳統(tǒng)的CPU和GPU相比,它在執(zhí)行深度學(xué)習(xí)任務(wù)時(shí)具有更高的效率和更低的能耗。NPU通過專門優(yōu)化的硬件結(jié)構(gòu)和指令集,能夠更快地處理神經(jīng)網(wǎng)絡(luò)中的大量并行計(jì)算任務(wù)。 1. 優(yōu)化硬件架構(gòu) NPU技術(shù)通過優(yōu)化硬件
    的頭像 發(fā)表于 11-15 09:11 ?1469次閱讀

    IDC報(bào)告:2023年中國CAD市場增長率達(dá)12.8%,展現(xiàn)強(qiáng)勁增長動(dòng)力

    引人注目的是,本土CAD廠商在這一年中實(shí)現(xiàn)了顯著飛躍,其市場占有率攀升至25%,較去年大幅提升了5個(gè)百分點(diǎn),彰顯了本土企業(yè)在技術(shù)創(chuàng)新市場
    的頭像 發(fā)表于 09-02 17:24 ?1455次閱讀
    IDC報(bào)告:2023年中國CAD<b class='flag-5'>市場</b>年<b class='flag-5'>增長</b>率達(dá)12.8%,展現(xiàn)<b class='flag-5'>強(qiáng)勁</b><b class='flag-5'>增長</b>動(dòng)力