一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

軟件生態(tài)上超越CUDA,究竟有多難?

E4Life ? 來源:電子發(fā)燒友 ? 作者:周凱揚 ? 2024-06-20 00:09 ? 次閱讀

電子發(fā)燒友網(wǎng)報道(文/周凱揚)近日,英偉達憑借持續(xù)上漲的股價,正式超過了微軟成為全球市值最高的公司,這固然離不開GPU這一AI硬件的火熱,但之所以能一舉做到世界第一,也離不開軟件的加持,真正將其推向神壇的,還是圍繞CUDA打造的一系列軟件生態(tài)。

英偉達——CUDA的絕對統(tǒng)治

相信對GPU有過一定了解的都知道,英偉達的最大護城河就是CUDA。CUDA在后端架構上處于絕對的統(tǒng)治地位,隨著AI發(fā)展越快,英偉達GPU+CUDA的開發(fā)生態(tài)發(fā)展愈發(fā)壯大,甚至到了很多競爭對手望其項背的水平。CUDA自2006年推出以來,即便在AI和深度學習沒有成為主流的時期,也在不斷發(fā)展并行計算,為開發(fā)者提供豐富的庫、工具和算法。

時至今日,CUDA已經(jīng)為全球開發(fā)者打造了一個龐大的社區(qū),幾乎所有的深度學習框架,包括TensorFlow、Pytorch等都對CUDA做了優(yōu)化。為了盡快切入市場,絕大多數(shù)開發(fā)者都更傾向于選擇CUDA作為首要計算平臺。

與此同時,英偉達也在圍繞著CUDA在硬件架構上做更深入的創(chuàng)新和升級,借助更先進的工藝和封裝技術提升計算性能和效率。比如隨著Volta架構中引入Tensor核心后,英偉達GPU的矩陣運算得到大幅加強,深度學習訓練和推理的性能實現(xiàn)飛躍。兩者結合之下,使得CUDA坐穩(wěn)了第一的寶座。

在游戲軟件領域,英偉達的DLSS可以說是市面上最先進的專有超分技術,且得益于持續(xù)的訓練,每一次版本升級都能帶來圖形渲染領域的突破。

最后是生產(chǎn)力工具相關的軟件生態(tài)上,英偉達在這塊的優(yōu)勢就更加足了,過去蘋果與AMD還在GPU上合作之際,不少生產(chǎn)力工具還是針對AMD的GPU做了不少硬件優(yōu)化的。然而隨著蘋果走向Arm架構,英偉達慢慢在這個市場壯大起來。

無論是Adobe旗下的多媒體處理軟件,還是一些獨立開發(fā)商打造的軟件,很多都有英偉達CUDA硬件加速的支持,甚至連英特爾的核顯在一些軟件支持上,都要好于AMD。正因如此,除了一些特效制作相關的工作外,工作站里的AMD GPU越來越少。

盡管谷歌、英特爾和高通科技巨頭也在尋找打破CUDA壟斷地位的契機,但對于軟件生態(tài)而言,合作并不一定意味著共贏,最后很可能只是為市場提供更多的可選擇項,但在易用性、性能等方面,仍不如沒有駐足一路狂奔的CUDA。

AMD

AMD對于其GPU軟件生態(tài)則持以較為開放的態(tài)度,且極其重視開源開發(fā)社區(qū)。AMD的ROCm對標的正是英偉達的CUDA,但其并沒有對硬件做出限制,除了Radeon、Instinct系列的GPU外,也在擴展至其他硬件廠商的設備。這也得益于AMD沒有在硬件內(nèi)引入Tensor核心這樣的專有硬件,但也正是因為如此,導致其ROCm在某些任務上略顯遜色。

ROCm作為開源平臺,也提供多種庫和框架支持,也有一整套的開源工具鏈。正因如此,在HPC和云計算等領域,廠商其實更寧愿使用AMD的GPU,而不必要忍受英偉達的專用軟件棧。但苦于英偉達先行的軟件生態(tài),他們不得不首選英偉達的GPU。

AMD即便有了ROCm,整體軟件生態(tài)的成熟度依然不敵英偉達,對于HPC中部分不以商業(yè)成功為目標的項目而言,AMD已經(jīng)斬獲了不少份額,比如TOP500中前十的幾臺超算。但以整個TOP500榜單來看,英偉達依然占據(jù)主導地位。然而對于云供應商來說,短時間內(nèi)依然沒法擺脫英偉達的統(tǒng)治,因為租用這些云服務的客戶們,更愿意在英偉達的CUDA平臺上開發(fā)。

在驅(qū)動軟件上,尤其是針對Linux的顯卡驅(qū)動,AMD采取了開源和閉源兩條路線,持續(xù)更新閉源驅(qū)動的同時,也允許開源社區(qū)定制化開源驅(qū)動。以基于Linux系統(tǒng)中AMD Radeon顯卡打造的Vulkan驅(qū)動AMDVLK為例,就支持了光線追蹤。然而,盡管開源驅(qū)動由于手動配置和社區(qū)貢獻的原因,兼容性要更高一些,但如果追求的是更高的性能,那么閉源驅(qū)動還是更具優(yōu)勢。

摩爾線程

國產(chǎn)GPU主要分為兩個方向,分別是支持圖形渲染的和不支持圖形渲染的,后者仍然想在AI領域內(nèi)突破,前者在推進C端產(chǎn)品的同時,也在布局B端的一系列AI GPU產(chǎn)品。在國產(chǎn)GPU產(chǎn)品中,在軟件生態(tài)上做得比較好的當屬摩爾線程了,他們在AI和圖形渲染上的軟件支持都有喜人的進展。

基于MUSA這一統(tǒng)一架構,摩爾線程打造了MTT S80這樣的桌面顯卡,以及面面向服務器應用的MTT S3000等。與之配套的,是摩爾線程打造的軟件開發(fā)平臺,包括AI開發(fā)平臺、MUSA SDK、MT Smart Media和MTVerse XR等。

而且摩爾線程打造的這套生態(tài)架構中,可以充分兼容現(xiàn)有軟件生態(tài),借助MUSIFY工具實現(xiàn)代碼零成本遷移到MUSA平臺。與AMD的ROCm一樣,MUSA做的也是兼容CUDA的路線,而不是像ZLUDA一樣重新編譯二進制代碼,所以并不違反英偉達的EULA條款。

從摩爾線程近來官方發(fā)布的消息看來,他們在AI上選擇了逐步對大模型完成適配支持的路線。在摩爾線程的夸娥千卡智算集群上,他們已經(jīng)完成了30億到700億參數(shù)的大模型訓練和推理適配。摩爾線程的GPU在算力上對比國際大廠還是略有遜色,不過隨著未來他們在IP、硬件設計上進一步突破,相信他們也能打造出高性能的AI算力底座。

在針對消費級圖形顯卡的驅(qū)動程序上,摩爾線程也在不斷更新優(yōu)化性能。以5月底發(fā)布的v260.70版本驅(qū)動為例,除了提供對OpenGL 4.0功能的支持和優(yōu)化Blender 3.6 LTS體驗外,也為諸多熱門游戲在DirectX 11下的性能做了明顯優(yōu)化。盡管這類驅(qū)動更新的規(guī)模比起英偉達還有所差距,但也代表了廠商持續(xù)優(yōu)化性能表現(xiàn)的決心。

寫在最后

其實從越來越多的廠商進軍GPU,越來越多的GPU廠商發(fā)力AI就可以看出,即便CUDA有著深厚的生態(tài)積累,但在日新月異的AI中,其他廠商仍有分一杯羹的機會,甚至可能在某個應用中后來者居上。但在圖形渲染相關的軟件生態(tài)上,廠商面臨的技術壁壘更加厚。不僅要帶著鉆研十數(shù)年的決心,還要持續(xù)打磨硬件產(chǎn)品,與產(chǎn)業(yè)軟件生態(tài)圈合作,挖掘和培養(yǎng)更多的圖形研究人才。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4882

    瀏覽量

    130393
  • CUDA
    +關注

    關注

    0

    文章

    122

    瀏覽量

    14001
  • 英偉達
    +關注

    關注

    22

    文章

    3900

    瀏覽量

    92898
  • 軟件生態(tài)系統(tǒng)

    關注

    0

    文章

    7

    瀏覽量

    7156
收藏 人收藏

    評論

    相關推薦

    福祿克ST20MAX紅外測溫儀究竟有多好用

    “精準測量、智能預約、堅固耐用、貼心設計…” 小福帶著首批ST20MAX客戶試用心得來啦!ST20MAX 究竟有多好用?讓我們一探究竟!
    的頭像 發(fā)表于 04-10 13:55 ?142次閱讀

    串口服務器究竟有何用途?看完這個你就恍然大悟了!

    在當今數(shù)字化快速發(fā)展的時代,串口服務器作為一種重要的網(wǎng)絡設備,正悄然在各個領域發(fā)揮著關鍵作用。今天,我們就來深入了解一下串口服務器究竟有何用途。 工業(yè)自動化領域:保障生產(chǎn)高效穩(wěn)定運行 在工業(yè)生產(chǎn)
    的頭像 發(fā)表于 03-25 12:43 ?174次閱讀

    潤和軟件榮獲華為“生態(tài)星火燎原獎”

    近日,以“同行致遠,聚勢江來”為主題的華為江蘇合作伙伴大會在南京成功舉辦。江蘇潤和軟件股份有限公司(以下簡稱“潤和軟件”)作為華為生態(tài)體系的重要伙伴受邀參會,并憑借在生態(tài)共建、技術賦能
    的頭像 發(fā)表于 03-24 11:48 ?333次閱讀

    OpenHarmony人才生態(tài)大會南向生態(tài)社區(qū)發(fā)展論壇在武漢圓滿舉辦

    應用市場,表盤工具等關鍵要素,未來將解決應用與表盤生態(tài)問題并舉辦開發(fā)者大賽;大屏領域正在構建社區(qū)大屏軟件版本,已完成基本功能開發(fā),目前與康佳、KTC、創(chuàng)維、九聯(lián)開鴻、鴻合等整機廠家以及風行、愛奇藝等
    發(fā)表于 11-29 09:54

    有沒有大佬知道NI vision 有沒有辦法通過gpu和cuda來加速圖像處理

    有沒有大佬知道NI vision 有沒有辦法通過gpu和cuda來加速圖像處理
    發(fā)表于 10-20 09:14

    怎么在TMDSEVM6678: 6678自帶的FFT接口和CUDA提供CUFFT函數(shù)庫選擇?

    請教一下gpgpu上包括4個Riscv cpu和一個DPU, 沒有6678,要替換原來信號處理用的6678,該怎么在6678自帶的FFT接口和CUDA提供CUFFT函數(shù)庫選擇?
    發(fā)表于 09-27 07:20

    迅龍軟件出席2024開放原子開源生態(tài)大會,共謀開源生態(tài)繁榮之路

    2024開放原子開源生態(tài)大會于9月25至27日在北京亦莊開幕。大會將以“開源賦能產(chǎn)業(yè),生態(tài)共筑未來”為主題,匯聚政、產(chǎn)、學、研、用、金等各領域頂尖開源力量,共同探討行業(yè)趨勢,聆聽行業(yè)巨擘見解,洞悉
    的頭像 發(fā)表于 09-26 13:51 ?605次閱讀
    迅龍<b class='flag-5'>軟件</b>出席2024開放原子開源<b class='flag-5'>生態(tài)</b>大會,共謀開源<b class='flag-5'>生態(tài)</b>繁榮之路

    2024年芯片行業(yè)有多難?用數(shù)據(jù)說話

    2024年芯片行業(yè)有多難?用數(shù)據(jù)說話
    的頭像 發(fā)表于 08-10 18:20 ?5359次閱讀

    打破英偉達CUDA壁壘?AMD顯卡現(xiàn)在也能無縫適配CUDA

    電子發(fā)燒友網(wǎng)報道(文/梁浩斌)一直以來,圍繞CUDA打造的軟件生態(tài),是英偉達在GPU領域最大的護城河,尤其是隨著目前AI領域的發(fā)展加速,市場火爆,英偉達GPU+CUDA的開發(fā)
    的頭像 發(fā)表于 07-19 00:16 ?5547次閱讀

    英國公司實現(xiàn)英偉達CUDA軟件在AMD GPU上的無縫運行

    7月18日最新資訊,英國創(chuàng)新科技企業(yè)Spectral Compute震撼發(fā)布了其革命性GPGPU編程工具包——“SCALE”,該工具包實現(xiàn)了英偉達CUDA軟件在AMD GPU上的無縫遷移與運行,標志著在GPU計算領域,NVIDIA長期以來的市場壟斷地位或?qū)⒂瓉碇卮筇魬?zhàn)。
    的頭像 發(fā)表于 07-18 14:40 ?905次閱讀

    請問STM32F407 USB的FIFO究竟有多少空間?

    FIFO 連接。但是另一方面,在CSR存儲器映射圖中,一個主機通道的 FIFO地址范圍為 0x1000 (4KB),并且主機模式下有8個這樣的通道。所以真搞不明白究竟 FIFO真正有多少空間?
    發(fā)表于 07-04 07:46

    請問ESP32-U4WDH的ESP32-MINI-1模組85℃版和105℃的區(qū)別是什么?

    如題:ESP32-U4WDH的ESP32-MINI-1模組85℃版和105℃的區(qū)別 這兩個模組,85℃和105℃究竟有哪些區(qū)別?包括工藝、功能、價格的區(qū)別?
    發(fā)表于 07-02 06:37

    華為生態(tài)設備崛起,大中華區(qū)全面超越蘋果

    隨著科技的飛速發(fā)展和消費者需求的日益多元化,智能手機廠商之間的競爭已經(jīng)不再是單純的產(chǎn)品競爭,而是擴展到了整個生態(tài)系統(tǒng)。近日,華為在中國市場的表現(xiàn)引起了廣泛關注,這家科技巨頭不僅在智能手機領域取得了顯著成就,更在生態(tài)系統(tǒng)方面實現(xiàn)了對蘋果的全面
    的頭像 發(fā)表于 06-14 17:19 ?934次閱讀

    STM32的DAC輸出有個BUFFER功能,BUFFer的驅(qū)動能力究竟有多大,普通的運放輸出可以嗎?驅(qū)動LED可以嗎?

    DAC是輸出模擬電壓給外界參考,STM32的DAC輸出有個BUFFER功能,但不知這個BUFFer的驅(qū)動能力究竟有多大,普通的運放輸出可以嗎?驅(qū)動LED可以嗎?有沒有人做過這塊,給個建議,因為最近要設計個DAC輸出調(diào)節(jié)運放輸出,希望能有個參考。 如果外接跟隨的話,用LM358可以嗎?請一起討論下?。?!
    發(fā)表于 05-15 07:42

    共模電感選型依據(jù)究竟有哪些

    電子發(fā)燒友網(wǎng)站提供《共模電感選型依據(jù)究竟有哪些.docx》資料免費下載
    發(fā)表于 05-06 10:26 ?1次下載