一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

ChatGPT炒熱GPU,ASIC和FPGA能否分一杯羹?

E4Life ? 來源:電子發(fā)燒友網(wǎng) ? 作者:周凱揚 ? 2023-02-22 09:23 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報道(文/周凱揚)ChatGPT的出現(xiàn),對于數(shù)據(jù)中心硬件市場無疑是一針強心劑,不少GPU廠商更是從中受益,從再度興起的聊天機器人潮流中收獲了更多訂單。那么對于ChatGPT這類對AI算力有著不小需求的應用來說,ASICFPGA是否也能借上這股東風呢?

不同硬件的成本對比

機器學習推理場景中,除了GPU外,還有一大通用AI硬件適合這一負載,那就是FPGA。與GPU一樣,在技術和算法還未成熟且仍在打磨階段時,可以隨時重新編程改變芯片功能的FPGA架構前期硬件成本顯著低于GPU。在推理性能上,現(xiàn)如今的FPGA加速卡算力遠超CPU,甚至高過不少GPU產品。

而且在ChatGPT這樣的聊天機器人應用上,將FPGA用于推理得以發(fā)揮其最大的優(yōu)勢,那就是高吞吐量和低時延。更高的吞吐量和更低的時延也就意味著更大的并發(fā),對ChatGPT這種應用來說可以極大增強其響應速度。
CleanShot 2023-02-21 at 16.13.39@2x
Alveo V70推理加速卡 / AMD
但隨著算法和模型逐漸成熟,F(xiàn)PGA在成本上的優(yōu)勢就慢慢不存在了,在大語言模型上需要用到更多的硬件,而FPGA量產規(guī)模的單價成本還是太高了,一旦擴充至成千上萬張加速卡,其成本也是不小的。比如AMD推出的新加速卡Alveo V70,據(jù)傳單卡價格就在2000美元左右。如果我們以INT8精度來衡量算力的話,假設ChatGPT需要28936塊A100 GPU,那么改用Alveo V70的話,也需要44693塊加速卡。

所以還是有不少人將目光投向了量產規(guī)模成本更低的ASIC,比如谷歌就選擇用自研的TPU來部署其聊天機器人Bard。ASIC方案在單芯片算力上或許不是最高的,但計算效率卻是最高的,而且隨著量產化單片成本會逐漸降低。比如谷歌的單個TPU v4 Pod就集成了4096個TPU v4芯片,單芯片的BF16算力達到275TFLOPS,已經相當接近A100單卡峰值算力了。如果只是這樣簡單換算的話,只需幾個TPU v4 Pod,就能滿足與ChatGPT同量級的應用了。

不過ASIC方案并沒有我們想象得那么美好,首先這類硬件的前期設計成本較大,要想投入數(shù)據(jù)中心商用,必須組建強大的硬件設計和軟件開發(fā)團隊,這樣才能有與GPU相抗衡的性能。其次,因為本身專用硬件的特性,專用于機器學習推理的ASIC方案很難最大化數(shù)據(jù)中心的硬件利用率,不像GPU還可以同時用于訓練、視頻編解碼等等。

搭建屬于自己的ChatGPT的成本有多高

對于GPT-3這樣的大型模型來說,要想個人搭建和部署從成本上看肯定不是實惠的選擇,所以我們可以選擇其他的模型,比如Meta推出的1750億參數(shù)OPT-175B模型。加州大學伯克利分校的Sky Lab就借助該模型推出了一個開源系統(tǒng)Alpa,同時具備聊天機器人、翻譯、代碼編寫和數(shù)學計算的功能。

要想部署OPT-175B模型并搭建Alpa這樣的文字聊天應用,對GPU的要求要遠遠小于ChatGPT。但這是建立在其本身響應速度和功能特性就顯著弱于ChatGPT的情況下,比如一旦設定的回答長度過長,就需要等上數(shù)十秒,何況它列出的GPU需求也不算小。

根據(jù)Alpa的官方說明,雖然不需要用到最新一代的A100 80GB這樣價格高昂的GPU或是InfiniBand這樣先進的互聯(lián)方案,但對顯存的最低要求也已經達到了350GB。所以Alpa給的建議是使用32個英偉達Tesla V100 GPU,從而提供512GB的顯存,這樣硬件造價在50萬到150萬之間。
poYBAGP1btCARD6vAAdNQyw3qtA386.png
Tesla V100 GPU / 英偉達
如果你只是想開展聊天機器人的服務,而不是自己買硬件的話,也可以選擇各大公有云服務廠商的方案,比如亞馬遜AWS的EC2 P3系列,就是專為機器學習和HPC準備的實例。每個EC2 P3.16xlarge實例上有8塊Tesla V100 GPU,所以至少租賃4個實例就能運行Alpa了。

不過這樣一來服務器的費用也并不算便宜,單個實例按需付費每小時的花費在24.48美元左右,也就是說如果要全天運行的話,運行Alpa的成本為2400美元一天。哪怕云服務廠商通常都會給到長期承諾使用的折扣,這也是一筆不小的支出。

谷歌推出的Cloud TPU方案也是如此,如果真的打算以租賃服務器的方式來打造ChatGPT,那么谷歌目前給出的按需定價是每芯片小時價格3.22美元。要想部署數(shù)萬規(guī)模的TPU v4芯片媲美ChatGPT,那么一定逃不掉超高的費用。

結語

不久前我們已經提到了ChatGPT的加入或許會給微軟的現(xiàn)有產品帶來定價的提升,如今這個猜測也已經成真。微軟近日宣布,從今年5月1日開始,微軟Bing搜索API的定價將會直線飆升,其中超大并發(fā)(每秒250次處理)的S1實例定價從每千次處理7美元提升至25美元,而額外的Bing統(tǒng)計更是從每千次處理1美元的價格拔高至10美元。如此看來,可見大語言模型的推理成本有多高可見一斑了,哪怕是微軟也經不起這樣燒錢。

所以對于ChatGPT這種應用,其運營者不同,對待硬件成本的看法也會不同,比如微軟、谷歌之類已經擁有大規(guī)模服務器硬件的廠商,必然會利用現(xiàn)有GPU資源的同時,考慮如何用定制化的ASIC進一步節(jié)省成本。而體量較小的運營者,例如聊天機器人應用開發(fā)商、研究機構等,還是會選擇租賃服務器或小規(guī)模本地部署,其首選硬件也會是GPU。

再說回FPGA,雖然從目前數(shù)據(jù)中心的市場現(xiàn)狀來看,F(xiàn)PGA的AI推理加速卡仍處于一個弱勢的位置。但隨著AMD開始推出Alveo V70這樣全新XDNA架構的方案,或許能給未來需要更大吞吐量的模型提供新的出路,尤其是視頻分析推理應用。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    PCBA加工廠常見的體系認證

    ??隨著汽車行業(yè)的興盛,市面上越來越多的汽車流入,帶動了汽車電子的發(fā)展,很多PCBA加工廠都想分一杯羹。而汽車電子準入門檻較高,對工廠的技術和設備實力都有著嚴格的審核標準,IATF16949體系技術含金量較高,認證內容也較復雜。般來說具備該體系認證的廠商都具備
    的頭像 發(fā)表于 04-16 12:07 ?227次閱讀

    AI推理帶火的ASIC,開發(fā)成敗在此舉!

    的應用性價比遠超GPU,加上博通財報AI業(yè)務同比大增220%,掀起了AI推理端的ASIC熱潮。 ? 那么ASIC跟傳統(tǒng)的GPU有哪些區(qū)別,開發(fā)上又有哪些流程上的不同? ?
    的頭像 發(fā)表于 03-03 00:13 ?3176次閱讀
    AI推理帶火的<b class='flag-5'>ASIC</b>,開發(fā)成敗在此<b class='flag-5'>一</b>舉!

    JESD204B有專用于ADC/DAC和FPGAASIC的接口嗎?

    請問各位大俠:JESD204B專用于ADC/DAC和FPGAASIC的接口嗎,該接口同Rapid/PCIe的物理層Serdes接口有何區(qū)別,謝謝!
    發(fā)表于 02-08 09:10

    FPGA+GPU+CPU國產化人工智能平臺

    平臺采用國產化FPGA+GPU+CPU構建嵌入式多核異構智算終端,可形成FPGA+GPUFPGA+CPU、CPU+FPGA等組合模式,形成低功耗、高可擴展性的硬件系統(tǒng),結合使用場景靈
    的頭像 發(fā)表于 01-07 16:42 ?1038次閱讀
    <b class='flag-5'>FPGA+GPU</b>+CPU國產化人工智能平臺

    ASICGPU的原理和優(yōu)勢

    芯片”。 準確來說,除了它倆,計算芯片還包括大家更熟悉的CPU,以及FPGA。 行業(yè)里,通常會把半導體芯片分為數(shù)字芯片和模擬芯片。其中,數(shù)字芯片的市場規(guī)模占比較大,達到70%左右。 數(shù)字芯片,還可以進步細分,分為:邏輯芯片、存儲芯片以及微控制單元(MCU)。CPU、
    的頭像 發(fā)表于 01-06 13:58 ?1594次閱讀
    <b class='flag-5'>ASIC</b>和<b class='flag-5'>GPU</b>的原理和優(yōu)勢

    FPGAASIC的區(qū)別 FPGA性能優(yōu)化技巧

    FPGAASIC的區(qū)別 FPGA(現(xiàn)場可編程門陣列)和ASIC(專用集成電路)是兩種不同的集成電路技術,它們在多個方面存在顯著的區(qū)別: FPGA
    的頭像 發(fā)表于 12-02 09:51 ?981次閱讀

    ASIC集成電路如何提高系統(tǒng)效率

    在現(xiàn)代電子系統(tǒng)中,效率和性能是衡量個系統(tǒng)優(yōu)劣的關鍵指標。隨著技術的發(fā)展,ASIC集成電路因其高度定制化和優(yōu)化的特性,在提高系統(tǒng)效率方面發(fā)揮著越來越重要的作用。 ASIC的定義和特點 ASIC
    的頭像 發(fā)表于 11-20 15:57 ?902次閱讀

    ASIC集成電路與FPGA的區(qū)別

    ASIC(專用集成電路)與FPGA(現(xiàn)場可編程門陣列)是兩種不同的集成電路技術,它們在多個方面存在顯著的區(qū)別。以下是兩者的主要差異: 、設計與制造 ASIC 是為特定應用定制設計的集
    的頭像 發(fā)表于 11-20 15:02 ?1127次閱讀

    電源IC U6203DC概述和特點

    久坐生活方式已經成為了當今社會的大公共衛(wèi)生問題,都市白領、司機、開車族、學生等,長期坐著的人群,都面臨腰肌勞損問題,所以腰部按摩儀市場正活躍。想要在腰部按摩儀市場分一杯羹的小伙伴,不妨先鎖定專注按摩儀充電器電源ic的廠家——
    的頭像 發(fā)表于 11-20 10:42 ?564次閱讀

    FPGAASIC在大模型推理加速中的應用

    隨著現(xiàn)在AI的快速發(fā)展,使用FPGAASIC進行推理加速的研究也越來越多,從目前的市場來說,有些公司已經有了專門做推理的ASIC,像Groq的LPU,專門針對大語言模型的推理做了優(yōu)化,因此相比
    的頭像 發(fā)表于 10-29 14:12 ?1914次閱讀
    <b class='flag-5'>FPGA</b>和<b class='flag-5'>ASIC</b>在大模型推理加速中的應用

    FPGAASIC的優(yōu)缺點比較

    FPGA(現(xiàn)場可編程門陣列)與ASIC(專用集成電路)是兩種不同的硬件實現(xiàn)方式,各自具有獨特的優(yōu)缺點。以下是對兩者優(yōu)缺點的比較: FPGA的優(yōu)點 可編程性強 :FPGA具有高度的可編程
    的頭像 發(fā)表于 10-25 09:24 ?1650次閱讀

    ALINX FPGA+GPU異架構視頻圖像處理開發(fā)平臺介紹

    Alinx 最新發(fā)布的新品 Z19-M 是款創(chuàng)新的 FPGA+GPU 異構架構視頻圖像處理開發(fā)平臺,它結合了 AMD Zynq UltraScale+ MPSoC(FPGA)與 NVIDIA Jetson Orin NX(
    的頭像 發(fā)表于 08-29 14:43 ?2046次閱讀

    為低功耗FPGA、處理器和ASIC實施啟用LVDS鏈路

    電子發(fā)燒友網(wǎng)站提供《為低功耗FPGA、處理器和ASIC實施啟用LVDS鏈路.pdf》資料免費下載
    發(fā)表于 08-29 09:59 ?0次下載
    為低功耗<b class='flag-5'>FPGA</b>、處理器和<b class='flag-5'>ASIC</b>實施啟用LVDS鏈路

    ASIC IP核移植到FPGA上——更新概念并推動改變以完成充滿挑戰(zhàn)的任務!

    本系列文章從數(shù)字芯片設計項目技術總監(jiān)的角度出發(fā),介紹了如何將芯片的產品定義與設計和驗證規(guī)劃進行結合,詳細講述了在FPGA上使用IP核來開發(fā)ASIC原型項目時,必須認真考慮的些問題。文章從介紹
    的頭像 發(fā)表于 08-10 17:13 ?1071次閱讀
    將<b class='flag-5'>ASIC</b> IP核移植到<b class='flag-5'>FPGA</b>上——更新概念并推動改變以完成充滿挑戰(zhàn)的任務!

    科普 | 文了解FPGA

    次性工程費用,用量較小時具有成本優(yōu)勢。 1)靈活性:通過對 FPGA 編程,FPGA 能夠執(zhí)行 ASIC 能夠執(zhí)行的任何邏輯功能。FPGA
    發(fā)表于 07-08 19:36