一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Neuchips展示大模型推理ASIC芯片

SSDFans ? 來源:SSDFans ? 2025-01-06 17:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

領(lǐng)先的AI專用集成電路ASIC)解決方案提供商N(yùn)euchips在CES 2024上展示了其革命性的Raptor Gen AI加速芯片(以前稱為N3000)和Evo PCIe加速卡LLM解決方案。新的芯片解決方案Raptor使企業(yè)能夠以現(xiàn)有解決方案的一小部分成本部署大型語言模型(LLM)推理。

NeuchipsCEO Ken Lau表示:“我們很高興在CES 2024上向業(yè)界展示我們的Raptor芯片和Evo卡。Neuchips的解決方案代表了自然語言處理在性價比上的巨大飛躍。有了Neuchips,任何組織都可以在廣泛的AI應(yīng)用中從LLM中獲得力量?!?/p>

LLM民主化

Raptor和Evo共同提供了一個優(yōu)化的堆棧,使企業(yè)可以輕松訪問市場領(lǐng)先的LLM。與現(xiàn)有解決方案相比,Neuchips的AI解決方案顯著降低了硬件成本。高能效也最大限度地減少了用電量,進(jìn)一步降低了總擁有成本。

在CES 2024上,Neuchips展示了Raptor和Evo,在個人AI助理應(yīng)用程序上加速Whisper和LlamaAI聊天機(jī)器人。該解決方案突出了LLM推理對實際業(yè)務(wù)需求的強(qiáng)大功能。

其他技術(shù)會議將展示Raptor和Evo如何削減語音到文本應(yīng)用程序的部署成本。

Raptor GenAI加速器為突破LLM性能提供動力

Raptor每個芯片的運(yùn)算速度高達(dá)每秒200TOPS。它在AI推理操作(如矩陣乘法、向量和嵌入表查找)方面的出色性能適用于Gen-AI和基于變壓器的AI模型。這一突破性的吞吐量是通過Neuchips為神經(jīng)網(wǎng)絡(luò)量身定制的專利壓縮和效率優(yōu)化來實現(xiàn)的。

Evo第5代PCIe卡為加速和低功耗設(shè)定新標(biāo)準(zhǔn)

與Raptor互補(bǔ)的是Neuchips的超低功耗Evo加速卡。Evo結(jié)合了8通道PCIe Gen 5和32GB LPDDR5,實現(xiàn)64 GB/s主機(jī)I/O帶寬和1.6 Tbps每秒的內(nèi)存帶寬,每卡僅55瓦。

正如DLRM所展示的那樣,Evo還具有100%的可擴(kuò)展性,允許客戶通過添加更多芯片來線性提高性能。這種模塊化設(shè)計確保了對未來AI工作負(fù)載的投資保護(hù)。

該公司2024年下半年推出了HHHL(half-height half-length)外形產(chǎn)品Viper,提供更大的部署靈活性。新系列在緊湊的設(shè)計中帶來了數(shù)據(jù)中心級的AI加速。

原文鏈接:

https://www.techpowerup.com/317298/neuchips-to-showcase-industry-leading-gen-ai-inferencing-accelerators-at-ces-2024


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • ASIC芯片
    +關(guān)注

    關(guān)注

    2

    文章

    92

    瀏覽量

    24286
  • LLM
    LLM
    +關(guān)注

    關(guān)注

    1

    文章

    325

    瀏覽量

    838

原文標(biāo)題:Neuchips展示大模型推理ASIC芯片!

文章出處:【微信號:SSDFans,微信公眾號:SSDFans】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    模型推理顯存和計算量估計方法研究

    隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習(xí)大模型在各個領(lǐng)域得到了廣泛應(yīng)用。然而,大模型推理過程對顯存和計算資源的需求較高,給實際應(yīng)用帶來了挑戰(zhàn)。為了解決這一問題,本文將探討大模型
    發(fā)表于 07-03 19:43

    谷歌新一代 TPU 芯片 Ironwood:助力大規(guī)模思考與推理的 AI 模型新引擎?

    Cloud 客戶開放,將提供 256 芯片集群以及 9,216 芯片集群兩種配置選項。 ? 在核心亮點(diǎn)層面,Ironwood 堪稱谷歌首款專門為 AI 推理精心設(shè)計的 TPU 芯片,
    的頭像 發(fā)表于 04-12 00:57 ?2435次閱讀

    詳解 LLM 推理模型的現(xiàn)狀

    2025年,如何提升大型語言模型(LLM)的推理能力成了最熱門的話題之一,大量優(yōu)化推理能力的新策略開始出現(xiàn),包括擴(kuò)展推理時間計算、運(yùn)用強(qiáng)化學(xué)習(xí)、開展監(jiān)督微調(diào)和進(jìn)行提煉等。本文將深入探討
    的頭像 發(fā)表于 04-03 12:09 ?502次閱讀
    詳解 LLM <b class='flag-5'>推理模型</b>的現(xiàn)狀

    為什么無法在運(yùn)行時C++推理中讀取OpenVINO?模型?

    使用模型優(yōu)化器 2021.1 版OpenVINO?轉(zhuǎn)換模型 使用 Runtime 2022.3 版本在 C++ 推理實現(xiàn) ( core.read_model()) 中讀取模型Open
    發(fā)表于 03-05 06:17

    AI推理帶火的ASIC,開發(fā)成敗在此一舉!

    電子發(fā)燒友網(wǎng)報道(文/梁浩斌)去年年底,多家大廠爆出開發(fā)數(shù)據(jù)中心ASIC芯片的消息,包括傳聞蘋果與博通合作開發(fā)面向AI推理ASIC,亞馬遜也在年底公布了其AI?
    的頭像 發(fā)表于 03-03 00:13 ?3320次閱讀
    AI<b class='flag-5'>推理</b>帶火的<b class='flag-5'>ASIC</b>,開發(fā)成敗在此一舉!

    AI大模型在汽車應(yīng)用中的推理、降本與可解釋性研究

    佐思汽研發(fā)布《2024-2025年AI大模型及其在汽車領(lǐng)域的應(yīng)用研究報告》。 推理能力成為大模型性能提升的驅(qū)動引擎 2024下半年以來,國內(nèi)外大模型公司紛紛推出
    的頭像 發(fā)表于 02-18 15:02 ?1236次閱讀
    AI大<b class='flag-5'>模型</b>在汽車應(yīng)用中的<b class='flag-5'>推理</b>、降本與可解釋性研究

    黑芝麻智能芯片加速DeepSeek模型推理

    近日,黑芝麻智能宣布,其武當(dāng)C1200家族芯片已成功完成DeepSeek模型推理的部署,而A2000芯片也將全面支持基于DeepSeek的多模態(tài)大
    的頭像 發(fā)表于 02-14 15:04 ?582次閱讀

    摩爾線程宣布成功部署DeepSeek蒸餾模型推理服務(wù)

    近日,摩爾線程智能科技(北京)有限責(zé)任公司在其官方渠道發(fā)布了一則重要消息,宣布公司已經(jīng)成功實現(xiàn)了對DeepSeek蒸餾模型推理服務(wù)的部署。這一技術(shù)突破,標(biāo)志著摩爾線程在人工智能領(lǐng)域邁出了堅實的一步
    的頭像 發(fā)表于 02-06 13:49 ?817次閱讀

    如何開啟Stable Diffusion WebUI模型推理部署

    如何開啟Stable Diffusion WebUI模型推理部署
    的頭像 發(fā)表于 12-11 20:13 ?559次閱讀
    如何開啟Stable Diffusion WebUI<b class='flag-5'>模型</b><b class='flag-5'>推理</b>部署

    阿里云開源推理模型QwQ

    推理能力,尤其在數(shù)學(xué)和編程方面表現(xiàn)突出。其整體推理水平已經(jīng)可以與OpenAI的o1模型相媲美,這充分展示了QwQ的強(qiáng)大實力和潛力。 QwQ(Qwen with Questions)是通
    的頭像 發(fā)表于 11-29 11:30 ?1167次閱讀

    使用vLLM+OpenVINO加速大語言模型推理

    隨著大語言模型的廣泛應(yīng)用,模型的計算需求大幅提升,帶來推理時延高、資源消耗大等挑戰(zhàn)。
    的頭像 發(fā)表于 11-15 14:20 ?1426次閱讀
    使用vLLM+OpenVINO加速大語言<b class='flag-5'>模型</b><b class='flag-5'>推理</b>

    高效大模型推理綜述

    模型由于其在各種任務(wù)中的出色表現(xiàn)而引起了廣泛的關(guān)注。然而,大模型推理的大量計算和內(nèi)存需求對其在資源受限場景的部署提出了挑戰(zhàn)。業(yè)內(nèi)一直在努力開發(fā)旨在提高大模型
    的頭像 發(fā)表于 11-15 11:45 ?1458次閱讀
    高效大<b class='flag-5'>模型</b>的<b class='flag-5'>推理</b>綜述

    FPGA和ASIC在大模型推理加速中的應(yīng)用

    隨著現(xiàn)在AI的快速發(fā)展,使用FPGA和ASIC進(jìn)行推理加速的研究也越來越多,從目前的市場來說,有些公司已經(jīng)有了專門做推理ASIC,像Groq的LPU,專門針對大語言
    的頭像 發(fā)表于 10-29 14:12 ?2027次閱讀
    FPGA和<b class='flag-5'>ASIC</b>在大<b class='flag-5'>模型</b><b class='flag-5'>推理</b>加速中的應(yīng)用

    澎峰科技高性能大模型推理引擎PerfXLM解析

    自ChatGPT問世以來,大模型遍地開花,承載大模型應(yīng)用的高性能推理框架也不斷推出,大有百家爭鳴之勢。在這種情況下,澎峰科技作為全球領(lǐng)先的智能計算服務(wù)提供商,在2023年11月25日發(fā)布了針對大語言
    的頭像 發(fā)表于 09-29 10:14 ?1474次閱讀
    澎峰科技高性能大<b class='flag-5'>模型</b><b class='flag-5'>推理</b>引擎PerfXLM解析

    LLM大模型推理加速的關(guān)鍵技術(shù)

    LLM(大型語言模型)大模型推理加速是當(dāng)前人工智能領(lǐng)域的一個研究熱點(diǎn),旨在提高模型在處理復(fù)雜任務(wù)時的效率和響應(yīng)速度。以下是對LLM大模型
    的頭像 發(fā)表于 07-24 11:38 ?1820次閱讀