在人工智能(AI)技術飛速發(fā)展的今天,AI大模型的部署需求正迅速從云端向端側和邊緣側設備遷移。這一轉(zhuǎn)變對AI芯片的性能、功耗和響應速度提出了前所未有的挑戰(zhàn)。正是在這樣的背景下,后摩智能憑借其創(chuàng)新的技術實力,推出了基于存算一體架構的邊端大模型AI芯片——后摩漫界??M30,引領了AI芯片領域的新一輪革命。
后摩漫界??M30芯片以其高達100TOPS的最高算力和僅12W的典型功耗,成功實現(xiàn)了高性能與低功耗的完美融合。這一特性使得M30芯片能夠輕松應對邊端側大模型部署對高效率和實時性的嚴苛要求,為AI技術在更多領域的應用提供了強大的硬件支持。
作為一款通用的邊端大模型AI芯片,M30能夠支持多種大模型,包括但不限于ChatGLM、Llama2、通義千問等。在Qwen1.5-7B-Chat大模型上,M30的運行性能可達15-20 Tokens/s,這一表現(xiàn)足以證明其在處理復雜AI任務時的卓越能力。
為了進一步提升部署的便捷性,后摩智能同步推出了基于M30芯片的智算模組(SoM)和力謀??AI加速卡。智算模組(SoM)支持PCIe EP模式,以其小巧的體積、強勁的性能和極低的功耗,成為小型化設備和功耗敏感嵌入式場景的理想選擇。而力謀??AI加速卡作為標準的半高半長PCIe加速卡,則能在PC、一體機和服務器中實現(xiàn)快速部署,支持主動散熱和被動散熱兩種模式,確保設備在不同環(huán)境下的穩(wěn)定運行。
后摩漫界??M30芯片的推出,不僅為傳統(tǒng)的端側和邊緣側設備注入了強大的大模型能力,還成功適配了包括X86、ARM在內(nèi)的多種主流處理器。這使得M30芯片能夠廣泛應用于AI PC、邊緣AI一體機、智能座艙、商用顯示、智能融合網(wǎng)關,NAS(網(wǎng)絡附加存儲)等領域,為AI技術在更多領域的深入應用注入了強大動力。
展望未來,后摩智能將繼續(xù)秉承創(chuàng)新、務實、高效的理念,不斷推出更多高性能、低功耗的AI芯片產(chǎn)品,為AI技術的發(fā)展和應用做出更大的貢獻。同時,我們也期待更多企業(yè)和機構能夠加入到AI技術的研發(fā)和應用中來,共同推動AI技術的繁榮發(fā)展。
-
AI
+關注
關注
88文章
35164瀏覽量
280004 -
人工智能
+關注
關注
1807文章
49029瀏覽量
249568 -
后摩智能
+關注
關注
0文章
35瀏覽量
1382
發(fā)布評論請先 登錄
評論