一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI終端時代:端側(cè)算力快速提升,AI芯片競爭進入新的階段

Monika觀察 ? 來源:電子發(fā)燒友網(wǎng) ? 作者:莫婷婷 ? 2024-04-22 07:49 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報道(文/莫婷婷)全球終端市場在經(jīng)歷了高峰之后,在2022年、2023年出現(xiàn)明顯的終端市場下滑。進入2024年,全球終端市場又迎來了小幅反彈,AI技術(shù)的加持是市場反彈的動力之一。毫不夸張地說,是AI重新點燃了終端市場。

2023年被認為是AI終端的元年,那么進入2024年,AI終端市場會迎來哪些發(fā)展機會,上游的芯片環(huán)節(jié),AI芯片有哪些最新解決方案。

AI終端成為交互入口,首款A(yù)I PC個人智能體已經(jīng)面世

為什么AI算力會轉(zhuǎn)移到終端側(cè)?IDC中國及全球副總裁王吉平提到了四大方面的原因。

一是芯片廠商技術(shù)革命,未來是在混合算力的基礎(chǔ)上,端側(cè)算力未來會快速提升。二是模型正在不斷演變,例如混合專家模型(MoE)正受到業(yè)內(nèi)人士的關(guān)注。三是人們越來越關(guān)注安全性,端側(cè)模型對于個人安全隱私,以及端之間互聯(lián)互通的安全性有很好地保護。四是大模型開始垂直化整合,垂直領(lǐng)域端+小模型的需求也在提升,王吉平認為小模型和小終端之間也可以非常完美地匹配。

目前,在終端產(chǎn)品中,PC、智能家居、車載設(shè)備、智能手機、智能手表、耳機,甚至是AR/VR等設(shè)備都能得到AI技術(shù)的加持。

可以預(yù)測到,隨著場景化發(fā)展,不同場景下的終端分工更加細致和專業(yè),AI技術(shù)將加速終端未來十年新一輪的融合。

目前,手機廠商已經(jīng)打造了各自的AI大模型,將其賦能至智能手機中,例如華為小藝語音助手用到了盤古大模型,小米小愛同學(xué)用的是小米AI大模型MiLM-6B等等。

在AI PC方面,已經(jīng)從普通的AI PC走向了AI PC智能體,例如聯(lián)想于4月18日發(fā)布的業(yè)內(nèi)首款A(yù)I PC個人智能體——聯(lián)想小天,具備文生圖的功能,還能實現(xiàn)圖像訓(xùn)練和深度編輯。
圖源:聯(lián)想

在AI機器人方面,傳音旗下創(chuàng)新科技品牌TECNO在MWC24上,展示了公司首款A(yù)I增強型仿生四足機器人Dynamic 1,能夠用于智能助手、教育培訓(xùn)等場景。

AI終端在發(fā)展過程中,大模型(LLM)向智能體(Agent)轉(zhuǎn)變,最終形成一個完整的閉環(huán)。那么,未來AI終端會朝著哪些方向發(fā)展呢?業(yè)內(nèi)人士普遍認為,未來AI終端將成為個人AI助理,IDC認為將具備以下五大特征:

一是成為第一交互入口。此外,當國內(nèi)的推理芯片搭載在各個終端后,會形成國內(nèi)生態(tài)的智能體應(yīng)用于各個行業(yè)中。二是終端將標配本地混合AI算力,例如CPU/NPU/GPU等;隨之,形成個人終端和個人邊緣協(xié)同計算結(jié)構(gòu)。三是終端內(nèi)嵌個人大模型,形成個性化本地知識庫。四是必須會有個人數(shù)據(jù)和隱私安全保護。五是有一個連接開放的AI應(yīng)用生態(tài),同時它要開發(fā)API接口



AI芯片進入新的競爭階段,英偉達、英特爾、高通攻克推理性能
在技術(shù)底層,AI終端的發(fā)展離不開AI芯片。隨著AI大模型在終端進行規(guī)?;瘮U張,部署端側(cè)算力顯得尤為重要。英特爾CEO帕特·基辛格曾表示在人工智能領(lǐng)域,推理技術(shù)變得越來越重要,甚至比訓(xùn)練還更加重要。

IDC中國及全球副總裁王吉平也預(yù)測了大語言模型端側(cè)芯片的發(fā)展趨勢,他認為XPU模式會推動端側(cè)模型推理能力明顯提升。
圖源:電子發(fā)燒友網(wǎng)攝

目前,在AI芯片領(lǐng)域,英偉達、英特爾、AMD等是國際主流玩家。在近兩年,國內(nèi)的推理芯片廠商也逐漸進入業(yè)內(nèi)視野中,例如阿里平頭哥、寒武紀、燧原科技、云天勵飛等,隨著技術(shù)的迭代,上述國產(chǎn)芯片廠商的AI芯片性能也在不斷提升。

AI芯片領(lǐng)域的競爭進入了新的階段。目前,英特爾、英偉達、高通都推出了各自面向AI推理的芯片。

就在美國時間4月9日,英特爾發(fā)布了新一代AI芯片Gaudi 3,可對標英偉達H100。Gaudi 3采用5nm工藝制造,具有64個第五代張量處理核心、8個矩陣計算引擎,24個200 Gbps以太網(wǎng) RDMA NIC,以太網(wǎng)的通用標準能連接數(shù)萬個加速器,最高 16 條 PCIe 5.0 總線。與Gaudi 2相比,Gaudi 3的FP8吞吐量達到1835 TFLOPS,BF16性能提升四倍,網(wǎng)絡(luò)帶寬提升兩倍,內(nèi)存帶寬提升1.5倍。

英偉達H100芯片是在2023年發(fā)布的產(chǎn)品,采用4nm工藝,搭載了最新Hopper架構(gòu),集成Transformer引擎、第四代TensorCore、第四代張量內(nèi)核等技術(shù)。支持PCle Gen5和利用HBM3,憶體頻寬達到3TB/s,F(xiàn)P8 算力與A100相比提升了3倍,達4000TFLOPS。

在今年3月的英偉達GTC人工智能大會,英偉達還發(fā)布了Blackwell B200 GPU,有著2080億個晶體管,H100的FP4性能為4 petaflops,而B200 能提供高達20 petaflops FP4的算力。兩個B200與單個英偉達Grace CPU相連,打造出GB200 Grace Blackwell超級芯片。

在AI芯片新的競爭階段,廠商都更加重視芯片的推理能力,從英特爾和英偉達的新品正好說明了這一點。英特爾Gaudi系列面向AI應(yīng)用場景,其推理能力也在不斷提升,Gaudi 3的模型訓(xùn)練速度提升40%,推理速度則提升50%。

英偉達介紹,H100采用了新的Transformer Engine專門用于加速Transformer 模型的訓(xùn)練和推理,在進行語言模型的訓(xùn)練和推理時,訓(xùn)練速度是A100的9倍,推理速度是A100的30倍。Blackwell GPU更是能提供30倍的推理性能,AI訓(xùn)練和大模型實時推理的規(guī)模擴展到10萬億參數(shù)。

高通也在2023年10月發(fā)布驍龍 X Elite,這是一款面向 Windows 11 PC 的旗艦 PC 芯片,集成了Oryon?CPU、Adreno?GPU、Hexagon?NPU,支持在端側(cè)運行超過 130 億參數(shù)的生成式 AI 模型。

在當時的發(fā)布會上,高通透露搭載驍龍 X Elite 芯片的筆記本電腦在今年中期面世。近期已有消息顯示,聯(lián)想 YOGA Slim 7 14 2024 驍龍版,以及一款命名為ThinkPad T14s Gen 6 驍龍版的筆記本或?qū)⒋钶d高通驍龍X Elite 芯片。高通驍龍X Elite 芯片會給聯(lián)想AI PC帶來哪些AI性能,值得期待。

而英偉達的H100已經(jīng)應(yīng)用在其超級計算機Eos中,總共搭載了4608個H100 GPU,還有1,152個英特爾至強Platinum 8480C處理器。Eos被認為是英偉達速度最快的人工智能超級計算機,可用于人工智能和高性能計算工作負載。

每一代AI芯片的推出,都有它各自的應(yīng)用定位。從終端市場來看,AI技術(shù)已經(jīng)從手機、PC滲透進更多終端產(chǎn)品,未來會走向高性能PC、工作站等,不管是面向TO C,還是TO B的行業(yè)場景(服務(wù)業(yè)、制造業(yè)等),所需要的算力將隨著應(yīng)用需求逐步提升,也會提高推理芯片的要求。未來推理芯片在AI終端會迎來怎么樣的發(fā)展,又會提升哪些應(yīng)用體驗,值得期待。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35143

    瀏覽量

    279817
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    1983

    瀏覽量

    35910
  • 算力
    +關(guān)注

    關(guān)注

    2

    文章

    1200

    瀏覽量

    15653
  • AI PC
    +關(guān)注

    關(guān)注

    0

    文章

    137

    瀏覽量

    492
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    側(cè)AI需求大爆發(fā)!安謀科技發(fā)布新一代NPU IP,賦能AI終端應(yīng)用

    ,汽車自動駕駛的本地決策,都依賴提升,這對側(cè)AI SoC的性能帶來挑戰(zhàn),上游IP廠商的新品
    的頭像 發(fā)表于 07-11 01:16 ?6359次閱讀
    <b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>需求大爆發(fā)!安謀科技發(fā)布新一代NPU IP,賦能<b class='flag-5'>AI</b><b class='flag-5'>終端</b>應(yīng)用

    邊緣計算時代,科通技術(shù)以AI方案重構(gòu)分配格局

    隨著AI大模型技術(shù)的快速發(fā)展,其在終端設(shè)備中的應(yīng)用正成為行業(yè)突破的關(guān)鍵方向。深圳市科通技術(shù)股份有限公司(以下簡稱“科通技術(shù)”)憑借“DeepSeek+AI
    的頭像 發(fā)表于 05-28 14:23 ?198次閱讀

    蘋芯科技 N300 存一體 NPU,開啟側(cè) AI 新征程

    隨著側(cè)人工智能技術(shù)的爆發(fā)式增長,智能設(shè)備對本地與能效的需求日益提高。而傳統(tǒng)馮·諾依曼架構(gòu)在數(shù)據(jù)處理效率上存在瓶頸,“內(nèi)存墻”問題成為制約
    的頭像 發(fā)表于 05-06 17:01 ?467次閱讀
    蘋芯科技 N300 存<b class='flag-5'>算</b>一體 NPU,開啟<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b> <b class='flag-5'>AI</b> 新征程

    側(cè) AI 芯片終端智能落地的核心引擎

    電子發(fā)燒友網(wǎng)報道(文 / 李彎彎)側(cè) AI 芯片,是專門為在諸如智能手機、IoT 設(shè)備、自動駕駛汽車等終端設(shè)備上,高效運行人工智能算法而設(shè)
    的頭像 發(fā)表于 04-14 02:11 ?2482次閱讀

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓側(cè)AI模型接入得心應(yīng)手

    猛增50倍,將訓(xùn)練時間從一整天縮短至半小時。更快的側(cè)LoRA訓(xùn)練,讓側(cè)AI基于用戶
    發(fā)表于 04-13 19:52

    側(cè)AI應(yīng)用——“后DeepSeek時代”產(chǎn)業(yè)機遇分析

    ,面向行業(yè)進一步釋放 "側(cè) AI 應(yīng)用" 的確定性機遇,推動“后DeepSeek時代” PC生產(chǎn)邊界實現(xiàn)跨越式拓展。 搭載AMD銳龍
    的頭像 發(fā)表于 03-26 17:34 ?334次閱讀

    DeepSeek推動AI需求:800G光模塊的關(guān)鍵作用

    數(shù)據(jù)傳輸速率,減少帶寬瓶頸,成為數(shù)據(jù)中心和AI集群架構(gòu)優(yōu)化的重點。光模塊速率的躍升不僅提升了傳輸效率,也為大規(guī)模并行計算任務(wù)提供了必要的帶寬保障。 800G光模塊如何解決DeepSeek大規(guī)模
    發(fā)表于 03-25 12:00

    兩大芯片廠商比拼側(cè)AI音頻芯片,高藍牙6.0成亮點

    (電子發(fā)燒友網(wǎng)綜合報道)隨著人工智能技術(shù)的飛速發(fā)展,AI芯片作為其核心硬件支撐,正逐漸從云端向側(cè)拓展。
    的頭像 發(fā)表于 03-24 08:51 ?1709次閱讀

    【一文看懂】什么是側(cè)?

    隨著物聯(lián)網(wǎng)(IoT)、人工智能和5G技術(shù)的快速發(fā)展,側(cè)正逐漸成為智能設(shè)備性能提升和智能化應(yīng)
    的頭像 發(fā)表于 02-24 12:02 ?1317次閱讀
    【一文看懂】什么是<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>算</b><b class='flag-5'>力</b>?

    廣和通發(fā)布Fibocom AI Stack,助力客戶快速實現(xiàn)跨平臺跨系統(tǒng)的側(cè)AI部署

    模型及行業(yè)側(cè)模型,基于不同等級芯片平臺或模組,F(xiàn)ibocom AI Stack可將Ten
    發(fā)表于 01-08 11:38 ?274次閱讀
    廣和通發(fā)布Fibocom <b class='flag-5'>AI</b> Stack,助力客戶<b class='flag-5'>快速</b>實現(xiàn)跨平臺跨系統(tǒng)的<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>部署

    廣和通開啟側(cè)AI時代

    AI發(fā)展正酣,隨著終端芯片越來越高、側(cè)模型能力
    的頭像 發(fā)表于 12-12 10:35 ?807次閱讀

    AI風(fēng)向標|與通信的完美融合,SRM6690解鎖側(cè)AI的智能密碼

    當前,5G技術(shù)已經(jīng)成為推動數(shù)字經(jīng)濟和實體經(jīng)濟深度融合的關(guān)鍵驅(qū)動力,進入5G發(fā)展的下半場,5G與AI的融合正推動諸多行業(yè)的數(shù)字化轉(zhuǎn)型和創(chuàng)新發(fā)展,終端側(cè)
    的頭像 發(fā)表于 11-15 01:01 ?558次閱讀
    <b class='flag-5'>AI</b>風(fēng)向標|<b class='flag-5'>算</b><b class='flag-5'>力</b>與通信的完美融合,SRM6690解鎖<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>的智能密碼

    企業(yè)AI租賃是什么

    企業(yè)AI租賃是指企業(yè)通過互聯(lián)網(wǎng)向?qū)I(yè)的提供商租用所需的計算資源,以滿足其AI應(yīng)用的需求。
    的頭像 發(fā)表于 11-14 09:30 ?2407次閱讀

    側(cè)AI浪潮已來!炬芯科技發(fā)布新一代側(cè)AI音頻芯片,能效比和AI大幅度提升

    電子發(fā)燒友原創(chuàng) 章鷹 ? 11月5日,在深圳會展中心7號館內(nèi),炬芯科技董事長兼CEO周正宇博士帶來了《側(cè)AI芯片的未來》演講,他對
    的頭像 發(fā)表于 11-06 09:11 ?4005次閱讀
    <b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>浪潮已來!炬芯科技發(fā)布新一代<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>音頻<b class='flag-5'>芯片</b>,能效比和<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>大幅度<b class='flag-5'>提升</b>

    大模型時代需求

    現(xiàn)在AI進入大模型時代,各企業(yè)都爭相部署大模型,但如何保證大模型的,以及相關(guān)的穩(wěn)定性和性能,是一個極為重要的問題,帶著這個極為重要的問
    發(fā)表于 08-20 09:04