一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

能效比較GPGPU高一個(gè)數(shù)量級(jí),國(guó)產(chǎn)AI芯片讓端側(cè)AI大模型高質(zhì)量落地

吳生semi ? 來(lái)源:電子發(fā)燒友網(wǎng) ? 作者:吳子鵬 ? 2024-07-10 16:28 ? 次閱讀
電子發(fā)燒友網(wǎng)報(bào)道(文/吳子鵬)2024年世界人工智能大會(huì)(以下簡(jiǎn)稱(chēng):WAIC 2024)依然是一場(chǎng)“百模大戰(zhàn)”,不過(guò)有一些很明顯的變化是:新推出的AI大模型更加注重用戶(hù)體驗(yàn);邊側(cè)和端側(cè)承載AI大模型的方案越來(lái)越多。也就是說(shuō),AI大模型不僅完成了從“能用”到“好用”的蛻變,也從高高在上的云端,走到更靠近應(yīng)用場(chǎng)景的邊側(cè)和端側(cè),這給作為方案核心的推理芯片提出了非常高的要求。

在愛(ài)芯元智于WAIC 2024舉辦的“芯領(lǐng)未來(lái)丨智能芯片及多模態(tài)大模型論壇”上,愛(ài)芯元智創(chuàng)始人、董事長(zhǎng)仇肖莘在主旨演講中表示,大模型真正大規(guī)模落地需要云邊端三級(jí)緊密結(jié)合,而邊側(cè)和端側(cè)結(jié)合的關(guān)鍵在于高能效的邊端AI芯片。
愛(ài)芯元智創(chuàng)始人、董事長(zhǎng)仇肖莘
仇肖莘指出,目前基于愛(ài)芯元智AI芯片已經(jīng)完成非常多款A(yù)I大模型的適配,能夠支持的參數(shù)規(guī)模覆蓋0.3B-7B?!按钶dAI處理器的高效推理芯片將是大模型落地更合理的選擇,這也是推進(jìn)普惠AI的關(guān)鍵所在?!?br />
愛(ài)芯智眸AI-ISP和愛(ài)芯通元NPU
在AI芯片的研發(fā)上,愛(ài)芯元智打造了廣受業(yè)界認(rèn)可的愛(ài)芯智眸AI-ISP和愛(ài)芯通元混合精度NPU兩大自研核心技術(shù)。其中,愛(ài)芯智眸AI-ISP是將深度學(xué)習(xí)算法與傳統(tǒng)的ISP處理單元相結(jié)合,利用像素級(jí)AI處理技術(shù),在各種復(fù)雜應(yīng)用場(chǎng)景中,全面提升成像效果,為后期智能處理提供高質(zhì)量的圖像、視頻素材,作為萬(wàn)物智能的“眼睛”感知更多信息,特別是暗光全彩的剛需。

愛(ài)芯通元混合精度NPU是以算子為原子指令集的AI計(jì)算處理器,采用多線程異構(gòu)多核設(shè)計(jì),實(shí)現(xiàn)算子、網(wǎng)絡(luò)微結(jié)構(gòu)、數(shù)據(jù)流和內(nèi)存訪問(wèn)優(yōu)化,高效支持混合精度算法設(shè)計(jì),原生支持Transformer網(wǎng)絡(luò)結(jié)構(gòu),為大模型在邊緣側(cè)、端側(cè)的應(yīng)用提供良好的基礎(chǔ)。

仇肖莘談到,愛(ài)芯元智現(xiàn)階段奉行以“AIoT+ADAS”為主的一體兩翼戰(zhàn)略路線,在AI大模型進(jìn)入邊側(cè)和端側(cè)的過(guò)程中,智慧城市和智能汽車(chē)都是非常具有代表性的應(yīng)用場(chǎng)景?!澳壳岸藗?cè)大模型落地依然在前期探索階段,我認(rèn)為智能汽車(chē)、AI手機(jī)和AIPC將會(huì)是第一批落地的場(chǎng)景,智能駕駛之所以需要端側(cè)大模型原因在于汽車(chē)對(duì)實(shí)時(shí)性的要求更高?!?br />
愛(ài)芯智眸AI-ISP作為AI芯片的子系統(tǒng),為解決很多端側(cè)場(chǎng)景圖像問(wèn)題提供了強(qiáng)力支持。比如在智能駕駛場(chǎng)景中,愛(ài)芯智眸AI-ISP提供AI星光全彩、AI HDR成像、AI多光譜融合、AI防抖、AI場(chǎng)景增強(qiáng)、AI多傳感器融合六大技術(shù)亮點(diǎn),能夠幫助智能汽車(chē)在大雨、大霧、夜間和隧道等惡劣的駕駛環(huán)境中獲取清晰的圖像。

當(dāng)然,AI技術(shù)的發(fā)展也在推動(dòng)AI-ISP的創(chuàng)新。以愛(ài)芯智眸AI-ISP來(lái)說(shuō),目前AI算法已經(jīng)取代了降噪模塊、防抖模塊。仇肖莘認(rèn)為,后續(xù)AI-ISP發(fā)展一個(gè)值得探索的方向是,AI-ISP是不是也能夠成為一個(gè)“黑盒式”的AI大模型,用AI算法取代更多ISP中的功能單元,使得AI-ISP能夠利用CMOS圖像傳感器信號(hào)直接成像,讓用戶(hù)不必再去考慮ISP工作的中間環(huán)節(jié)。

在AI芯片的打造上,愛(ài)芯通元混合精度NPU的優(yōu)點(diǎn)不只是原生支持Transformer網(wǎng)絡(luò)結(jié)構(gòu),還包括通過(guò)可編程數(shù)據(jù)流DSA架構(gòu),能夠覆蓋目前用戶(hù)需要的基本算子,成本、效能和運(yùn)算效率都非常高。仇肖莘說(shuō),“AI算法發(fā)展至今已經(jīng)非常成熟,進(jìn)入一個(gè)較為穩(wěn)定的狀態(tài),因此用戶(hù)對(duì)于算子的需求不再有日新月異的變化,這是愛(ài)芯元智能夠打造通用AI處理器的關(guān)鍵?!?br />
根據(jù)愛(ài)芯元智聯(lián)合創(chuàng)始人、副總裁劉建偉的介紹,此次論壇上正式發(fā)布的愛(ài)芯通元AI處理器在高中低三檔算力中已完成布局,并在智慧城市和輔助駕駛兩個(gè)領(lǐng)域?qū)崿F(xiàn)了規(guī)?;慨a(chǎn),能效比較GPGPU芯片提升了一個(gè)數(shù)量級(jí),而在以文搜圖、通用檢測(cè)、以圖生文、AI Agent等通用大模型應(yīng)用中,愛(ài)芯通元AI處理器也可以讓AI開(kāi)發(fā)者以更低的成本進(jìn)行高效開(kāi)發(fā)。
愛(ài)芯元智聯(lián)合創(chuàng)始人、副總裁劉建偉
讓端側(cè)更好地承載AI大模型 根據(jù)《2024年中國(guó)AI大模型產(chǎn)業(yè)發(fā)展報(bào)告》,截至2024年3月,國(guó)內(nèi)部署大模型的企業(yè)數(shù)量超243家,以通用大模型為主。不過(guò),我們都知道AI大模型成功的關(guān)鍵在于行業(yè)大模型、端側(cè)、端云結(jié)合等多種模式并行。 端側(cè)大模型的部署所面臨的挑戰(zhàn)和云端是完全不同的,需要克服能耗的限制,還需要在足夠小的參數(shù)下,做到大部分日常工作。在WAIC 2024上,愛(ài)芯元智在自己的展臺(tái)上也展示了其AI芯片在部署端側(cè)大模型方面的能力。

案例一是基于愛(ài)芯元智端側(cè)小芯片AX630C部署語(yǔ)言大模型——阿里云通義千問(wèn)Qwen2.0。AX630C提供3.2T的算力,通過(guò)運(yùn)載通義千問(wèn)Qwen2.0,可以流暢地實(shí)現(xiàn)人機(jī)對(duì)話,查詢(xún)信息、日常交流等任務(wù)。AX630C運(yùn)載通義千問(wèn)Qwen2.0每秒能處理超過(guò)10個(gè)信息單元,但功耗只有1.5瓦。

案例二是愛(ài)芯元智端AX650N結(jié)合CLIP模型可以實(shí)現(xiàn)以文搜圖的功能,只需要一個(gè)詞、一句話或一段文字,系統(tǒng)就能迅速準(zhǔn)確地從海量圖片中找到匹配項(xiàng)。

案例三是基于愛(ài)芯元智端AX650N運(yùn)轉(zhuǎn)多模態(tài)多維感知大模型OWL-ViT大模型,精準(zhǔn)完成對(duì)未知目標(biāo)檢測(cè),實(shí)現(xiàn)圖像自動(dòng)標(biāo)簽化。

正如上文提到的,愛(ài)芯通元AI處理器提供完備的算子集合,因此對(duì)于市面上的大模型能夠提供非常好的支持,并且適配的速度是非??斓?。比如,今年4月份,Meta發(fā)布了Meta Llama 3系列語(yǔ)言模型(LLM),具體包括一個(gè)8B模型和一個(gè)70B模型。隨后不久,愛(ài)芯元智就宣布,愛(ài)芯通元AI處理器完成Llama 3和Phi-3大模型適配。在Llama 3模型的適配上,愛(ài)芯元智AX650N芯片適配了Llama 3 8B Int8版本,若采用Int4量化,每秒token數(shù)還能再翻一倍,能滿足正常的人機(jī)交流。仇肖莘強(qiáng)調(diào),愛(ài)芯元智的AI芯片對(duì)INT2、INT4、INT8、INT16混合精度算力都可以支持。


結(jié)語(yǔ)
AI大模型的發(fā)展已經(jīng)進(jìn)入一個(gè)新階段,行業(yè)大模型以及云邊端結(jié)合的大模型是下一步發(fā)展重點(diǎn)。在端側(cè)運(yùn)轉(zhuǎn)大模型有不一樣的挑戰(zhàn),能耗和參數(shù)規(guī)模都會(huì)受到限制,但用戶(hù)體驗(yàn)不能打折。愛(ài)芯通元AI處理器以及愛(ài)芯元智AX650N等AI芯片展示出了非常好的端側(cè)大模型支持能力,在普惠AI的道路上邁出了堅(jiān)實(shí)一步。
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    1956

    瀏覽量

    35602
  • GPGPU
    +關(guān)注

    關(guān)注

    0

    文章

    29

    瀏覽量

    5017
  • 愛(ài)芯元智
    +關(guān)注

    關(guān)注

    1

    文章

    96

    瀏覽量

    5016
  • AI大模型
    +關(guān)注

    關(guān)注

    0

    文章

    358

    瀏覽量

    465
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    側(cè) AI 芯片:終端智能落地的核心引擎

    AI 計(jì)算,構(gòu)成了側(cè) AI 落地的核心硬件基礎(chǔ)。 ? 為何需要端側(cè)
    的頭像 發(fā)表于 04-14 02:11 ?1767次閱讀

    首創(chuàng)開(kāi)源架構(gòu),天璣AI開(kāi)發(fā)套件側(cè)AI模型接入得心應(yīng)手

    模型、通義千問(wèn)、混元等多種先進(jìn)側(cè)模型,還包含視覺(jué)、語(yǔ)言、多模態(tài)等多種多樣的大模型,開(kāi)發(fā)者可以通過(guò)Gen-
    發(fā)表于 04-13 19:52

    AI模型側(cè)部署正當(dāng)時(shí):移遠(yuǎn)端側(cè)AI模型解決方案,激活場(chǎng)景智能新范式

    AI模型解決方案?jìng)涫懿毮?,?b class='flag-5'>AI設(shè)備的革新注入了澎湃動(dòng)力。 萬(wàn)億級(jí)市場(chǎng)藍(lán)海顯現(xiàn),側(cè)AI
    發(fā)表于 03-27 11:26 ?156次閱讀
    <b class='flag-5'>AI</b>大<b class='flag-5'>模型</b><b class='flag-5'>端</b>側(cè)部署正當(dāng)時(shí):移遠(yuǎn)端<b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>解決方案,激活場(chǎng)景智能新范式

    AI模型側(cè)部署正當(dāng)時(shí):移遠(yuǎn)端側(cè)AI模型解決方案,激活場(chǎng)景智能新范式

    AI模型解決方案?jìng)涫懿毮浚瑸?b class='flag-5'>AI設(shè)備的革新注入了澎湃動(dòng)力。萬(wàn)億級(jí)市場(chǎng)藍(lán)海顯現(xiàn),側(cè)AI
    的頭像 發(fā)表于 03-26 19:05 ?299次閱讀
    <b class='flag-5'>AI</b>大<b class='flag-5'>模型</b><b class='flag-5'>端</b>側(cè)部署正當(dāng)時(shí):移遠(yuǎn)端<b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>解決方案,激活場(chǎng)景智能新范式

    移遠(yuǎn)通信邊緣計(jì)算模組成功運(yùn)行DeepSeek模型,以領(lǐng)先的工程能力加速側(cè)AI落地

    近日,國(guó)產(chǎn)模型DeepSeek憑借其“開(kāi)源開(kāi)放、高效推理、側(cè)友好”的核心優(yōu)勢(shì),迅速風(fēng)靡全球。移遠(yuǎn)通信基于邊緣計(jì)算模組SG885G,已成功實(shí)現(xiàn)DeepSeek
    發(fā)表于 02-13 11:32 ?164次閱讀
    移遠(yuǎn)通信邊緣計(jì)算模組成功運(yùn)行DeepSeek<b class='flag-5'>模型</b>,以領(lǐng)先的工程能力加速<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b><b class='flag-5'>落地</b>

    移遠(yuǎn)通信邊緣計(jì)算模組成功運(yùn)行DeepSeek模型,以領(lǐng)先的工程能力加速側(cè)AI落地

    近日,國(guó)產(chǎn)模型DeepSeek憑借其“開(kāi)源開(kāi)放、高效推理、側(cè)友好”的核心優(yōu)勢(shì),迅速風(fēng)靡全球。移遠(yuǎn)通信基于邊緣計(jì)算模組SG885G,已成功實(shí)現(xiàn)DeepSeek
    的頭像 發(fā)表于 02-12 19:03 ?330次閱讀
    移遠(yuǎn)通信邊緣計(jì)算模組成功運(yùn)行DeepSeek<b class='flag-5'>模型</b>,以領(lǐng)先的工程能力加速<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b><b class='flag-5'>落地</b>

    廣和通Fibocom AI Stack:加速側(cè)AI部署新紀(jì)元

    、海量模型以及全方位的支持與服務(wù)于體,為智能設(shè)備提供了AI解決方案。為適應(yīng)多樣化的
    的頭像 發(fā)表于 01-13 11:32 ?810次閱讀

    廣和通發(fā)布Fibocom AI Stack,助力客戶(hù)快速實(shí)現(xiàn)跨平臺(tái)跨系統(tǒng)的側(cè)AI部署

    、AI工具鏈、高性能推理引擎、海量模型、支持與服務(wù)體化的側(cè)AI解決方案,幫助智能設(shè)備快速實(shí)現(xiàn)
    發(fā)表于 01-08 11:38 ?186次閱讀
    廣和通發(fā)布Fibocom <b class='flag-5'>AI</b> Stack,助力客戶(hù)快速實(shí)現(xiàn)跨平臺(tái)跨系統(tǒng)的<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>部署

    借助谷歌Gemini和Imagen模型生成高質(zhì)量圖像

    在快速發(fā)展的生成式 AI 領(lǐng)域,結(jié)合不同模型的優(yōu)勢(shì)可以帶來(lái)顯著的成果。通過(guò)利用谷歌的 Gemini 模型來(lái)制作詳細(xì)且富有創(chuàng)意的提示,然后使用 Imagen 3 模型根據(jù)這些提示生成
    的頭像 發(fā)表于 01-03 10:38 ?727次閱讀
    借助谷歌Gemini和Imagen<b class='flag-5'>模型</b>生成<b class='flag-5'>高質(zhì)量</b>圖像

    廣和通開(kāi)啟側(cè)AI新時(shí)代

    AI發(fā)展正酣,隨著終端芯片算力越來(lái)越高、側(cè)模型能力越來(lái)越強(qiáng)、實(shí)時(shí)響應(yīng)及隱私保護(hù)的
    的頭像 發(fā)表于 12-12 10:35 ?591次閱讀

    智譜推出四個(gè)全新側(cè)模型 攜英特爾按下AI普及加速鍵

    隨著AI的發(fā)展,側(cè)AI模型越來(lái)越受到廣大客戶(hù)及廠商的關(guān)注,業(yè)界領(lǐng)先的大模型公司智譜于近日推出了
    的頭像 發(fā)表于 12-02 17:13 ?449次閱讀
    智譜推出四<b class='flag-5'>個(gè)</b>全新<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>模型</b> 攜英特爾按下<b class='flag-5'>AI</b>普及加速鍵

    把握關(guān)鍵節(jié)點(diǎn),美格智能持續(xù)推動(dòng)側(cè)AI規(guī)?;卣?/a>

    當(dāng)前,AI模型走向側(cè)已經(jīng)是大勢(shì)所趨,側(cè)AI的發(fā)
    的頭像 發(fā)表于 11-26 01:00 ?452次閱讀
    把握關(guān)鍵節(jié)點(diǎn),美格智能持續(xù)推動(dòng)<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>規(guī)?;卣? />    </a>
</div>                            <div   id=

    把握關(guān)鍵節(jié)點(diǎn),美格智能持續(xù)推動(dòng)側(cè)AI規(guī)?;卣?/a>

    將成為和系統(tǒng)同樣重要的存在,如果說(shuō)電路是連接身體的“血管”,那么AI就將成為終端的智慧“大腦”。 ?加速演進(jìn),大模型加速走向側(cè) 從手機(jī)移動(dòng)
    的頭像 發(fā)表于 11-25 16:45 ?617次閱讀
    把握關(guān)鍵節(jié)點(diǎn),美格智能持續(xù)推動(dòng)<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>規(guī)?;卣? />    </a>
</div>                            <div   id=

    側(cè)AI浪潮已來(lái)!炬芯科技發(fā)布新側(cè)AI音頻芯片,比和AI算力大幅度提升

    側(cè)AI音頻芯片。 ? 2028 年中小型模型側(cè)
    的頭像 發(fā)表于 11-06 09:11 ?3504次閱讀
    <b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>浪潮已來(lái)!炬芯科技發(fā)布新<b class='flag-5'>一</b>代<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>音頻<b class='flag-5'>芯片</b>,<b class='flag-5'>能</b><b class='flag-5'>效</b>比和<b class='flag-5'>AI</b>算力大幅度提升

    后摩智能引領(lǐng)AI芯片革命,推出邊模型AI芯片M30

    在人工智能(AI)技術(shù)飛速發(fā)展的今天,AI模型的部署需求正迅速?gòu)脑贫讼?b class='flag-5'>端側(cè)和邊緣側(cè)設(shè)備遷移。這
    的頭像 發(fā)表于 06-28 15:13 ?938次閱讀