一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

通過Transformer架構(gòu)賦能新一代邊緣AI應(yīng)用

Arm社區(qū) ? 來源:Arm社區(qū) ? 2024-04-08 10:45 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人工智能 (AI) 和機器學(xué)習(xí) (ML) 的加速發(fā)展既得益于基礎(chǔ)硬件的不斷改進,也離不開軟件領(lǐng)域的發(fā)展成果。

以 Transformer 架構(gòu)為例。2017 年,谷歌在一篇研究論文中[1]首次提出這一架構(gòu),它采用自注意力機制 (self-attention),使模型能夠在進行預(yù)測時對不同的輸入詞元 (token) 賦予不同權(quán)重。利用自注意力機制,Transformer 模型能夠捕捉數(shù)據(jù)中的遠程依賴關(guān)系,因此在執(zhí)行語言翻譯、圖像處理、文本生成和情感分析等任務(wù)時非常高效。例如,生成式預(yù)訓(xùn)練模型 (GPT) 就是當(dāng)前流行訓(xùn)練有素的 Transformer 模型。這些模型已經(jīng)在語音助手和 AI 圖像生成工具中得到應(yīng)用。

這之于感知器 (perceptron) 還是存在很大的差別。感知器是早期的一種神經(jīng)網(wǎng)絡(luò),由單層人工神經(jīng)元組成,可在模式識別任務(wù)(例如,識別手寫數(shù)字)中做出二元決策。相較于卷積神經(jīng)網(wǎng)絡(luò) (CNN),Transformer 架構(gòu)已開始受到更多青睞。CNN 對數(shù)據(jù)架構(gòu)方式會進行內(nèi)置假設(shè),它關(guān)注附近的關(guān)系,以及觀察圖像或視頻中的對象移動或變化方式。

而 Transformer 架構(gòu)則不會做出這些假設(shè)。相反地,它利用自注意力來理解序列的不同部分如何相互關(guān)聯(lián),而忽略其位置信息。得益于這種靈活性,基于 Transformer 的模型能夠更加輕松地適應(yīng)不同的任務(wù)。

這是如何實現(xiàn)的?Transformer 架構(gòu)及其采用的注意力機制徹底改變了 AI 應(yīng)用的格局,因為注意力機制具備的相關(guān)功能可以為諸多用例提供支持。文本(及語言)本身就是編碼信息,圖像、音頻以及其他形式的串行數(shù)據(jù)同樣如此。由于編碼信息可以解讀為一種語言,因此 Transformer 模型可以廣泛應(yīng)用于不同的用例中。這種適應(yīng)性對于理解視頻、填充圖像的缺失部分或同時分析來自多個攝像頭的數(shù)據(jù)或多模態(tài)數(shù)據(jù)來源(參見下文示例)等任務(wù)非常有效。

2020 年問世的 Vision Transformer (ViT) 是將 Transformer 架構(gòu)成功應(yīng)用于圖像分類的最早一批神經(jīng)網(wǎng)絡(luò)技術(shù)[2]之一。ViT 將圖像劃分為多個圖塊,并使用自注意力機制對這些圖塊之間的交互進行建模。

自此,Transformer 模型被迅速應(yīng)用于各類視覺任務(wù)中,例如:

圖像分類

目標(biāo)檢測

語義分割

圖像超分辨率

圖像生成

視頻分類

在硬件上優(yōu)化模型

那么,硬件與這一切有什么關(guān)系呢?關(guān)系相當(dāng)密切!而且硬件將是未來發(fā)展的關(guān)鍵因素。

GPU、TPU 或 NPU(甚至 CPU)都可以處理 Transformer 模型所需的密集矩陣運算和并行計算。同時,Transformer 架構(gòu)可使更復(fù)雜的模型運行于資源更為受限的邊緣設(shè)備上。

主要有以下三個原因:

與 CNN 或循環(huán)神經(jīng)網(wǎng)絡(luò) (RNN) 相比,Transformer 架構(gòu)從本質(zhì)上而言更具可并行性。這一特性能更有效地利用硬件,從而可以在計算資源受限的邊緣設(shè)備上部署基于 Transformer 的模型。

自注意力機制意味著通過較小的 Transformer 模型所帶來的性能表現(xiàn),可以媲美基于 CNN 或 RNN 的較大模型,從而降低邊緣部署的算力與內(nèi)存需求。

模型壓縮技術(shù)(例如剪枝、量化、知識提煉和注意力稀疏)的提升可進一步縮小 Transformer 模型的大小,同時又不會造成性能或準(zhǔn)確性的明顯下降。

Transformer 架構(gòu)提升

現(xiàn)在,不妨想象一下功能更強大的計算資源,畢竟這一切并不遙遠。通過優(yōu)化支持 Transformer 架構(gòu)的硬件,創(chuàng)新者可充分發(fā)掘這些強大神經(jīng)網(wǎng)絡(luò)的全部潛力,并為跨不同領(lǐng)域和模式的 AI 應(yīng)用帶來全新的可能性。

例如,硬件性能和效率的提升可以:

加快 Transformer 模型的推理速度,從而提高響應(yīng)能力,并改善用戶體驗。

部署更大的 Transformer 模型,從而在語言翻譯、文本生成和圖像處理等任務(wù)中獲得更佳表現(xiàn)。

提高在一系列應(yīng)用和部署場景中的邊緣設(shè)備、云服務(wù)器或?qū)S?AI 加速器中部署 Transformer 解決方案的可擴展性。

探索全新架構(gòu),并不斷優(yōu)化 Transformer 模型。這其中包括嘗試不同的層配置、注意力機制和正則化技術(shù),以進一步提高模型的性能和效率。

顯著提高能效,鑒于某些模型的規(guī)模增長,這一點至關(guān)重要。

試想一下,當(dāng)你打開手機智能眼鏡上[3]的某個視覺應(yīng)用,它可以識別某個款式的襯衫,并從你的衣柜中推薦與之搭配的下半身穿著。或者由于算力提升而出現(xiàn)的新的圖像生成功能[4]。

增加計算資源并不困難。集成子系統(tǒng)可提供經(jīng)過驗證的各種處理單元塊,包括 CPU、NPU、互連、內(nèi)存和其他組件。而軟件工具可以根據(jù)處理器來優(yōu)化 Transformer 模型,以獲得性能和效率的最大化。

擁抱未來

通過硬件優(yōu)化,Transformer 模型架構(gòu)有望推動一些令人驚嘆的新應(yīng)用。借助優(yōu)化的硬件配置以及集成子系統(tǒng)、互連和軟件開發(fā),無論是更快的推理速度,為更大的模型提供更好的性能,還是更出色的可擴展性等等,這一切都將成為可能。這條通往創(chuàng)新和探索的全新旅程,正在蓬勃發(fā)展,引領(lǐng)我們走向更遠的未來。



審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4814

    瀏覽量

    103608
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    49018

    瀏覽量

    249468
  • 機器學(xué)習(xí)
    +關(guān)注

    關(guān)注

    66

    文章

    8503

    瀏覽量

    134610
  • AI加速器
    +關(guān)注

    關(guān)注

    1

    文章

    70

    瀏覽量

    9091

原文標(biāo)題:大咖觀點 | 通過 Transformer 架構(gòu)賦能新一代邊緣 AI 應(yīng)用

文章出處:【微信號:Arm社區(qū),微信公眾號:Arm社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    谷歌新一代生成式AI媒體模型登陸Vertex AI平臺

    我們在 Vertex AI 上推出新一代生成式 AI 媒體模型: Imagen 4、Veo 3 和 Lyria 2。
    的頭像 發(fā)表于 06-18 09:56 ?375次閱讀

    廣和通發(fā)布新一代AI語音智能體FiboVista

    近日,2025火山引擎Force原動力大會正式開幕。廣和通發(fā)布新一代AI語音智能體FiboVista,并已率先應(yīng)用于車聯(lián)網(wǎng),成為智能駕駛的“用車伙伴”和“出行伴侶”。通過創(chuàng)新AI大模型
    的頭像 發(fā)表于 06-17 09:22 ?561次閱讀

    芯原可擴展的高性能GPGPU-AI計算IP汽車與邊緣服務(wù)器AI解決方案

    芯原股份 (芯原,股票代碼:688521.SH) 日前宣布其 高性能、可擴展的GPGPU-AI計算IP的最新進展,這些IP現(xiàn)已為新一代汽車電子和邊緣服務(wù)器應(yīng)用提供強勁
    的頭像 發(fā)表于 06-16 10:44 ?731次閱讀

    Transformer架構(gòu)概述

    由于Transformer模型的出現(xiàn)和快速發(fā)展,深度學(xué)習(xí)領(lǐng)域正在經(jīng)歷場翻天覆地的變化。這些突破性的架構(gòu)不僅重新定義了自然語言處理(NLP)的標(biāo)準(zhǔn),而且拓寬了視野,徹底改變了AI的許多
    的頭像 發(fā)表于 06-10 14:24 ?344次閱讀
    <b class='flag-5'>Transformer</b><b class='flag-5'>架構(gòu)</b>概述

    RAKsmart服務(wù)器如何AI開發(fā)與部署

    AI開發(fā)與部署的復(fù)雜性不僅體現(xiàn)在算法設(shè)計層面,更依賴于底層基礎(chǔ)設(shè)施的支撐能力。RAKsmart服務(wù)器憑借其高性能硬件架構(gòu)、靈活的資源調(diào)度能力以及面向AI場景的深度優(yōu)化,正在成為企業(yè)突破算力瓶頸、加速
    的頭像 發(fā)表于 04-30 09:22 ?267次閱讀

    美格智能攜手高通啟動2025邊緣智能創(chuàng)新應(yīng)用大賽,端側(cè)AI革命

    前言:隨著5G-A與AIoT技術(shù)深度融合,邊緣智能正成為工業(yè)4.0、智慧城市、自動駕駛等領(lǐng)域的核心引擎。美格智能多年來與高通公司持續(xù)深入合作,搭載高通平臺的高算力模組已AR眼鏡、無人機、智能座艙
    的頭像 發(fā)表于 04-26 09:03 ?414次閱讀
    美格智能攜手高通啟動2025<b class='flag-5'>邊緣</b>智能創(chuàng)新應(yīng)用大賽,<b class='flag-5'>賦</b><b class='flag-5'>能</b>端側(cè)<b class='flag-5'>AI</b>革命

    芯原推出新一代集成AI的ISP9000圖像信號處理器,智能視覺應(yīng)用

    芯原股份今日發(fā)布其ISP9000系列圖像信號處理器(ISP)IP——面向日益增長的智能視覺應(yīng)用需求而打造的新一代AI ISP解決方案。ISP9000采用靈活的AI優(yōu)化架構(gòu),提供卓越的圖
    的頭像 發(fā)表于 04-02 10:43 ?382次閱讀

    寶馬發(fā)布全新一代智能電子電氣架構(gòu)

    "超級大腦"寶馬新世代車型智能駕駛樂趣 全新一代電子電氣架構(gòu)搭載新世代車型,覆蓋全動力系統(tǒng)和全細分車型 全新一代電子電氣
    的頭像 發(fā)表于 03-13 15:42 ?311次閱讀

    華為發(fā)布新一代站點能源架構(gòu)AI數(shù)據(jù)中心建設(shè)理念

    西班牙巴塞羅那2025年3月13日?/美通社/ -- 在MWC25巴塞羅那期間舉辦的產(chǎn)品與解決方案發(fā)布會上,華為數(shù)據(jù)中心能源及關(guān)鍵供電產(chǎn)品線總裁何波發(fā)布新一代站點能源架構(gòu)"Single
    的頭像 發(fā)表于 03-13 15:38 ?296次閱讀
    華為發(fā)布<b class='flag-5'>新一代</b>站點能源<b class='flag-5'>架構(gòu)</b>及<b class='flag-5'>AI</b>數(shù)據(jù)中心建設(shè)理念

    Arm 推出 Armv9 邊緣 AI 計算平臺,以超高能效與先進 AI 能力物聯(lián)網(wǎng)革新

    架構(gòu)的超高能效 CPU——Arm Cortex-A320 以及對 Transformer 網(wǎng)絡(luò)具有原生支持的 Ethos-U85 AI 加速器為核心的邊緣
    的頭像 發(fā)表于 03-06 11:43 ?1327次閱讀
    Arm 推出 Armv9 <b class='flag-5'>邊緣</b> <b class='flag-5'>AI</b> 計算平臺,以超高能效與先進 <b class='flag-5'>AI</b> 能力<b class='flag-5'>賦</b><b class='flag-5'>能</b>物聯(lián)網(wǎng)革新

    華為發(fā)布新一代站點能源架構(gòu)AI數(shù)據(jù)中心建設(shè)原則

    在MWC25巴塞羅那期間舉辦的產(chǎn)品與解決方案發(fā)布會上,華為數(shù)據(jù)中心能源及關(guān)鍵供電產(chǎn)品線總裁何波發(fā)布新一代站點能源架構(gòu)“Single SitePower”及AI數(shù)據(jù)中心建設(shè)原則RASTM,旨在加速運營商成為能源產(chǎn)消者,打造更優(yōu)IC
    的頭像 發(fā)表于 03-06 11:16 ?598次閱讀

    AI邊緣網(wǎng)關(guān):開啟智能時代的新藍海

    。這變革不僅帶來了技術(shù)架構(gòu)的革新,更為產(chǎn)業(yè)發(fā)展開辟了新的增長空間。 傳統(tǒng)邊緣網(wǎng)關(guān)受限于計算能力和算法支持,往往只能完成數(shù)據(jù)采集和簡單處理,大量原始數(shù)據(jù)需要回傳云端處理,導(dǎo)致響應(yīng)延遲和帶寬壓力。
    發(fā)表于 02-15 11:41

    德州儀器發(fā)布新一代汽車芯片,邊緣AI與音頻體驗

    尤為引人注目。這款傳感器通過單個芯片即可運行邊緣AI算法,實現(xiàn)占用檢測、車內(nèi)兒童檢測和入侵檢測等多重功能,為駕乘人員營造了個更加安全的駕駛環(huán)境。其精準(zhǔn)的檢測能力和高效的算法運行,無疑
    的頭像 發(fā)表于 01-13 11:34 ?1018次閱讀

    芯原發(fā)布新一代Vitality架構(gòu)GPU IP系列

    芯原股份近日宣布,正式推出全新Vitality架構(gòu)的圖形處理器(GPU)IP系列。這一新一代GPU架構(gòu)以其卓越的計算性能和廣泛的應(yīng)用領(lǐng)域,吸引了業(yè)界的廣泛關(guān)注。 Vitality GPU架構(gòu)
    的頭像 發(fā)表于 12-24 10:55 ?925次閱讀

    螞蟻數(shù)科發(fā)布AI新一代數(shù)據(jù)標(biāo)注產(chǎn)品

    在近日舉行的2024 Incluison·外灘大會上,螞蟻數(shù)科憑借其技術(shù)創(chuàng)新的深厚底蘊,正式推出了新一代AI數(shù)據(jù)標(biāo)注產(chǎn)品,旨在為企業(yè)客戶提供全方位、智能化的數(shù)據(jù)解決方案。這款產(chǎn)品的問世,標(biāo)志著螞蟻數(shù)科在AI數(shù)據(jù)服務(wù)領(lǐng)域邁出了堅實
    的頭像 發(fā)表于 09-10 16:04 ?876次閱讀