一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

為什么Chimera GPNPU如此充滿想象力和令人眼花繚亂呢

SSDFans ? 來(lái)源:SSDFans ? 2023-01-08 15:09 ? 次閱讀

希臘神話中,Chimera是一種巨大的噴火混血?jiǎng)游铮刹煌膭?dòng)物部位組成;現(xiàn)在它被用來(lái)描述任何想象力豐富、難以置信或令人眼花繚亂的東西。

筆者最近從Quadric那里接觸到Chimera GPNPU(通用神經(jīng)處理器),真是“產(chǎn)品”如其名。

Quadric公司成立于2017年,最初計(jì)劃基于其新創(chuàng)Chimera GPNPU架構(gòu)提供推理邊緣芯片 (針對(duì)物聯(lián)網(wǎng)“邊緣”推理應(yīng)用的芯片)。

他們的第一塊芯片被快速驗(yàn)證,一些早期用戶(hù)已經(jīng)在進(jìn)行試驗(yàn)。但最近,Quadric公司決定將Chimera GPNPU授權(quán)為IP,向更廣泛的客戶(hù)群體展示他們的技術(shù)。

下圖是利用Chimera GPNPU實(shí)現(xiàn)面部識(shí)別和認(rèn)證的簡(jiǎn)化示意圖,我們就以此作為切入點(diǎn)看下為什么Chimera GPNPU如此“充滿想象力”和“令人眼花繚亂”。

954d2626-8def-11ed-bfe3-dac502259ad0.png

假設(shè)所有這些功能都在智能相機(jī)SoC中實(shí)現(xiàn),一個(gè)攝像機(jī)/傳感器為左邊的第一個(gè)功能塊提供視頻流。這個(gè)應(yīng)用很可能會(huì)用于未來(lái)幾代的門(mén)鈴攝像頭中。

觀察兩個(gè)粉紅色的“Face Detect”和“Face Authentication”功能塊,它們是通過(guò)人工智能/機(jī)器學(xué)習(xí)(AI/ML)推理實(shí)現(xiàn)的。

在過(guò)去幾年中,這種類(lèi)型的推理發(fā)展極為迅速,從學(xué)術(shù)研究到早期部署,現(xiàn)在幾乎成為軟件開(kāi)發(fā)中的一個(gè)必不可少的元素。

將推理(基于視覺(jué)、聲音等形式)作為創(chuàng)建應(yīng)用程序的構(gòu)建塊之一,這種想法我們可以認(rèn)為是“軟件2.0”。

但這實(shí)現(xiàn)起來(lái)并不容易,SoC傳統(tǒng)應(yīng)對(duì)軟件2.0挑戰(zhàn)的方式如下(a)所示。

95576e88-8def-11ed-bfe3-dac502259ad0.png

從(a)圖中可以看到,神經(jīng)處理器單元(NPU)、矢量數(shù)字信號(hào)處理器(DSP)和實(shí)時(shí)中央處理器(CPU)為三個(gè)獨(dú)立的核心。

要實(shí)現(xiàn)前面的面部識(shí)別和認(rèn)證流程,使用常規(guī)方法,前兩個(gè)功能塊(Resize和Channel unpack)相關(guān)的處理將在DSP核心上執(zhí)行。

然后,DSP生成的數(shù)據(jù)將被送到NPU核心上運(yùn)行神經(jīng)網(wǎng)絡(luò)“Face Detect”模型;NPU的輸出再送給CPU核心,CPU將運(yùn)行一個(gè)“NMS”算法來(lái)決定使用哪個(gè)算法效果最好。

然后,DSP將使用CPU識(shí)別的邊界框在圖像上執(zhí)行更多的任務(wù),如“Crop + Gray Scale”和“Resize”。最后,這些數(shù)據(jù)將送到NPU核心上運(yùn)行“Face Authenticate”模型。

用上述方法實(shí)現(xiàn)后,我們可能會(huì)發(fā)現(xiàn)沒(méi)有達(dá)到想要的吞吐率。如何找出性能瓶頸在哪里?另外,三個(gè)核心之間交換數(shù)據(jù)產(chǎn)生了多少功耗?

真正的潛在問(wèn)題是,擁有三個(gè)獨(dú)立的處理器核心會(huì)使整個(gè)設(shè)計(jì)過(guò)程變得繁瑣。

例如,硬件設(shè)計(jì)人員必須決定要為每個(gè)核心分配多少內(nèi)存,以及在功能塊之間需要多大的緩沖區(qū)。同時(shí),軟件開(kāi)發(fā)人員需要決定如何在內(nèi)核之間劃分算法。這很痛苦,因?yàn)?a href="http://www.www27dydycom.cn/v/tag/1730/" target="_blank">程序員不愿意花大量時(shí)間考慮所運(yùn)行目標(biāo)平臺(tái)的硬件細(xì)節(jié)。

另一個(gè)問(wèn)題是ML模型正在迅速發(fā)展,誰(shuí)都不知道未來(lái)幾年會(huì)有怎樣的ML模型。

所有這些問(wèn)題都會(huì)導(dǎo)致ML部署無(wú)法盡可能快地加速,因?yàn)獒槍?duì)這種類(lèi)型的常規(guī)目標(biāo)平臺(tái)進(jìn)行開(kāi)發(fā),對(duì)于編程、調(diào)試和性能調(diào)優(yōu)等方面來(lái)說(shuō),都是一件非常痛苦的事情。

再回到Chimera GPNPU,它由前面圖(b)部分的粉色區(qū)域表示。

GPNPU將DSP、CPU和NPU的屬性結(jié)合在單個(gè)核心中,作為一個(gè)傳統(tǒng)的CPU/DSP的組合,它可以運(yùn)行C/ C++代碼,具有完整的32位標(biāo)量+向量指令集架構(gòu)(ISA),同時(shí)可以用作一個(gè)NN圖處理器,運(yùn)行8位推理優(yōu)化的ML代碼。這種方法通過(guò)在同一個(gè)引擎上運(yùn)行兩種類(lèi)型的代碼,獨(dú)特地解決了信號(hào)傳輸?shù)奶魬?zhàn)。

我們可以認(rèn)為Chimera GPNPU是經(jīng)典的馮·諾依曼RISC機(jī)和收縮陣列/2D矩陣架構(gòu)的混合體。

Chimera GPNPU的一個(gè)關(guān)鍵優(yōu)勢(shì)是它能夠適應(yīng)不斷發(fā)展和日益復(fù)雜的ML網(wǎng)絡(luò)?,F(xiàn)在東西變得越來(lái)越復(fù)雜,需要在NN的體系結(jié)構(gòu)中做更多的條件控制流,可以是CNN, RNN, DNN等等。

傳統(tǒng)的NPU通常是硬連接的加速器,不能條件執(zhí)行。例如有一個(gè)專(zhuān)用加速器,用戶(hù)不能在第14層的某個(gè)地方停下來(lái)檢查條件或中間結(jié)果,然后分支判斷并做各種面向控制流的事情。

在這些情況下,必須在NPU和CPU之間來(lái)回移動(dòng)數(shù)據(jù),這將對(duì)性能和功耗產(chǎn)生沖擊。而使用一個(gè)Chimera GPNPU,我們可以在NN和控制代碼之間在時(shí)鐘基礎(chǔ)上來(lái)回切換。

這里還有很多需要討論,比如Chimera GPNPU在執(zhí)行卷積層(這是CNN的核心)方面的出色表現(xiàn),以及它們的TOPS(每秒萬(wàn)億次操作)評(píng)分,都令筆者非常興奮。這里不再詳細(xì)闡述,有需要的讀者可以咨詢(xún)Quadric公司。

最后,筆者想快速概述一下Quadric軟件開(kāi)發(fā)工具包(SDK),如下所示。

95615308-8def-11ed-bfe3-dac502259ad0.png

歸根結(jié)底,一切都是由軟件驅(qū)動(dòng)的。使用TensorFlow、PyTorch、Caffe等框架生成的經(jīng)過(guò)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)圖/模型被送入Apache TVM(一個(gè)用于CPU、GPU和ML加速器的開(kāi)源機(jī)器學(xué)習(xí)編譯器框架),生成一個(gè)Relay輸出(Relay是TVM框架的高級(jí)中間表示)。

中繼表示的轉(zhuǎn)換和優(yōu)化由Chimera CGC執(zhí)行,它將轉(zhuǎn)換和優(yōu)化后的神經(jīng)網(wǎng)絡(luò)輸出為C++代碼。Chimera LLVM C++ Compiler將這些代碼與開(kāi)發(fā)人員的C++應(yīng)用程序代碼合并,所有這些輸出為一個(gè)可執(zhí)行文件,運(yùn)行在目標(biāo)硅/SoC中的Chimera GPNPU上。

注意,Quadric SDK是作為預(yù)打包的Docker映像交付的,用戶(hù)可以下載并在自己的系統(tǒng)上運(yùn)行。Quadric很快將把這個(gè)SDK托管在Amazon Web Services (AWS)上,從而允許用戶(hù)通過(guò)他們的Web瀏覽器訪問(wèn)它。

讓筆者特別感興趣的是,Quadric的工作人員正在開(kāi)發(fā)一個(gè)圖形用戶(hù)界面(GUI),它可以讓開(kāi)發(fā)人員拖放包含CPU/DSP代碼和NPU模型的管道構(gòu)建塊,將它們拼接在一起,并將所有內(nèi)容編譯成一個(gè)ChimeraGPNPU image。這種無(wú)代碼開(kāi)發(fā)方法將使大量開(kāi)發(fā)人員能夠創(chuàng)建含有Chimera GPNPU的芯片。






審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • SoC系統(tǒng)
    +關(guān)注

    關(guān)注

    0

    文章

    52

    瀏覽量

    10879
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8481

    瀏覽量

    133876
  • 數(shù)字信號(hào)處理器

    關(guān)注

    5

    文章

    475

    瀏覽量

    27686
  • NPU
    NPU
    +關(guān)注

    關(guān)注

    2

    文章

    315

    瀏覽量

    19379

原文標(biāo)題:結(jié)合CPU、DSP、NPU功能為一體的新型混合處理器——Chimera GPNPU

文章出處:【微信號(hào):SSDFans,微信公眾號(hào):SSDFans】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    支持智能家居設(shè)備的常見(jiàn)無(wú)線通信技術(shù)

    市面上已經(jīng)出現(xiàn)許多智能家居設(shè)備,隨著其價(jià)格越來(lái)越親民,產(chǎn)品的接受度也越來(lái)越高。但是,支持設(shè)備之間通信和設(shè)備與智能手機(jī)通信的各種無(wú)線技術(shù)則令人眼花繚亂。此類(lèi)技術(shù)采用的協(xié)議或標(biāo)準(zhǔn)形式,均各具特色
    的頭像 發(fā)表于 04-18 11:18 ?456次閱讀
    支持智能家居設(shè)備的常見(jiàn)無(wú)線通信技術(shù)

    索尼防眩大師商用顯示器在直播間的應(yīng)用優(yōu)勢(shì)

    作為直播間設(shè)計(jì)搭建的重要環(huán)節(jié),現(xiàn)有的直播背景墻方案可謂五花八門(mén),讓人眼花繚亂!我們特意請(qǐng)來(lái)了第一批索尼電影感直播認(rèn)證服務(wù)商“四川星門(mén)科技有限公司”的聯(lián)合創(chuàng)始人寶兒姐,準(zhǔn)備了這份直播背景墻指南,來(lái)為大家一一揭曉不同直播背景墻方案的優(yōu)缺點(diǎn)。
    的頭像 發(fā)表于 02-18 14:36 ?327次閱讀

    了解物聯(lián)網(wǎng)天線規(guī)格書(shū)中的細(xì)微差別

    可能會(huì)放棄,轉(zhuǎn)而使用其他產(chǎn)品。 許多設(shè)計(jì)人員面臨的問(wèn)題是,天線解決方案似乎多得讓人眼花繚亂,選擇過(guò)程令人望而生畏。那么,如何為你的設(shè)計(jì)縮小最佳天線的選擇范圍? 有些決定是比較容易做出的。首先,找到針對(duì)你設(shè)計(jì)的工作頻段進(jìn)行了優(yōu)化
    的頭像 發(fā)表于 01-25 17:50 ?739次閱讀
    了解物聯(lián)網(wǎng)天線規(guī)格書(shū)中的細(xì)微差別

    自動(dòng)駕駛宣傳鋪天蓋地,真實(shí)體驗(yàn)卻寡淡如水?

    自動(dòng)駕駛作為汽車(chē)行業(yè)的“第四次革命”,幾乎成了各大車(chē)企、科技公司和資本追逐的風(fēng)口。從令人眼花繚亂的宣傳標(biāo)語(yǔ),到高度刷屏的自動(dòng)駕駛廣告,這場(chǎng)以未來(lái)為藍(lán)圖的技術(shù)競(jìng)賽吸引了無(wú)數(shù)目光。但當(dāng)消費(fèi)者真正接觸到
    的頭像 發(fā)表于 12-29 13:45 ?774次閱讀

    AI在手機(jī)里結(jié)出了果

    讀懂眼花繚亂的AI手機(jī)
    的頭像 發(fā)表于 12-03 14:31 ?2691次閱讀
    AI在手機(jī)里結(jié)出了果

    《算芯片 高性能 CPUGPUNPU 微架構(gòu)分析》第3篇閱讀心得:GPU革命:從圖形引擎到AI加速器的蛻變

    CPU、GPU的演進(jìn)歷程,AI專(zhuān)用芯片或?qū)⒁I(lǐng)未來(lái)計(jì)算平臺(tái)的新方向。正如愛(ài)因斯坦所說(shuō):\"想象力比知識(shí)更重要\" —— 在芯片設(shè)計(jì)領(lǐng)域,創(chuàng)新思維帶來(lái)的突破往往令人驚嘆。
    發(fā)表于 11-24 17:12

    安富利攜手英飛凌推動(dòng)觸摸感應(yīng)技術(shù)創(chuàng)新

    將時(shí)間撥回至上個(gè)世紀(jì)40年代,觸控技術(shù)被首次提出,在當(dāng)時(shí)充滿了前衛(wèi)的想象力,而后在1965年,工程師埃里克·亞瑟·約翰遜(Eric Arthur Johnson)率先制造出了電容式觸摸屏,開(kāi)啟了觸控感應(yīng)的先河。我們現(xiàn)在使用的多數(shù)智能手機(jī)采用的電容式觸摸屏,其實(shí)就是以此發(fā)明
    的頭像 發(fā)表于 11-06 11:21 ?909次閱讀
    安富利攜手英飛凌推動(dòng)觸摸感應(yīng)技術(shù)創(chuàng)新

    智能家居中無(wú)線技術(shù)的比較

    智能家居設(shè)備日漸流行,定價(jià)也越來(lái)越親民。但是,支持設(shè)備與其通信、和設(shè)備與智能手機(jī)通信的各色無(wú)線技術(shù)令人眼花繚亂。此類(lèi)技術(shù)采用協(xié)議或標(biāo)準(zhǔn)形式,各具特色,各有利弊。Wi-Fi、Thread、Matter
    的頭像 發(fā)表于 11-05 13:58 ?920次閱讀
    智能家居中無(wú)線技術(shù)的比較

    工商業(yè)儲(chǔ)能選型指南及參數(shù)詳解

    行業(yè)普遍認(rèn)為2023年是工商儲(chǔ)元年。如今,工商儲(chǔ)賽道仍然持續(xù)升溫中,無(wú)數(shù)新玩家涌入。但令人眼花繚亂的選型配置成為不少玩家的第一道門(mén)檻,今天小固就手把手帶你進(jìn)行工商儲(chǔ)選型,為你進(jìn)行核心參數(shù)詳解。
    的頭像 發(fā)表于 08-05 14:52 ?4530次閱讀
    工商業(yè)儲(chǔ)能選型指南及參數(shù)詳解

    汽車(chē)?yán)走_(dá)向超級(jí)傳感器演化,打開(kāi)無(wú)限想象力

    作者:是德科技汽車(chē)和能源解決方案營(yíng)銷(xiāo)經(jīng)理 Hwee Yng Yeo ? 自動(dòng)駕駛技術(shù)就好比是訓(xùn)練自動(dòng)駕駛汽車(chē)(AV)像人類(lèi)一樣駕駛,甚至有希望比人類(lèi)駕駛得更好。正如人類(lèi)在駕駛汽車(chē)時(shí)需要依靠感官和認(rèn)知反應(yīng)一樣,傳感器技術(shù)也是實(shí)現(xiàn)自動(dòng)駕駛不可或缺的一部分。 在攝像頭、雷達(dá)和激光雷達(dá)這三種傳感器中,雷達(dá)在交通安全領(lǐng)域應(yīng)用的歷史可能最為悠久。最早用于保障交通安全的雷達(dá)專(zhuān)利技術(shù)之一被稱(chēng)為 Telemobiloscope(電動(dòng)鏡)。它是由德國(guó)發(fā)明家 Christia
    的頭像 發(fā)表于 07-30 20:27 ?1600次閱讀
    汽車(chē)?yán)走_(dá)向超級(jí)傳感器演化,打開(kāi)無(wú)限<b class='flag-5'>想象力</b>

    專(zhuān)注充電充滿想象,羅馬仕全球品牌升級(jí)打造全場(chǎng)景用電體驗(yàn)生態(tài)

    2024年7月19日,深圳羅馬仕科技有限公司(以下簡(jiǎn)稱(chēng)羅馬仕)召開(kāi)了“專(zhuān)注充電,充滿想象”為主題的全球品牌升級(jí)暨新品發(fā)布會(huì),重點(diǎn)詮釋羅馬仕全場(chǎng)景用電體驗(yàn)戰(zhàn)略方向。全場(chǎng)景用電體驗(yàn)戰(zhàn)略是羅馬仕多年來(lái)專(zhuān)注
    的頭像 發(fā)表于 07-21 10:15 ?843次閱讀
    專(zhuān)注充電<b class='flag-5'>充滿</b><b class='flag-5'>想象</b>,羅馬仕全球品牌升級(jí)打造全場(chǎng)景用電體驗(yàn)生態(tài)

    專(zhuān)注充電充滿想象,羅馬仕全球品牌升級(jí)打造全場(chǎng)景用電體驗(yàn)生態(tài)

    2024年7月19日,深圳羅馬仕科技有限公司(以下簡(jiǎn)稱(chēng)羅馬仕)召開(kāi)了“專(zhuān)注充電,充滿想象”為主題的全球品牌升級(jí)暨新品發(fā)布會(huì),重點(diǎn)詮釋羅馬仕全場(chǎng)景用電體驗(yàn)戰(zhàn)略方向。全場(chǎng)景用電體驗(yàn)戰(zhàn)略是羅馬仕多年來(lái)專(zhuān)注
    發(fā)表于 07-19 20:46 ?460次閱讀
    專(zhuān)注充電<b class='flag-5'>充滿</b><b class='flag-5'>想象</b>,羅馬仕全球品牌升級(jí)打造全場(chǎng)景用電體驗(yàn)生態(tài)

    眼花繚亂?數(shù)據(jù)采集卡接線端子原來(lái)是這樣接線的?#數(shù)據(jù)采集卡 #傳感器技術(shù) #通信 #plc #pcb設(shè)計(jì)

    傳感器PCB設(shè)計(jì)
    西安阿爾泰電子科技發(fā)展有限公司
    發(fā)布于 :2024年06月20日 15:51:48

    揭秘芯片算:為何它如此關(guān)鍵?

    在數(shù)字化時(shí)代,芯片作為電子設(shè)備的核心組件,其性能直接關(guān)系到設(shè)備的運(yùn)行速度和處理能力。而芯片的算,即其計(jì)算能力,更是衡量芯片性能的重要指標(biāo)。那么,芯片的算到底有什么用?算又是如何評(píng)估的
    的頭像 發(fā)表于 05-09 08:27 ?1696次閱讀
    揭秘芯片算<b class='flag-5'>力</b>:為何它<b class='flag-5'>如此</b>關(guān)鍵?

    未來(lái)的智慧園區(qū),充滿令人驚艷的場(chǎng)景

    未來(lái)的智慧園區(qū),充滿令人驚艷的場(chǎng)景。它將實(shí)現(xiàn)從能源管理到環(huán)境監(jiān)測(cè)的多重使命,用科技的力量為人類(lèi)打造宜居、綠色的工作生活空間。 首先,智慧園區(qū)的能源管理將進(jìn)入全新階段。通過(guò)智能化的能源管理系統(tǒng),實(shí)時(shí)
    的頭像 發(fā)表于 05-08 15:33 ?406次閱讀