一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

建立AI芯片新的衡量標準勢在必行

454398 ? 來源:機器之心 ? 作者:半導(dǎo)體觀察 ? 2020-10-28 12:06 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

因為人工智能的持續(xù)火熱,AI芯片在過去幾年里如雨后春筍般在全球各地冒出來。這就驅(qū)動行業(yè)去探索評估AI芯片性能的最優(yōu)方法。

就如傳統(tǒng)的芯片設(shè)計師追求PPA、CPU對比MIPS、GPU衡量Pixel和Texture一樣,一個好的評估方法能夠讓開發(fā)者可以針對場景進行設(shè)計,同時可以指導(dǎo)研發(fā)調(diào)整優(yōu)化防線,引導(dǎo)客戶進行正確選擇,同時能夠促進行業(yè)有序協(xié)同向前發(fā)展。

快速提升的AI算法和落后的衡量方法

地平線聯(lián)合創(chuàng)始人&技術(shù)副總裁黃暢在日前于深圳舉辦的2020全球人工智能和機器人峰會上指出,Intel聯(lián)合創(chuàng)始人戈登摩爾在1965年提出摩爾定律,這揭示信息技術(shù)進步速度的定律得到了充分的行業(yè)驗證。但進入最近幾年,半導(dǎo)體工藝已經(jīng)接近了尾聲。

“與此同時,AI對算力的要求大幅度增加,那就意味著如果我們?nèi)绻麅H靠半導(dǎo)體工藝的提升來滿足快速增長AI需求,那就變得不甚現(xiàn)實?!秉S暢說。為此大家都開始將目光投向計算效率。

以ImageNet為例,作為AI領(lǐng)域的奧林匹克競賽,它吸引了學(xué)術(shù)界和產(chǎn)業(yè)界的關(guān)注,而在過去的發(fā)展中,則分為三個階段:第一階段是通過算法專家精心設(shè)計網(wǎng)絡(luò)結(jié)構(gòu),不斷增加計算量提升ImageNet的精度;到了第二階段的ResNet,它的精度、計算量都有顯著提升;在后續(xù)幾年,來自谷歌等等各個領(lǐng)域的專家通過手工設(shè)計新的網(wǎng)絡(luò)結(jié)構(gòu),不斷地推動這個算法演進,使得我們可以以更低的計算量達到更高的精度。

“ 從2016年到2018年,我們發(fā)現(xiàn)在ImageNet上的精度基礎(chǔ)趨近飽和,精準度始終保持在80%的水平,精度發(fā)生飽和之后,大家開始關(guān)注計算的效率,越來越多的效率也得到了重視,并推出了非常多輕量級網(wǎng)絡(luò)”,黃暢補充說。“去年EfficientNet的推出更是震驚了長期關(guān)注ImageNet的所有的學(xué)術(shù)研究者”,黃暢強調(diào)。

他指出,EfficientNet的基準網(wǎng)絡(luò)和硬件無關(guān),它只關(guān)注計算量本身,也就是進行了多少次乘法或加法的運算,其中最小的網(wǎng)絡(luò)只有0.4G,并且還能自動化搜索網(wǎng)絡(luò)的所有結(jié)構(gòu)。此外,它還要搜索層次、圖像分別率,所帶來的的不僅是參數(shù)提升了,分辨率也同時提升了,有助于它提升圖像識別的精度。

然而回到人工智能的性能評估領(lǐng)域,從TFLOPS,到TOPS,再到近三年MLPerf的崛起,AI芯片依然沒能找到準確的衡量標準。以MLPerf為例,雖然這個評估標準給大家提供了一個展現(xiàn)AI芯片能力的平臺,但它依然面臨著幾方面的挑戰(zhàn),這與他們在測試前必須選定模型有關(guān)?!澳P透路浅B?,根本無法及時反應(yīng)整個算法效率的提升。而模型又非常少,也很難反映各個精度上速度全貌”,

由此可見,為AI芯片建立一個新的衡量標準勢在必行。

全新的芯片AI性能評估方式——MAPS

在黃暢看來,評估芯片的AI性能,可以從準、快、省這三個維度來看。其中“準”是反映實際需求任務(wù)上的算法精度,比如說圖像分類里面我們用Top-1或者Top-5的精度判斷它是不是準;“快”的方面,通常有延遲和吞吐率兩個維度,前者更側(cè)重于處理單個任務(wù)的最快反應(yīng)時間,后者應(yīng)用于你可以在服務(wù)器層面上用最大的處理方式處理它的吞吐率;“省”就是看它的成本和功耗。

“對于AI芯片的性能評估來講,準和快是兩個非常重要的因素”。黃暢強調(diào)。

基于此,地平線提出了新的芯片AI性能評估方式——MAPS,即MeanAccuracy-guaranteed processing speed(在精度有保障范圍內(nèi)的平均處理速度)。這個新方式的提出,是想在精度有保障的范圍測出芯片的平均效能表現(xiàn),并得到一個全面、完整、客觀和真實的評估。按照黃暢的說法,這個全新的評估方式對行業(yè)來說有六大創(chuàng)新之處:

第一,它可以可視化芯片的Benchmark,我們可以通過可視化的圖形更精確的表達;

第二,我們關(guān)注真實、面向結(jié)果的需求,只在乎精度和速度,不在乎中間任何關(guān)于算法的取舍和選擇;

第三,可以統(tǒng)一表示精度與速度,關(guān)注主流精度區(qū)間;

第四,隱藏與最終結(jié)果無關(guān)的中間變量,包括模型、輸入大小、批處理的量是多大;

第五,通過這種方法可以在算力之外幫助用戶理解這個芯片到底能跑多快以及多好,最終留有最大的空間引導(dǎo)客戶使用最優(yōu)的方式使用這顆芯片,指導(dǎo)客戶使用這個芯片的最佳實踐。

第六,有最大的空間引導(dǎo)客戶使用最優(yōu)的方式使用這顆芯片,作為指導(dǎo)客戶使用芯片最佳實踐的這一點非常重要。

作為 AI 領(lǐng)域的奧林匹克競賽,ImageNet 比賽產(chǎn)生了幾乎所有機器視覺中最重要的模型,它們在 ImageNet 上的精度可充分遷移到其他機器視覺任務(wù)(如物體檢測、語義分割等)。在 ImageNet 的主流精度范圍(75~80%)下,速度最快的模型所代表的點(由精度和幀率確定)所圍多邊形面積大小即為芯片處理ImageNet AI任務(wù)的能力大小,其公式為MAPS = 所圍面積 /(最高精度-最低精度)。在演講現(xiàn)場,黃暢還展示了MAPS評估方式在在ImageNet上的定義與主流芯片測試結(jié)果。

上圖為MAPS評估方式下主流芯片測試結(jié)果,右一折線為地平線最新一代芯片測試結(jié)果 “如果我們用MAPS,它是更能真實反映AI性能指標”,黃暢說。如下圖所示,這主要由三個要素組成:第一是TOP/Watt、TOPS/$這樣的指標,這是傳統(tǒng)的方式。等式右邊則是由理論峰值計算效能、有效利用率和AI算法效率構(gòu)成。

“我們希望有更多的軟件、算法工作者,在MAPS評估指導(dǎo)體系的啟發(fā)下,從自己最擅長的能力上持續(xù)推動AI芯片能力的發(fā)揮”,黃暢最后說。
編輯:hfy

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11077

    瀏覽量

    217024
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    49011

    瀏覽量

    249350
  • 半導(dǎo)體工藝
    +關(guān)注

    關(guān)注

    19

    文章

    107

    瀏覽量

    26667
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    1983

    瀏覽量

    35902
  • 算力
    +關(guān)注

    關(guān)注

    2

    文章

    1197

    瀏覽量

    15646
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    四大核心要素驅(qū)動汽車智能化創(chuàng)新與相關(guān)芯片競爭格局

    當下,功能安全、高效高靈活性的算力、產(chǎn)品生命周期,以及軟件生態(tài)兼容性這“四大核心要素”,已成為衡量智能汽車AI芯片創(chuàng)新力和市場競爭力的核心標準。
    的頭像 發(fā)表于 07-01 14:49 ?178次閱讀

    【「零基礎(chǔ)開發(fā)AI Agent」閱讀體驗】+讀《零基礎(chǔ)開發(fā)AI Agent》掌握扣子平臺開發(fā)智能體方法

    /, 在上面注冊一個賬號,并由快速開始進入開發(fā)操作空間,建立開發(fā)AI Agent的各開發(fā)要素進行定義,從而完成AI Agent的開發(fā)過程。 本書的多個例子也可以進行在這個平臺進行練習(xí)。 本書的缺陷就是由于項目
    發(fā)表于 05-14 19:51

    明晚開播 | 開源芯片系列講座第27期:RISC-V AI指令集的標準化與開源實現(xiàn)

    鷺島論壇開源芯片系列講座第27期「RISC-VAI指令集的標準化與開源實現(xiàn)」明晚(26日)21:00精彩開播期待與您云相聚,共襄學(xué)術(shù)盛宴!|直播信息報告題目RISC-VAI指令集的標準化與開源實現(xiàn)
    的頭像 發(fā)表于 03-25 08:12 ?308次閱讀
    明晚開播 | 開源<b class='flag-5'>芯片</b>系列講座第27期:RISC-V <b class='flag-5'>AI</b>指令集的<b class='flag-5'>標準</b>化與開源實現(xiàn)

    直播預(yù)約 | 開源芯片系列講座第27期:RISC-V AI指令集的標準化與開源實現(xiàn)

    鷺島論壇開源芯片系列講座第27期「RISC-VAI指令集的標準化與開源實現(xiàn)」3月26日(周三)21:00精彩開播期待與您云相聚,共襄學(xué)術(shù)盛宴!|直播信息報告題目RISC-VAI指令集的標準化與開源
    的頭像 發(fā)表于 03-10 17:55 ?655次閱讀
    直播預(yù)約 | 開源<b class='flag-5'>芯片</b>系列講座第27期:RISC-V <b class='flag-5'>AI</b>指令集的<b class='flag-5'>標準</b>化與開源實現(xiàn)

    EVASH芯片公司接入DeepSeek:AI驅(qū)動的芯片設(shè)計革新

    EVASH芯片公司接入DeepSeek:AI驅(qū)動的芯片設(shè)計革新
    的頭像 發(fā)表于 03-03 17:45 ?458次閱讀

    AI芯片上的應(yīng)用:革新設(shè)計與功能

    AI芯片上的應(yīng)用正在深刻改變著芯片設(shè)計、制造和應(yīng)用的全過程。未來,隨著AI技術(shù)的不斷進步和應(yīng)用場景的不斷拓展,AI
    的頭像 發(fā)表于 02-17 16:09 ?563次閱讀

    deepseek國產(chǎn)芯片加速 DeepSeek的國產(chǎn)AI芯片天團

    ,從而紛紛繼續(xù)“卷”起來,效仿DeepSeek的“開源”模式。 對于DeepSeek本身,人們關(guān)注其如何在有限算力實現(xiàn)強大性能,更關(guān)注其在重重條令圍城之下的未來之路。而在最近,全世界的芯片廠商集體出動,紛紛宣布支持DeepSeek。尤其是眾多國產(chǎn)AI
    的頭像 發(fā)表于 02-10 15:07 ?3813次閱讀
    deepseek國產(chǎn)<b class='flag-5'>芯片</b>加速 DeepSeek的國產(chǎn)<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>天團

    算智算中心的算力如何衡量?

    (ComputationalPower)是指智算中心通過其內(nèi)部的計算設(shè)備(如CPU、GPU、AI芯片等)對數(shù)據(jù)進行處理和計算的能力。它體現(xiàn)了智算中心在單位時間內(nèi)能夠完成的計算任務(wù)量,
    的頭像 發(fā)表于 01-16 14:03 ?2462次閱讀
    算智算中心的算力如何<b class='flag-5'>衡量</b>?

    進迭時空 K1 系列 8 核 64 位 RISC - V AI CPU 芯片介紹

    和 2.0TOPS 原生 AI 算力。單核 CPU 算力是 ARM A55 的 130% 以上。應(yīng)用領(lǐng)域 :適用于需要高性能計算的場景,如工業(yè)控制和邊緣計算等領(lǐng)域。(二)強大的向量算力技術(shù)標準 :支持 RVA22
    發(fā)表于 01-06 17:37

    DAC80004的轉(zhuǎn)換速率是不是用setting time這個參數(shù)來衡量

    DAC的轉(zhuǎn)換速率是不是用setting time這個參數(shù)來衡量?如果建立時間是1us,是不是表示轉(zhuǎn)換速率是1Msps,我看到DAC80004的setting time是5.8us,在產(chǎn)品選型的時候
    發(fā)表于 12-31 08:00

    編碼器刻線數(shù)與精度數(shù)的關(guān)系

    編碼器刻線數(shù)與精度數(shù)的關(guān)系!精度數(shù)的衡量標準:精度數(shù)的衡量標準通常包括分辨率、重復(fù)性和準確性等。分辨率是指編碼器能夠檢測到的最小位置變化;重復(fù)性是指在相同條件下多次測量時結(jié)果的一致性;準確性則是指
    的頭像 發(fā)表于 12-18 10:41 ?738次閱讀
    編碼器刻線數(shù)與精度數(shù)的關(guān)系

    AI芯片的混合精度計算與靈活可擴展

    、NPU、DSP等。 ? 而無論是哪種架構(gòu),如何判斷其性能優(yōu)劣都至關(guān)重要,而這就涉及到AI芯片的各項性能指標,如算力、能效、時延等。其中AI芯片的算力精度是
    的頭像 發(fā)表于 08-23 00:08 ?5909次閱讀

    衡量運算放大器的速度用的是SR壓擺率,衡量比較器的速度在datasheet上一般用什么參數(shù)?

    衡量運算放大器的速度用的是SR壓擺率,那么衡量比較器的速度在datasheet上一般用什么參數(shù)。怎么去看這個參數(shù)?
    發(fā)表于 08-22 08:26

    功放芯片中說的失真10%在實際應(yīng)用中怎么衡量?

    功放芯片中說的失真10%在實際應(yīng)用中怎么衡量
    發(fā)表于 08-14 06:03

    平衡創(chuàng)新與倫理:AI時代的隱私保護和算法公平

    ,企業(yè)和組織應(yīng)明確告知用戶他們的數(shù)據(jù)如何被收集和使用,并提供選擇退出的選項,這是尊重和保護個人隱私權(quán)的基本要求。 跨國界的合作對于建立全球統(tǒng)一的AI倫理標準至關(guān)重要。不同國家和地區(qū)在AI
    發(fā)表于 07-16 15:07