一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

美國正在開發(fā)用于圖處理的下一代ASIC

我快閉嘴 ? 來源:半導體行業(yè)觀察 ? 作者:David Schor ? 2020-09-28 15:52 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

現(xiàn)代微處理器通常能夠通過分層緩存來隱藏計算與內存之間的大部分差距。這是因為許多負載表現(xiàn)出相對可預測的一般內存模式,可以通過空間局部性和時間局部性加以利用。有些負載還尷尬地并行。例如,人工智能負載往往表現(xiàn)出這種行為。只要你持續(xù)為機器提供數(shù)據(jù),更多計算就相當于更高性能。人工智能負載往往具有非常可預測的內存模式以及較高的數(shù)據(jù)重新利用能力,這有助于實現(xiàn)上述所有目標。

不幸的是,并非所有算法都具有這些理想的特性。圖就是這樣一個例子。企業(yè)廣泛地使用圖來處理大數(shù)據(jù)。這些數(shù)據(jù)結構往往有上萬億個邊緣,并采用特殊的圖算法對數(shù)據(jù)進行操作。圖算法采用非常隨機的內存訪問模式,導致負載受到內存延遲的高度限制,迫使計算元素在很多時候陷入停滯。它本質上是一個非常大的指針追逐問題,表現(xiàn)出與運行在GPUCPU上的大多數(shù)負載相矛盾的行為。

更糟的是,圖算法往往具有非常差的次線性縮放特性。你根本無法通過投入更多處理器來解決這個問題。由于數(shù)據(jù)的稀疏性和不規(guī)則性,下一個數(shù)據(jù)訪問通常是在一個完全不同的節(jié)點上,傳輸數(shù)據(jù)最終會導致整個系統(tǒng)出現(xiàn)瓶頸。

美國國防部分層識別驗證及利用計劃(DARPA HIVE)

分層識別驗證及利用(HIVE)計劃是美國國防部正在開展的一項計劃,目標是解決這些缺點。HIVE采用軟硬件雙管齊下的方式。針對該計劃的硬件部分,正在開發(fā)用于圖處理的下一代ASIC。針對軟件部分,正在開發(fā)一個新的全棧圖框架。美國國防部希望通過專門的圖處理器和優(yōu)化的軟件棧,實現(xiàn)比當前同類最佳的GPU高1000倍的性能效率。

在上個月底舉行的DARPA ERI峰會上,Peter Wang介紹了該項目的最新進展。Wang是Anaconda公司的聯(lián)合創(chuàng)始人兼首席技術官。他也是HIVE軟件架構的首席研究員。

介紹英特爾PUMA團隊

英特爾負責HIVE的硬件架構部分,他們正在開發(fā)一個新的架構來解決這些問題。在英特爾的數(shù)據(jù)中心事業(yè)部內部有一個名為PUMA的秘密團隊。他們負責圖分析(GA)處理器的開發(fā)。這是他們正在秘密開發(fā)的一個完整產品,英特爾打算最終將其商業(yè)化。

新的圖處理器基于一種新開發(fā)的架構,被稱為可編程統(tǒng)一內存架構或PUMA。這是一種新的架構,用于整個全局統(tǒng)一內存空間的小型不規(guī)則內存訪問。在這種架構下,芯片放棄了現(xiàn)代CPU和GPU所使用的許多基本假設——它并不假設自己擁有附近所有內存,它并不假設內存訪問會在不久的將來重復執(zhí)行,它也不假設對特定地址的內存訪問意味著附近的內存地址也將被訪問。Wong說:“通過拋棄這些基本假設,你可以圍繞對全局統(tǒng)一數(shù)據(jù)的小訪問而構建一個完全不同的硬件架構。然后,在每個階段,每當有一個有線互聯(lián)或者任何把一個計算單元連接到其它一些數(shù)據(jù)單元或其它計算單元的東西,每一個點都針對延遲進了優(yōu)化?!?PUMA從根本上改變了與內存訪問相關的行為,使內存訪問更小、更有效,并使訪問這些內存的延遲更長,但在整個系統(tǒng)中實現(xiàn)扁平化。

PUMA實現(xiàn)機箱級完全集成,可以跨處理元件和內存進行良好的通信。它旨在擴展到大型系統(tǒng),在多個機架和多個集群上使用。

Wang根據(jù)英特爾的內部模擬結果給出了一些初步性能數(shù)據(jù)。他說:“節(jié)點縮放確實是一個關鍵問題。當我們討論上萬億個邊緣的時候,我們知道這些數(shù)字會變得更大?!睘榇?,Wang報告了超過80%的縮放效率。他補充道:“這實際上讓我們能夠并行化解決圖問題的方法?!?/p>

軟件基礎設施

HIVE的第二階段是構建軟件基礎設施。新軟件不僅必須與新硬件兼容,而且必須與現(xiàn)有CPU和GPU兼容。此外,新軟件必須支持數(shù)據(jù)科學屆使用的大量現(xiàn)有軟件?,F(xiàn)有的大量軟件都是為了以某種方式解決特定的圖問題而開發(fā)的。該計劃的部分目標是能夠將現(xiàn)有的軟件和庫連接到HIVE軟件框架中,以便使其更易于投入使用。

當前的軟件包括通過API公開的算法、數(shù)據(jù)的內部圖表示以及硬件后端(GPU、CPU、FPGA或ASIC)。Wang解釋說,在當前平臺下,必須做出重大取舍,無論是針對某種類型的硬件進行優(yōu)化還是針對某些算法進行優(yōu)化。Wang說: “如果你專門從事圖表示,那么你就會與數(shù)據(jù)科學生態(tài)系統(tǒng)脫節(jié),因為你被切斷了與一些重要庫的聯(lián)系?!?/p>

作為HIVE第二階段一部分,他們正在開發(fā)模塊化架構框架?,F(xiàn)有軟件正在重新納入它們的組成部分,以便可以根據(jù)該軟件最佳功能將其插入到框架中。該結構包括Workflow Scheduler和Dispatch Engine,用于把User API負載任務路由到后端。他們利用DASK任務調度程序來執(zhí)行此操作。這也是他們進行后端切換和調度的方式。順便說一句,值得注意的是,雖然他們正在與英特爾密切合作,共同開發(fā)這個框架,以便能夠通過PUMA架構實現(xiàn)其性能目標,但是軟件框架并不是專門為PUMA設計的。事實上,它們完全針對廣泛的硬件,以便數(shù)據(jù)科學家立即能夠跨越CPU、GPU和FPGA,充分利用相同的軟件基礎設施。并最終使用相同的基礎架構,利用PUMA圖處理器來加速相同的負載。

值得一提的是,如果有必要,在后端,框架可包含一組能夠轉換不同格式數(shù)據(jù)的轉換器

這種設計有兩大好處——集成新硬件意味著設計了一個新的硬件后端,如果數(shù)據(jù)模型與現(xiàn)有模型不同,則添加對數(shù)據(jù)模型的支持,并添加一個可以從現(xiàn)有數(shù)據(jù)模型轉換到新數(shù)據(jù)模型的轉換器。同樣,集成一個新的User API只需要在其中一個硬件上添加一個接口并至少采用一種算法。

最終,HIVE的總體目標就是統(tǒng)一和簡化“讓圖軟件與硬件進行優(yōu)化通信的”流程,只需讓硬件廠商提供其硬件并為其集成一個良好的后端,同時讓數(shù)據(jù)科學家能夠通過自己的API和算法來充分利用該硬件。

Wang透露,從明年開始,用戶有望看到開源的初始源代碼。
責任編輯:tzh

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1645

    文章

    22050

    瀏覽量

    618570
  • asic
    +關注

    關注

    34

    文章

    1247

    瀏覽量

    122409
  • cpu
    cpu
    +關注

    關注

    68

    文章

    11080

    瀏覽量

    217114
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4948

    瀏覽量

    131254
  • 微處理器
    +關注

    關注

    11

    文章

    2383

    瀏覽量

    84191
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    下一代高速芯片晶體管解制造問題解決了!

    ,10埃)開始直使用到A7。 從這些外壁叉片晶體管的量產中獲得的知識可能有助于下一代互補場效應晶體管(CFET)的生產。 目前,領先的芯片制造商——英特爾、臺積電和三星——正在利用
    發(fā)表于 06-20 10:40

    下一代PX5 RTOS具有哪些優(yōu)勢

    許多古老的RTOS設計至今仍在使用,包括Zephyr(1980年)、Nucleus(1990年)和FreeRTOS(2003年)。所有這些舊設計都有專有的API,通常更大、更慢,并且缺乏下一代RTOS的必要安全認證和功能。
    的頭像 發(fā)表于 06-19 15:06 ?448次閱讀

    中國下一代半導體研究超越美國

    美國機構分析,認為中國在支持下一代計算機的基礎研究方面處于領先地位。如果這些研究商業(yè)化,有人擔心美國為保持其在半導體設計和生產方面的優(yōu)勢而實施的出口管制可能會失效。 喬治城大學新興技術觀察站(ETO
    的頭像 發(fā)表于 03-06 17:12 ?447次閱讀

    百度李彥宏談訓練下一代大模型

    “我們仍需對芯片、數(shù)據(jù)中心和云基礎設施持續(xù)投入,以打造更好、更智能的下一代模型?!?/div>
    的頭像 發(fā)表于 02-12 10:38 ?474次閱讀

    使用下一代GaNFast和GeneSiC Power實現(xiàn)電氣化我們的世界

    電子發(fā)燒友網站提供《使用下一代GaNFast和GeneSiC Power實現(xiàn)電氣化我們的世界.pdf》資料免費下載
    發(fā)表于 01-22 14:51 ?0次下載
    使用<b class='flag-5'>下一代</b>GaNFast和GeneSiC Power實現(xiàn)電氣化我們的世界

    AGC Inc:玻璃基板正在美國和中國客戶提供樣品

    來源:未來半導體 根據(jù)供應鏈反饋,總部位于東京的全球領先玻璃、化學品和其他高科技材料制造商 AGC Inc.,提供玻璃基板的下一代AI芯片垂直互聯(lián)方案以及滿足CPO用途的光學部件,目前正在美國
    的頭像 發(fā)表于 12-13 11:31 ?1002次閱讀
    AGC Inc:玻璃基板<b class='flag-5'>正在</b>向<b class='flag-5'>美國</b>和中國客戶提供樣品

    意法半導體下一代汽車微控制器的戰(zhàn)略部署

    ???????? 意法半導體致力于幫助汽車行業(yè)應對電氣化和數(shù)字化的挑戰(zhàn),不僅提供現(xiàn)階段所需的解決方案,未來還提供更強大的統(tǒng)的MCU平臺開發(fā)戰(zhàn)略,通過突破性創(chuàng)新支持下一代車輛架構和軟件定義
    的頭像 發(fā)表于 11-07 14:09 ?889次閱讀

    現(xiàn)代汽車招募專家以加速推進下一代全固態(tài)電池開發(fā)

     據(jù) KoreaTimes 報道,現(xiàn)代汽車正積極招募電池研究領域的專家,旨在加速推進其下一代全固態(tài)電池的開發(fā)工作,以進步推動電動汽車的普及。申請這些研究職位的窗口自10月中旬起開放,持續(xù)兩周。成功
    的頭像 發(fā)表于 10-22 17:06 ?829次閱讀

    控制當前和下一代功率控制器的輸入功率

    電子發(fā)燒友網站提供《控制當前和下一代功率控制器的輸入功率.pdf》資料免費下載
    發(fā)表于 09-18 11:31 ?0次下載
    控制當前和<b class='flag-5'>下一代</b>功率控制器的輸入功率

    通過電壓轉換啟用下一代ADAS域控制器應用說明

    電子發(fā)燒友網站提供《通過電壓轉換啟用下一代ADAS域控制器應用說明.pdf》資料免費下載
    發(fā)表于 09-11 11:32 ?0次下載
    通過電壓轉換啟用<b class='flag-5'>下一代</b>ADAS域控制器應用說明

    實現(xiàn)下一代具有電壓電平轉換功能的處理器、FPGA 和ASSP

    電子發(fā)燒友網站提供《實現(xiàn)下一代具有電壓電平轉換功能的處理器、FPGA 和ASSP.pdf》資料免費下載
    發(fā)表于 09-09 09:46 ?0次下載
    實現(xiàn)<b class='flag-5'>下一代</b>具有電壓電平轉換功能的<b class='flag-5'>處理</b>器、FPGA 和ASSP

    I3C–下一代串行通信接口

    電子發(fā)燒友網站提供《I3C–下一代串行通信接口.pdf》資料免費下載
    發(fā)表于 09-07 10:35 ?3次下載
    I3C–<b class='flag-5'>下一代</b>串行通信接口

    實現(xiàn)具有電平轉換功能的下一代無線信標

    電子發(fā)燒友網站提供《實現(xiàn)具有電平轉換功能的下一代無線信標.pdf》資料免費下載
    發(fā)表于 09-07 10:23 ?0次下載
    實現(xiàn)具有電平轉換功能的<b class='flag-5'>下一代</b>無線信標

    通過下一代引線式邏輯IC封裝實現(xiàn)小型加固型應用

    電子發(fā)燒友網站提供《通過下一代引線式邏輯IC封裝實現(xiàn)小型加固型應用.pdf》資料免費下載
    發(fā)表于 08-29 11:05 ?0次下載
    通過<b class='flag-5'>下一代</b>引線式邏輯IC封裝實現(xiàn)小型加固型應用

    下一代高功能新一代AI加速器(DRP-AI3):10x在高級AI系統(tǒng)高級AI中更快的嵌入處理

    電子發(fā)燒友網站提供《下一代高功能新一代AI加速器(DRP-AI3):10x在高級AI系統(tǒng)高級AI中更快的嵌入處理.pdf》資料免費下載
    發(fā)表于 08-15 11:06 ?0次下載
    <b class='flag-5'>下一代</b>高功能新<b class='flag-5'>一代</b>AI加速器(DRP-AI3):10x在高級AI系統(tǒng)高級AI中更快的嵌入<b class='flag-5'>處理</b>