一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

簡述FPGA在microsoft azure的應(yīng)用

FPGA之家 ? 來源:賽靈思電子科技(北京) ? 作者: moon ? 2021-06-01 11:50 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著5G通信技術(shù)的發(fā)展,云計算和邊緣計算業(yè)務(wù)也將快速增長。由于云計算多樣性和邊緣環(huán)境復(fù)雜性的特點,將決定了在CPU,GPUFPGA,ASIC中,不會只有一種芯片存在。所以FPGA一定可以尋找到它的應(yīng)用方向。相較于其它幾種芯片,F(xiàn)PGA具有以下幾種優(yōu)勢:

1 靈活可編程。FPGA是以LUT作為基本結(jié)構(gòu)的器件,可以根據(jù)需求的變化對其擦除重寫,運行新的程序。

2 高帶寬。FPGA芯片有很多高速管腳,可以連接多顆DRAM,產(chǎn)生較高的帶寬。

3 復(fù)雜的數(shù)據(jù)處理能力。FPGA能夠有針對性的處理邏輯關(guān)系復(fù)雜的程序,這相比于CPU,GPU等依賴指令處理數(shù)據(jù)的芯片有優(yōu)勢,因為它能夠做到更低的延遲。

FPGA也存在以下劣勢限制了它的發(fā)展:

1 編程復(fù)雜,開發(fā)周期較長。RTL的開發(fā)包括了架構(gòu)設(shè)計,RTL代碼,仿真驗證,上板調(diào)試。一個項目的周期往往是軟件開發(fā)的幾倍,團隊規(guī)模也較大。這些既提高了開發(fā)成本,又沒法適應(yīng)不斷迭代的產(chǎn)品需求。

2 粗粒度硬件結(jié)構(gòu)導(dǎo)致資源利用率低。FPGA達不到100%的資源利用率,這是對資源的一種浪費,體現(xiàn)在經(jīng)濟上是提高了成本。

以上兩方面都可以歸結(jié)到成本這一點上,但是如果能夠解決1問題,那么2問題也就迎刃而解了。因為如果FPGA的市場應(yīng)用多了,那么其制造成本也會下降。1問題的解決一直在路上,但是一直沒有解決。HLS等類似軟件編程語言的出現(xiàn)可以提高FPGA的開發(fā)效率,但是相比于純軟件開發(fā)語言還是存在一定復(fù)雜性。而相對于RTL語言來說,HLS語言的硬件描述性不夠鮮明。所以硬件開發(fā)人員更多的會選擇硬件描述清晰的verilog,system Verilog等語言。

這些缺點并不意味著我們對FPGA在未來AI應(yīng)用中抱著悲觀的想法,一個是未來場景的復(fù)雜性和多樣性,一個是FPGA也在尋求改進和發(fā)展。第一個決定了FPGA一定能夠在AI中活下去,第二個決定了FPGA在AI中活的怎么樣。

接下來我們來了解一下FPGA在微軟云azure中的應(yīng)用。

Azure stack edge

微軟在邊緣做了產(chǎn)品布局,依據(jù)邊緣的規(guī)模,提供了兩類產(chǎn)品。一類是針對計算任務(wù)繁重的企業(yè)用戶,其提供了基于GPU和FPGA的Pro設(shè)備,能夠?qū)崿F(xiàn)邊緣端的數(shù)據(jù)預(yù)處理,包括聚合數(shù)據(jù),修改數(shù)據(jù)等,以及運行ML模型。另外一類是針對隨時移動的用戶,提供了小而便攜的設(shè)備。這些設(shè)備使用了intel針對視覺處理專門研發(fā)的VPU芯片。

雖然在2024年基于FPGA的pro設(shè)備將停用,而遷移到基于GPU的設(shè)備上。但是VPU芯片的出現(xiàn),反映了在邊緣計算應(yīng)用中,F(xiàn)PGA所發(fā)生的可能轉(zhuǎn)變。在多變的邊緣目標上,小芯片能夠更有針對性的保留有效的計算資源,這樣精簡了結(jié)構(gòu),降低了功耗。

Intel VPU是集成了Leon處理器,12個SHAVE計算核以及一個DRAM的SoC結(jié)構(gòu)。SHAVE是一個向量處理器,能夠進行大量的向量運算。所以VPU能夠適合運行ML模型,以及進行一些圖像處理方面的工作。目前VPU能夠支持21種神經(jīng)網(wǎng)絡(luò)算子,包括conv,relu等。這些神經(jīng)網(wǎng)絡(luò)可以通過其編譯器工具NCAPI轉(zhuǎn)化為可以在VPU中執(zhí)行的指令。目前能夠支持inception,mobilenet,googlenet,ssd,alexnet等很多卷積和LSTM網(wǎng)絡(luò)。

超算中心的FPGA

微軟在數(shù)據(jù)中心系統(tǒng)性的構(gòu)建了一個FPGA集群,這個FPGA集群能夠?qū)崿F(xiàn)內(nèi)部和外部server的互聯(lián)。在頂層軟件的分配調(diào)度下,可以執(zhí)行多種不同的任務(wù),包括web search ranking, deep neural networks, expensive compression等。

FPGA集群的基本結(jié)構(gòu)如上圖所示:包括了兩塊CPU和一塊altera的FPGA芯片。FPGA通過PCIE和一個NIC來和兩塊CPU進行通信。NIC保證了FPGA可以實現(xiàn)原位處理網(wǎng)絡(luò)數(shù)據(jù)包。FPGA之間還通過ToR實現(xiàn)互聯(lián),ToR保證了一個任務(wù)能夠被分割為多個子任務(wù),然后分配給多個FPGA處理。

在邏輯層面,F(xiàn)PGA定義了Lightweight Transport Layer(LTL)和Elastic Router(ER)。LTL實現(xiàn)了不同的FPGA芯片之間的互聯(lián),這樣保證了遠程FPGA之間的通信,使得整個FPGA集群處于一個整體中。ER是用于同一個FPGA芯片中不同任務(wù)的互聯(lián)。LTL和ER的混合使用能夠靈活的為FPGA分配不同任務(wù),滿足數(shù)據(jù)中心任務(wù)多樣性需求。

ToR形成了三層結(jié)構(gòu),L0層連接了24個FPGA設(shè)備,L1連接了960個設(shè)備,L2級可能連接了超過幾百萬的設(shè)備。L0級的round-trip延時大概在2.8us,L1級平均在7.7us,而L2級在22us。

FPGA架構(gòu)

微軟的神經(jīng)網(wǎng)絡(luò)加速器主要是針對單batch低延遲來設(shè)計的,其所期望的是能夠最大限度的將weight緩存在片上,通過將一個大的網(wǎng)絡(luò)進行分割,分配到多個FPGA芯片上實現(xiàn)。其分割的子網(wǎng)絡(luò)的權(quán)重大小可以適配一顆FPGA芯片上weight的緩存空間。架構(gòu)將計算重點放在矩陣-向量乘法上,這個也是合理的,因為LSTM,CNN網(wǎng)絡(luò)大部分計算量都由矩陣乘法承擔(dān)。

其它函數(shù)運算,包括向量加法,乘法,sigmoid,tanh等函數(shù),則統(tǒng)一到同一個多功能函數(shù)模塊中。這樣做的好處是簡化了FPGA架構(gòu),同時也簡化了數(shù)據(jù)流。因此其整個架構(gòu)中沒有多端口共享的memory,不存在對多數(shù)據(jù)訪問沖突的處理。同時也簡化了指令,消除了對指令依賴關(guān)系的判斷和檢測。FPGA架構(gòu)中有對指令的進一步分解和處理,所以軟件端的指令非常簡單,就是通過C語言的宏定義實現(xiàn)的。

其矩陣向量乘法結(jié)構(gòu)是由多個dot-product結(jié)構(gòu)組成的,多個dot-product和累加器形成了一個tile,然后多個tile就構(gòu)成了一個大的矩陣向量乘法。

軟件結(jié)構(gòu)

神經(jīng)網(wǎng)絡(luò)加速器的工具鏈包括:CNTK(微軟自定義的一個指令級描述),tensorflow或者caffe的圖文件作為輸入,然后通過前端轉(zhuǎn)化為IR表示,然后依據(jù)網(wǎng)絡(luò)大小以及FPGA中資源情況對圖進行分割和優(yōu)化,然后產(chǎn)生硬件可執(zhí)行指令。如果網(wǎng)絡(luò)較大,那么網(wǎng)絡(luò)可以被分割成多個子圖,部署到不同F(xiàn)PGA上。如果一個矩陣乘法過大,那么可以被分割成多塊來實現(xiàn)。對于不可實現(xiàn)的神經(jīng)網(wǎng)絡(luò)算子,工具鏈可以將多個不可實現(xiàn)算子組合成一個子圖,在CPU上完成。

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1645

    文章

    22042

    瀏覽量

    618245
  • 云計算
    +關(guān)注

    關(guān)注

    39

    文章

    7976

    瀏覽量

    140019
  • 高帶寬
    +關(guān)注

    關(guān)注

    0

    文章

    36

    瀏覽量

    7817
  • 邊緣計算
    +關(guān)注

    關(guān)注

    22

    文章

    3325

    瀏覽量

    50896

原文標題:FPGA在microsoft azure的應(yīng)用

文章出處:【微信號:zhuyandz,微信公眾號:FPGA之家】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    微軟 Build 2025大會:筑牢智能體時代的安全新防線

    微軟Build 2025大會上,微軟宣布通過Microsoft Azure AI Foundry(國際版)、Microsoft Purview與M
    的頭像 發(fā)表于 06-04 09:44 ?1237次閱讀
    微軟 Build 2025大會:筑牢智能體時代的安全新防線

    微軟Microsoft Azure AI Foundry國際版的十大技術(shù)突破

    當(dāng)傳統(tǒng)軟件開發(fā)還在以“季度”為單位迭代時,Microsoft Azure Al Foundry(國際版)正掀起一場效率革命:通過整合代碼、協(xié)作與云的全棧平臺,幫助開發(fā)者幾天內(nèi)完成從創(chuàng)意到生產(chǎn)的全
    的頭像 發(fā)表于 05-29 16:28 ?546次閱讀

    如何從 Microsoft Visual C++ 應(yīng)用程序 (CyAPI.h) 訪問 CYUSB3014 芯片組的 i2c 接口?

    1. 如何從 Microsoft Visual C++ 應(yīng)用程序 (CyAPI.h) 訪問 CYUSB3014 芯片組的 i2c 接口? 我定制相機中使用 CYUSB3014。 當(dāng)我開發(fā)我的相機
    發(fā)表于 05-19 07:21

    DXC攜手SAP與Microsoft,簡化并加速企業(yè)轉(zhuǎn)型

    DXC Complete攜手SAP與Microsoft,助力企業(yè)Microsoft Azure上部署RISE with SAP、GROW with SAP和SAP Business
    的頭像 發(fā)表于 05-09 15:04 ?213次閱讀
    DXC攜手SAP與<b class='flag-5'>Microsoft</b>,簡化并加速企業(yè)轉(zhuǎn)型

    FPGAAI方面有哪些應(yīng)用

    隨著人工智能技術(shù)的飛速發(fā)展,對計算性能的需求也日益增長。FPGA(現(xiàn)場可編程門陣列)作為一種高性能、低功耗、可靈活編程的硬件平臺,正逐漸 AI 領(lǐng)域嶄露頭角,展現(xiàn)出獨特的優(yōu)勢,為 AI 應(yīng)用的落地
    的頭像 發(fā)表于 01-06 17:37 ?1393次閱讀

    諾基亞擴展與微軟Azure的數(shù)據(jù)中心網(wǎng)絡(luò)供應(yīng)協(xié)議

    近日,諾基亞公司于11月21日正式宣布,將其與微軟Azure之間的數(shù)據(jù)中心路由器和交換機供應(yīng)協(xié)議延長五年。這一決策標志著諾基亞在數(shù)據(jù)中心網(wǎng)絡(luò)解決方案領(lǐng)域的持續(xù)深耕,以及與微軟Azure長期合作
    的頭像 發(fā)表于 11-22 13:53 ?554次閱讀

    微軟發(fā)布Azure AI Foundry,推動云服務(wù)增長

    Azure AI Foundry為用戶提供了一個更為便捷的平臺,使得支持人工智能的大型語言模型之間切換變得輕松自如。這一創(chuàng)新工具的發(fā)布,無疑將極大地降低AI應(yīng)用的開發(fā)門檻,進一步推動AI技術(shù)的普及與應(yīng)用。 11月19日于
    的頭像 發(fā)表于 11-21 11:32 ?873次閱讀

    NVIDIA邀您相約微軟Ignite技術(shù)大會

    各行各業(yè)的企業(yè)正在借助 Microsoft Azure 上功能強大、安全高效的 NVIDIA 加速計算平臺,來提高生產(chǎn)力、推動增長和提升客戶體驗。
    的頭像 發(fā)表于 11-19 14:37 ?629次閱讀

    基于Arm Neoverse的微軟全新Azure虛擬機上線

    云服務(wù)用戶和開發(fā)者持續(xù)尋求高效、可持續(xù)且可擴展的計算解決方案,以滿足包括人工智能 (AI) 在內(nèi)的現(xiàn)代云原生應(yīng)用的需求。作為云服務(wù)領(lǐng)域的前沿企業(yè),微軟一直通過在其 Azure 產(chǎn)品系列中進行系統(tǒng)到
    的頭像 發(fā)表于 10-27 11:00 ?807次閱讀

    印孚瑟斯與微軟擴大戰(zhàn)略合作,加速客戶云與AI轉(zhuǎn)型

    印孚瑟斯(Infosys)近日宣布與微軟(Microsoft)進一步擴大戰(zhàn)略合作,旨在加速全球客戶對生成式人工智能(AI)和Microsoft Azure云的采用。
    的頭像 發(fā)表于 10-11 16:20 ?575次閱讀

    微軟Azure首獲英偉達GB200 AI服務(wù)器

    微軟Azure社交平臺上宣布了一項重要進展,公司已經(jīng)成功獲得了搭載英偉達最新GB200超級芯片的AI服務(wù)器。這一舉措使微軟Azure成為全球云服務(wù)供應(yīng)商中首個采用英偉達Blackwell計算體系的公司。
    的頭像 發(fā)表于 10-10 17:01 ?1032次閱讀

    Splashtop 加入 Microsoft 智能安全協(xié)會

    2024年9月25日美國加利福尼亞州庫比蒂諾SplashtopInc.宣布已正式加入Microsoft智能安全協(xié)會(MISA)。MISA由獨立軟件供應(yīng)商(ISV)和托管安全服務(wù)提供商(MISA)組成
    的頭像 發(fā)表于 09-28 08:08 ?440次閱讀
    Splashtop 加入 <b class='flag-5'>Microsoft</b> 智能安全協(xié)會

    基于Arm架構(gòu)的Azure虛擬機助力云原生應(yīng)用開發(fā)

    定制芯片有助于解決現(xiàn)代基礎(chǔ)設(shè)施所面臨的計算挑戰(zhàn),例如人工智能 (AI) 時代與日俱增的計算復(fù)雜性。Microsoft Azure Cobalt 100 等采用 Arm Neoverse 計算
    的頭像 發(fā)表于 09-05 15:54 ?2188次閱讀

    FPGA高速收發(fā)器的特點和應(yīng)用

    FPGA(Field Programmable Gate Array,現(xiàn)場可編程門陣列)高速收發(fā)器是現(xiàn)代數(shù)字通信系統(tǒng)中不可或缺的關(guān)鍵組件。它們以其高速、靈活和可編程的特性,多個領(lǐng)域發(fā)揮著重要作用。以下是對FPGA高速收發(fā)器的詳
    的頭像 發(fā)表于 08-05 15:02 ?1159次閱讀

    如影數(shù)字人生成平臺SenseAvatar上線微軟全球云市場

    近日,如影數(shù)字人生成平臺SenseAvatar正式微軟全球云市場Microsoft Azure Marketplace上線,為客戶提供高質(zhì)量的數(shù)字人內(nèi)容制作服務(wù)。
    的頭像 發(fā)表于 07-24 17:21 ?1151次閱讀