一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

比40臺基于GPU的服務(wù)器更牛的是什么?一臺有40個GPU的服務(wù)器!

DPVg_AI_era ? 來源:lq ? 2019-02-13 10:04 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

比40臺基于GPU的服務(wù)器更牛的是什么?一臺有40個GPU的服務(wù)器!來自伊利諾伊州立大學(xué)計算機工程副教授及其團隊將于2月,為包含多達40個GPU的晶圓級計算機提供案例。這個多處理器“怪物”將計算速度提高了近19倍,并將能耗和信號延遲的總和降低了140倍以上。

搭載40個GPU的服務(wù)器,就問你怕不怕!

早在20世紀80年代,并行計算先驅(qū)Gene Amdahl就策劃了一項加速大型機計算的計劃:一種硅晶片大小的處理器。通過將大部分數(shù)據(jù)保存在處理器本身,而不是將其通過電路板傳輸?shù)絻?nèi)存和其他芯片上,計算速度會更快,能源效率也會更高。

Amdahl從風(fēng)投那里獲得了2.3億美元的投資,這在當時是最多的。而后他創(chuàng)立了Trilogy Systems公司,將自己的夢想變成了現(xiàn)實。

這是“晶圓級集成”的首次商業(yè)嘗試,結(jié)果成了一場災(zāi)難。

伊利諾伊大學(xué)厄巴納-香檳分校和加州大學(xué)洛杉磯分校的工程師們認為,現(xiàn)在是時候再嘗試一次了。

在2月即將舉行的IEEE高性能計算機體系結(jié)構(gòu)國際研討會上,伊利諾伊州立大學(xué)計算機工程副教授Rakesh Kumar及其合作者將為包含多達40個GPU的晶圓級計算機提供案例。

這個多處理器“怪物”將計算速度提高了近19倍,并將能耗和信號延遲的總和降低了140倍以上。

Kumar表示:“我們試圖解決的一個大問題是計算單元之間的通信開銷。”

基于保證質(zhì)量的普通尺寸芯片,尋找連接技術(shù)是關(guān)鍵

超級計算機通常將應(yīng)用程序分布在數(shù)百個GPU上,這些GPU位于不同的印刷電路板上,并通過長途數(shù)據(jù)鏈路進行通信。

與芯片本身內(nèi)部的互連相比,這些鏈路吸收能量并且速度慢。更重要的是,由于芯片和印刷電路板的機械特性之間不匹配,處理器必須保存在嚴格限制其可以使用的輸入和輸出數(shù)量的封裝中。

因此,將數(shù)據(jù)從一個GPU轉(zhuǎn)移到另一個GPU需要大量的開銷。

所需要的是GPU模塊之間的連接,這些連接與芯片上的互連一樣快,低能耗且豐富。如此快速的連接將把這40個GPU集成到一起,成為一個巨大的GPU。

一種解決方案是:使用標準的芯片制造技術(shù)在同一塊硅片上構(gòu)建所有40個GPU,并在它們之間添加互連。

但正是這種思路扼殺了Amdahl在20世紀80年代的嘗試。

當你在制作一個芯片時,總是有出現(xiàn)缺陷的可能性,而出現(xiàn)缺陷的可能性會隨著芯片的大小而增加。如果你的芯片大小與餐盤一樣大小,幾乎可以保證在它上面有一個系統(tǒng)“殺戮”的缺陷。

因此,從已經(jīng)通過質(zhì)量測試的普通尺寸的GPU芯片開始,尋找一種更好地連接它們的技術(shù),是更有意義的。

這個團隊相信他們的silicon interconnect fabric(SiIF)的技術(shù),用硅代替電路板,芯片與電路板之間沒有機械上的不匹配,因此不需要芯片封裝。

SiIF晶圓上有一層或多層2微米寬的銅互連,間距最小可達4微米。這相當于芯片上最高級別的互連。

在要插入GPU的點中,硅片上的銅柱間距約為5微米。GPU在這些上方對齊,按下并加熱。

這種成熟的工藝稱為熱壓結(jié)合(thermal compression bonding),使銅柱與GPU的銅互連線融合。伊利諾斯州和加州大學(xué)洛杉磯分校的研究人員表示,窄小的互連和緊密的間距意味著你可以在一塊芯片上壓縮至少25倍的輸入和輸出。

Kumar和他的同事在設(shè)計晶圓級GPU時,必須考慮許多限制因素,包括可以從晶圓上移除多少熱量、晶圓處理器如何能夠最快速地相互通信,以及如何在整個晶圓上傳輸電力。

結(jié)果證明,功率是其中一個較為有限的約束條件。

在芯片的標準1伏電源下,SiIF晶圓片的布線將消耗整整2千瓦。相反,Kumar的團隊將電壓供應(yīng)提高到48伏,減少了所需的電流,從而減少了電力損失。這種解決方案需要在晶圓片周圍分布電壓調(diào)節(jié)器和信號調(diào)理電容器,從而占用原本可以用于更多GPU模塊的空間。

盡管如此,在一個設(shè)計中,他們還是能夠擠進41個GPU。他們測試了這種設(shè)計模擬的情況,發(fā)現(xiàn)它在消耗比40臺標準GPU服務(wù)器更少的能量的情況下,加快了計算和數(shù)據(jù)移動。

SiIF晶圓級GPU克服了早期晶圓級工作無法解決的問題

Horst技術(shù)咨詢公司的Robert W. Horst說:“SiIF晶圓級GPU克服了早期晶圓級工作無法解決的問題?!?/p>

二十多年前,在Tandem Computer公司,Horst參與開發(fā)了唯一一款商業(yè)化的晶圓級產(chǎn)品——一種在證券交易所取代高速硬盤的內(nèi)存系統(tǒng)。他預(yù)計降溫將是最具挑戰(zhàn)性的方面之一。“如果你在這么近的距離內(nèi)加入這么多邏輯,功耗可能會相當高,”他說。

Kumar表示,該團隊已經(jīng)開始著手構(gòu)建一個晶圓級原型處理器系統(tǒng)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    460

    文章

    52505

    瀏覽量

    440791
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4945

    瀏覽量

    131228
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    13

    文章

    9795

    瀏覽量

    87972

原文標題:ISU教授瘋狂實驗:搭建40個GPU晶圓級計算機,能耗、延遲降低140倍!

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    硅谷GPU服務(wù)器是什么意思?使用指南詳解

    硅谷GPU服務(wù)器本質(zhì)上是種IaaS(基礎(chǔ)設(shè)施即服務(wù))產(chǎn)品,它將物理服務(wù)器上的GPU資源通過虛
    的頭像 發(fā)表于 06-16 09:41 ?167次閱讀

    高性能GPU服務(wù)器推薦

    面對市場上種類繁多的GPU服務(wù)器,如何選擇款適合自身需求的設(shè)備呢?接下來,AI部落小編為您推薦。
    的頭像 發(fā)表于 03-20 10:14 ?466次閱讀

    影響服務(wù)器GPU租用價格的因素

    服務(wù)器GPU租用的價格受多種因素影響,包括GPU型號和性能、租用時長、帶寬和流量、地理位置、供應(yīng)和需求以及服務(wù)質(zhì)量等。下面,AI部落小編為您詳細介紹。
    的頭像 發(fā)表于 12-30 10:38 ?539次閱讀

    GPU加速云服務(wù)器怎么用的

    GPU加速云服務(wù)器是將GPU硬件與云計算服務(wù)相結(jié)合,通過云服務(wù)提供商的平臺,用戶可以根據(jù)需求靈活租用帶有
    的頭像 發(fā)表于 12-26 11:58 ?453次閱讀

    GPU服務(wù)器租用費用貴嗎

    在云計算領(lǐng)域,GPU服務(wù)器因其強大的計算能力和圖形處理能力,被廣泛應(yīng)用于多個領(lǐng)域。然而,對于許多企業(yè)和個人開發(fā)者來說,GPU服務(wù)器的租用費用仍然是
    的頭像 發(fā)表于 12-19 17:55 ?676次閱讀

    GPU服務(wù)器租用多少錢

    GPU服務(wù)器的租用價格受多種因素影響,包括服務(wù)提供商、GPU型號和性能、實例規(guī)格、計費模式、促銷活動以及地域差異等。下面,AI部落小編為您整理GP
    的頭像 發(fā)表于 12-09 10:50 ?724次閱讀

    租用GPU服務(wù)器般多少錢

    租用GPU服務(wù)器的費用受到多種因素的影響,包括服務(wù)器配置、租用時長、服務(wù)提供商以及市場供需狀況等。下面,AI部落小編帶您了解租用GPU
    的頭像 發(fā)表于 11-25 10:28 ?832次閱讀

    GPU服務(wù)器和傳統(tǒng)的服務(wù)器什么區(qū)別

    GPU服務(wù)器與傳統(tǒng)的服務(wù)器在多個方面存在顯著差異,主機推薦小編為您整理發(fā)布GPU服務(wù)器和傳統(tǒng)的服務(wù)器
    的頭像 發(fā)表于 11-07 11:05 ?699次閱讀

    GPU服務(wù)器AI網(wǎng)絡(luò)架構(gòu)設(shè)計

    眾所周知,在大型模型訓(xùn)練中,通常采用每臺服務(wù)器配備多個GPU的集群架構(gòu)。在上篇文章《高性能GPU服務(wù)器AI網(wǎng)絡(luò)架構(gòu)(上篇)》中,我們對
    的頭像 發(fā)表于 11-05 16:20 ?1234次閱讀
    <b class='flag-5'>GPU</b><b class='flag-5'>服務(wù)器</b>AI網(wǎng)絡(luò)架構(gòu)設(shè)計

    GPU高性能服務(wù)器配置

    GPU高性能服務(wù)器作為提升計算速度和效率的關(guān)鍵設(shè)備,在各大應(yīng)用場景中發(fā)揮著越來越重要的作用。在此,petacloud.ai小編為你介紹GPU高性能服務(wù)器的配置要點。
    的頭像 發(fā)表于 10-21 10:42 ?862次閱讀

    多個網(wǎng)站放在同一臺服務(wù)器ip什么影響?

    將多個網(wǎng)站放在同一臺服務(wù)器上,使用同一個IP地址,可能會有以下影響: 1、資源共享:多個網(wǎng)站共享同一臺服務(wù)器的資源,如CPU、內(nèi)存、存儲空間和帶寬。如果其中
    的頭像 發(fā)表于 09-12 11:15 ?1316次閱讀

    GPU服務(wù)器架構(gòu)解析及應(yīng)用優(yōu)勢

    GPU服務(wù)器作為種高性能計算資源,近年來在人工智能、大數(shù)據(jù)分析、圖形渲染等領(lǐng)域得到了廣泛應(yīng)用。它結(jié)合了云計算的靈活性與GPU的強大計算能力,為企業(yè)和個人用戶提供了
    的頭像 發(fā)表于 08-14 09:43 ?881次閱讀

    主機托管是多個用戶共享一臺服務(wù)器嗎?什么優(yōu)勢

    主機托管并不是多個用戶共享一臺服務(wù)器。主機托管是服務(wù),客戶可以將自己的硬件服務(wù)器托管給服務(wù)商,并享受專業(yè)的
    的頭像 發(fā)表于 08-13 14:45 ?540次閱讀

    gpu服務(wù)器與cpu服務(wù)器的區(qū)別對比,終于知道怎么選了!

    gpu服務(wù)器與cpu服務(wù)器的區(qū)別主要體現(xiàn)在架構(gòu)設(shè)計、性能特點、能耗效率、應(yīng)用場景、市場定位等方面,在以上幾個方面均存在顯著差異。CPU服務(wù)器更適合數(shù)據(jù)庫管理和企業(yè)應(yīng)用,而
    的頭像 發(fā)表于 08-01 11:41 ?1022次閱讀

    算力服務(wù)器為什么選擇GPU

    隨著人工智能技術(shù)的快速普及,算力需求日益增長。智算中心的服務(wù)器作為支撐大規(guī)模數(shù)據(jù)處理和計算的核心設(shè)備,其性能優(yōu)化顯得尤為關(guān)鍵。而GPU服務(wù)器也進入了大眾的視野,成為高性能計算的首選。那么,為什么算力
    的頭像 發(fā)表于 07-25 08:28 ?1347次閱讀
    算力<b class='flag-5'>服務(wù)器</b>為什么選擇<b class='flag-5'>GPU</b>