一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

HPC黃金三角:可靠、可用、可服務(wù)

新思科技 ? 來(lái)源:未知 ? 2023-02-17 23:45 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

98cab732-aed8-11ed-bfe3-dac502259ad0.gif

高性能計(jì)算(HPC)曾一度是大型數(shù)據(jù)中心和超級(jí)計(jì)算機(jī)的專屬,但如今依賴HPC的應(yīng)用不勝枚舉,在與我們生活息息相關(guān)的各種應(yīng)用領(lǐng)域都必不可少,如科學(xué)、醫(yī)療、安全、短視頻...

為實(shí)現(xiàn)更好的HPC芯片設(shè)計(jì),開(kāi)發(fā)者們應(yīng)該了解如何提升RAS,即可靠性 (Reliability)、可用性 (Availability)和可服務(wù)性 (Serviceability)。

RAS的含義并不難懂,但涉及到HPC的SoC時(shí),它表示什么呢?數(shù)據(jù)中心運(yùn)營(yíng)商長(zhǎng)期以來(lái)一直與客戶保持服務(wù)水平協(xié)議,以確保系統(tǒng)的正常運(yùn)行時(shí)間。RAS是對(duì)此類協(xié)議的補(bǔ)充,現(xiàn)已能通過(guò)新技術(shù)獲得支持,最終生成切實(shí)可行的見(jiàn)解。本文將進(jìn)一步介紹為什么芯片生命周期管理(SLM)、嵌入式監(jiān)控IP以及正確的設(shè)計(jì)和驗(yàn)證工具能夠幫助HPC設(shè)計(jì)實(shí)現(xiàn)高水平的RAS。

高性能計(jì)算三大關(guān)鍵組成

家用安全門鈴或樓宇監(jiān)控系統(tǒng)所拍攝的視頻片段、金融和商業(yè)運(yùn)作建模、科學(xué)和醫(yī)學(xué)研究、增強(qiáng)現(xiàn)實(shí)和虛擬現(xiàn)實(shí)……隨著設(shè)備和系統(tǒng)收集的數(shù)據(jù)激增,再結(jié)合人工智能(AI)以及大量可用的計(jì)算資源,開(kāi)發(fā)者們可以快速獲得切實(shí)可行的見(jiàn)解,這使得HPC比1940年代第一臺(tái)超級(jí)計(jì)算機(jī)的應(yīng)用更為廣泛。

如今,常規(guī)的HPC基礎(chǔ)設(shè)施包括計(jì)算、網(wǎng)絡(luò)和存儲(chǔ)三大部分,且均有性能、延遲、功耗、可擴(kuò)展性、效率和安全性方面的要求。下面我們分別進(jìn)行說(shuō)明:
  • 計(jì)算部分包括CPUGPU、加速器、片上網(wǎng)絡(luò)(NoC)和計(jì)算服務(wù)器,用于處理高性能數(shù)據(jù)。該部分的關(guān)鍵在于復(fù)雜的多核甚至Multi-Die系統(tǒng)架構(gòu)、快速訪問(wèn)的大內(nèi)存、高帶寬I/O接口、電源/冷卻管理和安全性。片內(nèi)監(jiān)控和分析可支持RAS目標(biāo)。
  • 網(wǎng)絡(luò)部分包括交換機(jī)和路由器、適配器、網(wǎng)橋、中繼器、網(wǎng)絡(luò)接口卡(如智能網(wǎng)卡)以及光電互連,可提供高性能連接,最好具有高吞吐量、低延遲、高能效、可配置性和可擴(kuò)展性、實(shí)時(shí)監(jiān)控和報(bào)告以及安全性。調(diào)試能力、前向糾錯(cuò)(FEC)和IP可以支持RAS要求。
  • 存儲(chǔ)部分包括固態(tài)驅(qū)動(dòng)器(SSD)或硬盤(pán)驅(qū)動(dòng)器(HDD)、存儲(chǔ)區(qū)域網(wǎng)絡(luò)(SAN)和網(wǎng)絡(luò)附接存儲(chǔ)(NAS)。理想情況下,該部分應(yīng)可提供高帶寬存儲(chǔ),減少數(shù)據(jù)傳輸能耗和延遲,具有靈活性、可擴(kuò)展性、可靠性和安全性。內(nèi)置自測(cè)(BIST)、糾錯(cuò)碼(ECC)和冗余等功能可以實(shí)現(xiàn)高水平的RAS。
HPC系統(tǒng)主要分為單一計(jì)算系統(tǒng)和混合計(jì)算系統(tǒng)兩類。單一計(jì)算系統(tǒng)只有CPU,而混合計(jì)算系統(tǒng)同時(shí)擁有GPU和CPU,GPU運(yùn)行任務(wù),CPU監(jiān)督計(jì)算。

HPC集群可包含大量的服務(wù)器,而計(jì)算集群的總物理尺寸、能耗或熱量輸出可能會(huì)成為一大問(wèn)題。此外,集群對(duì)服務(wù)器之間的專用通信也有要求。

在集群中服務(wù)器數(shù)量相當(dāng)多時(shí),微小的設(shè)計(jì)改進(jìn)也可以創(chuàng)造巨大的價(jià)值,因此,為HPC優(yōu)化的服務(wù)器設(shè)計(jì)正在嶄露頭角。有時(shí),此類設(shè)計(jì)針對(duì)搜索引擎公司等大型公共網(wǎng)絡(luò)運(yùn)營(yíng)商,也有益于HPC集群。但它們也可以提供只適合HPC用戶的功能。例如,如果系統(tǒng)被設(shè)計(jì)成以不同的方式提供集群互連,有望大幅減少布線。

通過(guò)片內(nèi)監(jiān)控和分析

提供可行見(jiàn)解

HPC能夠處理PB級(jí)甚至ZB級(jí)的數(shù)據(jù),并且能夠?qū)崟r(shí)(或接近實(shí)時(shí))運(yùn)行復(fù)雜的模型。而如果HPC系統(tǒng)出現(xiàn)故障,必然會(huì)導(dǎo)致資金損失和業(yè)務(wù)中斷。對(duì)于關(guān)鍵任務(wù)應(yīng)用來(lái)說(shuō),后果會(huì)更加嚴(yán)重。在先進(jìn)工藝節(jié)點(diǎn)上,有大型單片晶粒或Multi-die等復(fù)雜架構(gòu),滿足RAS的要求則更具有挑戰(zhàn)性。

根據(jù)當(dāng)前應(yīng)用的重要性,系統(tǒng)可以建立備份,在發(fā)生故障時(shí)提供冗余備份。此外,還可以在系統(tǒng)和芯片層面以其它方式實(shí)現(xiàn)RAS目標(biāo)。SLM也發(fā)揮著巨大的作用,它可以提供智能、自動(dòng)化片內(nèi)監(jiān)控IP和方法,在系統(tǒng)生命周期的每個(gè)階段生成可行見(jiàn)解。

將監(jiān)視器和傳感器嵌入到芯片中是開(kāi)發(fā)者們幾十年來(lái)一直在做的事。然而,該技術(shù)已經(jīng)可以提供準(zhǔn)確度更高、顆粒度更細(xì)的數(shù)據(jù)。這提高了設(shè)備的實(shí)時(shí)環(huán)境、結(jié)構(gòu)和功能狀況的可見(jiàn)性,可以實(shí)現(xiàn)監(jiān)控溫度熱點(diǎn)、工藝變化和電源電壓,準(zhǔn)確測(cè)量時(shí)序裕量等功能。

得益于嵌入式、基于云的分析以及統(tǒng)一的SLM解決方案,設(shè)計(jì)團(tuán)隊(duì)能夠在設(shè)計(jì)、研發(fā)和生產(chǎn)階段甚至現(xiàn)場(chǎng)操作時(shí)持續(xù)、實(shí)時(shí)掌握其設(shè)備的芯片健康狀況,從而更好地了解根本原因,并立即進(jìn)行調(diào)試和維修,降低成本和潛在的危害。SLM可以解決晶體管老化、延遲故障等問(wèn)題,能夠帶來(lái)諸多益處。

舉例而言,如果衛(wèi)星出現(xiàn)故障,常見(jiàn)的辦法是在實(shí)驗(yàn)室維修電路板,再將其安裝在衛(wèi)星上,這會(huì)花費(fèi)數(shù)周時(shí)間,其間衛(wèi)星需要停用,以進(jìn)行故障診斷和維修。借助SLM技術(shù)在現(xiàn)場(chǎng)進(jìn)行故障檢修和修復(fù),團(tuán)隊(duì)可以在更少的中斷次數(shù)和更短的中斷時(shí)間內(nèi),保持系統(tǒng)的正常運(yùn)行。

數(shù)據(jù)中心也可以體現(xiàn)SLM是如何加快實(shí)現(xiàn)RAS要求的。

  • 在芯片層面,在現(xiàn)場(chǎng)進(jìn)行遠(yuǎn)程調(diào)試的能力是團(tuán)隊(duì)成功打造超大規(guī)模數(shù)據(jù)中心的關(guān)鍵,SLM提供的遠(yuǎn)程遙測(cè)和監(jiān)控功能使之成為可能。

  • 在系統(tǒng)層面,SLM精確的時(shí)鐘降頻對(duì)最大化數(shù)據(jù)吞吐量和CPU、GPU和AI引擎的利用率至關(guān)重要。

  • 在數(shù)據(jù)中心層面,SLM工具可以有效監(jiān)控服務(wù)器性能、網(wǎng)絡(luò)擁塞和磁盤(pán)利用率,從而檢測(cè)和預(yù)測(cè)數(shù)據(jù)中斷,增加正常運(yùn)行時(shí)間。

  • 在超大規(guī)模層面,團(tuán)隊(duì)可以利用SLM最大限度地減少片上熱量和供電壓力,以延長(zhǎng)可靠性。

  • 對(duì)于Die-to-Die高速接口,SLM可監(jiān)控信號(hào)完整性,結(jié)合接口完整性的冗余,有助于確保小芯片設(shè)計(jì)的穩(wěn)健性。

總結(jié)

端到端的解決方案并非是各自獨(dú)立的點(diǎn)工具的集合,而能夠提供設(shè)計(jì)校準(zhǔn)分析、片內(nèi)監(jiān)控、系統(tǒng)性能優(yōu)化等多項(xiàng)功能,無(wú)縫實(shí)現(xiàn)RAS目標(biāo)。新思科技可提供出色的端到端流程,我們的芯片生命周期管理系列還配有廣泛的低延遲、經(jīng)驗(yàn)證的IP組合以及面向HPC應(yīng)用的設(shè)計(jì)和驗(yàn)證技術(shù)。

該解決方案配備物理感知芯片監(jiān)控器、云分析以及嵌入式分析和優(yōu)化技術(shù),還包括SoC傳感器IP和制程監(jiān)控器,用于設(shè)計(jì)、研發(fā)、生產(chǎn)階段和現(xiàn)場(chǎng)的優(yōu)化。在制造階段和現(xiàn)場(chǎng),監(jiān)控器可以收集有關(guān)芯片的實(shí)時(shí)數(shù)據(jù),輔以全面的測(cè)試和調(diào)試解決方案,可確保高水平的RAS。

隨著HPC應(yīng)用日益增多,SoC開(kāi)發(fā)必須確保系統(tǒng)的高可靠性、可用性和可服務(wù)性。實(shí)現(xiàn)最佳水平的RAS,支持流媒體視頻、氣候變化建模等多項(xiàng)應(yīng)用,萬(wàn)物數(shù)智化的世界才能保持高速運(yùn)行。

9c0806ca-aed8-11ed-bfe3-dac502259ad0.gif? ?


原文標(biāo)題:HPC黃金三角:可靠、可用、可服務(wù)

文章出處:【微信公眾號(hào):新思科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 新思科技
    +關(guān)注

    關(guān)注

    5

    文章

    863

    瀏覽量

    51377

原文標(biāo)題:HPC黃金三角:可靠、可用、可服務(wù)

文章出處:【微信號(hào):Synopsys_CN,微信公眾號(hào):新思科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    一篇文章教你使用運(yùn)放實(shí)現(xiàn)三角波、方波(詳細(xì)電路分析)+multisim仿真

    前言信號(hào)發(fā)生器是電子工程師最常用的幾個(gè)儀器之一吧,三角波和方波是最常用的波形,在之前的文章中,我們已經(jīng)介紹過(guò)RC延遲電路,今天我就教大家通過(guò)RC延遲和運(yùn)放來(lái)實(shí)現(xiàn)三角波和方波。 仿真軟件版本本次介紹
    發(fā)表于 04-23 14:32

    馬達(dá)控制上必要的知識(shí) 三角函數(shù)

    為了理解馬達(dá)控制技術(shù),必須理解如下基礎(chǔ)學(xué)問(wèn)。 (1) 數(shù)學(xué):三角函數(shù),指數(shù)函數(shù),復(fù)數(shù)函數(shù),微分,積分,矩陣,坐標(biāo)(直交,極) (2) 電氣電路:交流理論(3 相交流, 歪交流),過(guò)渡現(xiàn)象 (3
    發(fā)表于 03-18 12:23

    17座站,啟源芯動(dòng)力打造閩南金三角電動(dòng)重卡充換電網(wǎng)絡(luò)

    福建廈漳泉地區(qū),土地面積僅占福建全省的五分之一,卻貢獻(xiàn)了全省46%GDP產(chǎn)值。在這片"閩南金三角"地區(qū),啟源芯動(dòng)力以17座新能源電動(dòng)重卡充換電站串聯(lián)起地港口物流、砂石料運(yùn)輸
    的頭像 發(fā)表于 02-24 15:34 ?391次閱讀
    17座站,啟源芯動(dòng)力打造閩南<b class='flag-5'>金三角</b>電動(dòng)重卡充換電網(wǎng)絡(luò)

    用DAC8562輸出一個(gè)三角波測(cè)試,用示波器發(fā)現(xiàn)輸出的三角波有毛刺,怎么解決?

    我用DAC8562輸出一個(gè)三角波測(cè)試,用示波器發(fā)現(xiàn)輸出的三角波有些毛刺,負(fù)載是XTR111,電路圖按照datasheet提供的電路設(shè)計(jì),采用同步模式,將LDAC接地,CLR上拉,SPI通信和輸出
    發(fā)表于 01-23 06:21

    長(zhǎng)三角,如何把數(shù)據(jù)要素變成新長(zhǎng)江?

    長(zhǎng)三角數(shù)據(jù)一體化,為“數(shù)據(jù)要素x”做出示范
    的頭像 發(fā)表于 12-24 14:07 ?566次閱讀
    長(zhǎng)<b class='flag-5'>三角</b>,如何把數(shù)據(jù)要素變成新長(zhǎng)江?

    淺談電動(dòng)機(jī)三角接法是什么意思?舉例分析

    在工業(yè)自動(dòng)化和電力系統(tǒng)中,相交流電動(dòng)機(jī)因其高效率和可靠性而被廣泛使用。這些電動(dòng)機(jī)的接線方式對(duì)其性能有著重要影響,其中三角接法(Delta Connection)是一種常見(jiàn)的接線方式。 1.
    的頭像 發(fā)表于 10-23 09:55 ?3563次閱讀

    相電機(jī)三角形連接有哪些參數(shù)關(guān)系?

    相電機(jī)三角形連接(△連接)是一種重要的電氣連接方式,在電力系統(tǒng)和電動(dòng)機(jī)控制中廣泛應(yīng)用。在三角形連接中,相電源或負(fù)載的每一相的末端與后續(xù)相的始端相連,形成一個(gè)閉合的
    的頭像 發(fā)表于 10-23 09:48 ?2684次閱讀

    什么是相電機(jī)三角形接法?定義是什么?

    相電機(jī)三角形接法(Delta Connection)是一種相交流電動(dòng)機(jī)的接線方式。在這種接法中,電機(jī)的個(gè)繞組相互連接,形成一個(gè)閉合的三角
    的頭像 發(fā)表于 10-23 09:37 ?2768次閱讀

    TI Arm內(nèi)核三角函數(shù)的優(yōu)化

    電子發(fā)燒友網(wǎng)站提供《TI Arm內(nèi)核三角函數(shù)的優(yōu)化.pdf》資料免費(fèi)下載
    發(fā)表于 09-11 09:19 ?1次下載
    TI Arm內(nèi)核<b class='flag-5'>三角</b>函數(shù)的優(yōu)化

    這個(gè)電路怎么得不到三角波呢?

    先上圖 請(qǐng)問(wèn)高手,這個(gè)電路怎么得不到三角波呢?謝謝
    發(fā)表于 09-05 13:55

    請(qǐng)問(wèn)三角波產(chǎn)生電路怎么消除偏置?

    三角波產(chǎn)生電路怎么消除偏置?
    發(fā)表于 09-03 07:25

    三角波發(fā)生器的組成和應(yīng)用

    三角波發(fā)生器是一種能夠產(chǎn)生連續(xù)三角形波形信號(hào)的電子設(shè)備或電路。其輸出信號(hào)具有特定的頻率和波形特征,廣泛應(yīng)用于電子、通信、音頻、測(cè)試測(cè)量以及控制系統(tǒng)等多個(gè)領(lǐng)域。以下是對(duì)三角波發(fā)生器的詳細(xì)闡述,包括其工作原理、組成結(jié)構(gòu)、應(yīng)用領(lǐng)域、參
    的頭像 發(fā)表于 08-08 14:36 ?3401次閱讀

    三角形連接和星形連接的基本概念和特點(diǎn)

    一、引言 在電力系統(tǒng)中,電機(jī)的連接方式對(duì)系統(tǒng)的運(yùn)行性能和效率有著重要的影響。目前,常用的電機(jī)連接方式有三角形連接和星形連接。三角形連接和星形連接各有優(yōu)缺點(diǎn),適用于不同的應(yīng)用場(chǎng)景。 二、三角形連接
    的頭像 發(fā)表于 07-17 10:35 ?5509次閱讀

    相負(fù)載與三角聯(lián)結(jié)的關(guān)系

    相負(fù)載與三角聯(lián)結(jié)的關(guān)系是一個(gè)電氣工程領(lǐng)域的重要課題。在這篇文章中,我們將探討相負(fù)載的概念、三角聯(lián)結(jié)的原理以及它們之間的關(guān)系。 相負(fù)載的
    的頭像 發(fā)表于 07-17 10:25 ?3179次閱讀

    三角形連接線電流和相電流的關(guān)系

    在電力系統(tǒng)中,三角形連接(Delta Connection)和星形連接(Star Connection)是兩種常見(jiàn)的相電機(jī)或變壓器的連接方式。三角形連接線電流和相電流之間的關(guān)系對(duì)于理解
    的頭像 發(fā)表于 07-17 09:59 ?1.5w次閱讀