一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

數(shù)字中國建設(shè)整體布局規(guī)劃,能給ChatGPT帶來什么機會呢?

GPU視覺識別 ? 來源:GPU視覺識別 ? 作者:GPU視覺識別 ? 2023-03-07 11:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人工智能| NLP|GPU架構(gòu)

深度學(xué)習(xí) | AMD|ChatGPT

最近,ChatGPT又引發(fā)了不少新聞。比如,香港大學(xué)已經(jīng)正式宣布,禁用ChatGPT,目的是防止論文抄襲。再比如,近日,不少美國企業(yè)已經(jīng)把ChatGPT應(yīng)用到了日常工作中,甚至代替了部分員工。據(jù)美媒報道,本月早些時候,一家提供就業(yè)服務(wù)的平臺對1000家企業(yè)進行了調(diào)查,結(jié)果顯示,近50%的企業(yè)表示,已經(jīng)在使用ChatGPT;30%表示,有計劃使用ChatGPT。而在已經(jīng)使用ChatGPT的企業(yè)中,48%已經(jīng)讓其代替員工工作。ChatGPT的具體職責(zé)包括:客服、代碼編寫、招聘信息撰寫、文案和內(nèi)容創(chuàng)作、會議記錄和文件摘要等。

中國的商業(yè)力量也開始對ChatGPT進行布局。除了百度和阿里的布局,前段時間美團的原聯(lián)合創(chuàng)始人王慧文,也發(fā)布了一條AI英雄榜,說出資5000萬美元,要打造中國的OpenAI,也就是制造ChatGPT的那家公司。

ChatGPT是由OpenAI開發(fā)的大型語言模型,要求較高的算力才能支持其正常的運行。目前OpenAI提供的ChatGPT-3模型需要數(shù)千億次的浮點運算能力,并且需要超過350GB的存儲空間來存儲模型參數(shù)和相關(guān)數(shù)據(jù)。為了支持ChatGPT-3這樣的大型語言模型的運行,需要使用大規(guī)模的GPU集群或者專門的超級計算機。在實際應(yīng)用中,為了提高性能和減少延遲,通常會使用分布式計算來支持模型的運行。對于較小規(guī)模的語言模型,例如ChatGPT-2,也需要相對較高的算力才能正常運行,通常需要使用高性能計算機或者GPU來支持模型的訓(xùn)練和推理。

Chat GPT的局限

要想知道,ChatGPT的局限到底是什么?它又會帶來什么樣的問題?必須得先了解,ChatGPT的本質(zhì)到底是什么?

一、ChatGPT的本質(zhì)

ChatGPT 的本質(zhì)是一種基于神經(jīng)網(wǎng)絡(luò)的自然語言處理模型,它通過深度學(xué)習(xí)技術(shù)來學(xué)習(xí)語言的規(guī)律和語義信息,并生成人類可讀的文本。

具體而言,ChatGPT 采用了一種被稱為“Transformer”的神經(jīng)網(wǎng)絡(luò)架構(gòu),它由多個編碼器和解碼器組成,可以有效地處理長序列的文本數(shù)據(jù),并在學(xué)習(xí)中自動地學(xué)習(xí)語言規(guī)律和語義信息。ChatGPT 還使用了大量的文本數(shù)據(jù)進行無監(jiān)督學(xué)習(xí),使得模型具有較強的泛化能力和語言理解能力。

ChatGPT 的核心思想是基于預(yù)訓(xùn)練的方式,先在大規(guī)模語料庫上進行無監(jiān)督訓(xùn)練,使得模型具有較強的語言理解和生成能力,然后在特定任務(wù)上進行微調(diào),以適應(yīng)具體的應(yīng)用場景。這種基于預(yù)訓(xùn)練的方式已經(jīng)成為了自然語言處理領(lǐng)域的一個重要研究方向,并在各種文本生成和處理任務(wù)中取得了顯著的成果。

二、ChatGPT的局限

ChatGPT 作為一種語言模型,能夠在各種自然語言處理任務(wù)中表現(xiàn)出色。然而,它仍然存在一些局限性,包括:

1、數(shù)據(jù)偏差

ChatGPT 是基于大規(guī)模的語料庫進行訓(xùn)練的,如果訓(xùn)練數(shù)據(jù)存在偏差,例如種族、性別、社會階層等方面的偏差,模型可能會產(chǎn)生與現(xiàn)實世界不一致的結(jié)果。

2、計算資源需求高

ChatGPT 模型的參數(shù)非常多,需要大量的計算資源進行訓(xùn)練和推理。因此,只有大型機構(gòu)或公司才有能力訓(xùn)練和使用這種模型。

3、長期依賴問題

雖然 ChatGPT 能夠處理大量的文本信息,但它仍然存在長期依賴問題。在處理長文本時,模型可能會出現(xiàn)信息遺漏或信息重復(fù)等問題。

4、對話一致性問題

ChatGPT 在生成對話時,可能會產(chǎn)生與上下文不一致的回答,導(dǎo)致對話的連貫性受到影響。

5、語義理解問題

ChatGPT 能夠生成人類可讀的文本,但其對語義理解的能力仍然有限。在處理某些復(fù)雜的語義問題時,模型可能會出現(xiàn)錯誤的回答。

雖然 ChatGPT 存在一些局限性,但隨著技術(shù)的不斷發(fā)展,相信這些問題也將逐漸得到解決。

ChatGPT 是否是AI的革命

在人工智能技術(shù)的發(fā)展歷程中,ChatGPT代表了自然語言處理技術(shù)的一個重要突破,為語言模型的研究和應(yīng)用提供了新的思路和方法。ChatGPT的成功表明,通過大規(guī)模數(shù)據(jù)的訓(xùn)練和深度學(xué)習(xí)技術(shù)的應(yīng)用,人工智能可以在自然語言處理領(lǐng)域取得更好的表現(xiàn)。

因此,可以說ChatGPT代表了人工智能技術(shù)的進步和創(chuàng)新,但它并不是整個人工智能的革命,因為人工智能技術(shù)的進步還需要依賴于許多其他方面的技術(shù)和應(yīng)用,例如計算機視覺、機器學(xué)習(xí)、自動化等等。

一、人形機器人

ChatGPT 促進了人機交互能力的提升,加速了算法的采用。NLP技術(shù)帶來的人機交互能力,只有人形機器人才有必要,尤其是C端場景。截至2022年10月,Tesla已經(jīng)發(fā)布了Optimus人形機器人原型機,需要配合算法,形成全面的軟硬件協(xié)同才能落地。我們認為ChatGPT有望提升人形機器人的人機交互能力,加速人形機器人體驗的提升。

在場景2C中,人形機器人需要基于NLP的人機交互能力。人形機器人在與C端用戶打交道時,由于其人形形態(tài)特征,需要人機交互能力作為接受指令的入口。在人機交互技能中,NLP能力無疑是重中之重。人形機器人必須能夠理解人類的指令才能更好地完成各種任務(wù)?;贜LP的人機交互能力是類人機器人所需要的。

特斯拉Optimus人形機器人原型機于2022年10月發(fā)布,將在上海進博會上首次面向公眾展出。2022年10月1日,特斯拉在AIDay發(fā)布了人形機器人Optimus原型機,并于2022年11月5日在上海進博會上展示了原件,現(xiàn)場展示的是附殼的二代機。雖然由于交貨時間短,運行功能還不成熟,但現(xiàn)場展示版直立不動,但完成率高現(xiàn)場視頻顯示,樣機已經(jīng)可以完成物體搬運、澆花等動作。這是TeslaBot首次面向公眾展示,為后續(xù)B端、C端落地埋下伏筆。

pYYBAGQGqWWAeTqfAASsUk-9WOQ929.png

上海進博會現(xiàn)場展示的特斯拉人形機器人

二代版本訓(xùn)練時間短未能行走,還有出色的組合動作和手部動作。裝殼的最新版本(2代Optimus),這個版本剛出廠還沒有完全訓(xùn)練,現(xiàn)場也沒有展示其行走功能,但視頻顯示了四肢和細微的手部動作組合,指關(guān)節(jié)快速執(zhí)行1、2、6、拳頭等動作,展現(xiàn)高精度、高靈敏度,為未來功能迭代留下巨大想象空間。

poYBAGQGqWaAQkBPAAFoWGb2y6c994.png

現(xiàn)場視頻展示了 TeslaBot 手部精細度

以 AI 算法為核心的運動迭代展示了開創(chuàng)性的想法,從艱難移步到雙腳離地快速行走用了 5 個月的時間。在特斯拉之前,本田ASIMO與波士頓動力機器人等其他人形機器人已經(jīng)存在很長時間,能夠?qū)崿F(xiàn)的功能一般為直立行走、揮手、握手、搬運物品、擰瓶蓋等。根據(jù)特斯拉發(fā)布會的官方公告,Tesla Optimus 僅開發(fā)了六個月,但已經(jīng)基本實現(xiàn)了直立行走、揮手、給植物澆水、搬箱子等算法功能。一口氣提升 4個月,軟件迭代高效。此時,由于二代機才到貨一個月,還沒有完全調(diào)試好;但是,我們希望二代機在落地之后能夠在應(yīng)用中快速學(xué)習(xí),實現(xiàn)快速的技術(shù)進步和可迭代性。

poYBAGQGqWeAYRC5AASqb3r0yrY914.png

機器人共享汽車自動駕駛算法

機器人是智能手機的超越版本,單靠硬件無法實現(xiàn),需要與軟件算法協(xié)同工作,形成全面協(xié)同。統(tǒng)一的硬件是機器人運行的基礎(chǔ),需要高精度、高靈敏度和高力矩以滿足各種活動對機器人活動能力的要求。機器人的實際功能是通過綜合算法來實現(xiàn)的,需要智能感知能力、運動控制能力、感控一體技術(shù)和AI算法等軟硬件能力的綜合配合??傊?,硬件是機器人的軀體,軟件是機器人的靈魂,軟件與硬件的結(jié)合,靈魂與肉體的結(jié)合,才能構(gòu)成一個完整的、可用的智能機器人。特斯拉的機器人產(chǎn)品迭代過程以及大量的算法和軟件發(fā)布表明,軟件的生態(tài)進步是推動當前機器人應(yīng)用場景實現(xiàn)的關(guān)鍵因素。

特斯拉人形機器人擁有強大的AI軟硬件完整備份,增加了后續(xù)開發(fā)的效率。除了對感知和控制算法的高要求外,人形機器人應(yīng)用訓(xùn)練需要密集的計算負荷、強大的硬件平臺以及合適的軟件開發(fā)工具和框架;同時,迭代改進的算法模型可以提升AI芯片的性能,幫助解決長尾場景難題。軟件、硬件和AI算法的融合,更有利于進一步激活生態(tài),促進機器人未來場景的拓展。

算法框架和AI軟硬件加速訓(xùn)練的備份,TESLAOT將進入快速迭代時代。強大的算法框架和AI軟硬件儲備才是機器人功能實現(xiàn)的真正核心。未來隨著FSD的逐漸成熟和DOJO的落地,其算法和數(shù)據(jù)的閉環(huán)將進一步夯實。人形機器人在各種場景下的準確度和靈敏度訓(xùn)練將更加容易,TESLABOT將進入快速迭代時代。

我們認為ChatGPT有望提升人形機器人的人機交互能力,加快算法迭代過程,提升機器人體驗升級。ChatGPT的出現(xiàn)進一步推進了NLP技術(shù)前沿,使人機對話體驗不斷優(yōu)化。如果接入機器人應(yīng)用,有望帶來更好的人形機器人交互體驗,加快人形機器人的落地過程。

二、AI 語音語義

NLP 技術(shù)正在不斷優(yōu)化被認為是AI皇冠上的明珠。對話式AI和知識圖譜正在推動行業(yè)發(fā)展。到2026年,國內(nèi)NLP驅(qū)動的相關(guān)產(chǎn)業(yè)規(guī)??善魄|。我們認為,ChatGPT算法的突破,進一步提升了NLP技術(shù)的天花板,有望加速NLP技術(shù)在千行百業(yè)中的應(yīng)用。

NLP被譽為人工智能皇冠上的明珠,由于語義理解需要海量數(shù)據(jù)讓AI理解常識而壁壘較高。NLP或者說自然語義理解,技術(shù)上是指讓人工智能理解人類預(yù)測背后的含義。NLP衍生的應(yīng)用涵蓋方方面面,包括機器翻譯、AI應(yīng)答機器人等。從技術(shù)角度來看,如果要讓人工智能理解人類語言,最大的難點在于讓機器理解人類對話背后的海量常識設(shè)定。因此,NLP訓(xùn)練需要海量數(shù)據(jù),比訓(xùn)練其他AI技能難度更大,因此被稱為“人工智能皇冠上的明珠”。

對話式人工智能和知識圖譜正在推動工業(yè)規(guī)模的增長。到2026年,國內(nèi)NLP驅(qū)動的相關(guān)產(chǎn)業(yè)規(guī)??赏黄魄|。與其他人工智能技術(shù)相比,NLP一般不作為獨立產(chǎn)品出售,而是作為一項基礎(chǔ)技術(shù),結(jié)合智能語音和知識圖譜等技術(shù),通常以對話式人工智能、機器翻譯、知識庫等形式出現(xiàn),產(chǎn)品不斷涌現(xiàn),在獨立生產(chǎn)模塊的情況下,開發(fā)速度較慢。近兩年,在對話機器人應(yīng)用的推動下,智能知識庫、分模塊對話、對話語義理解、評論正負識別、對話自動輸出等NLP產(chǎn)品迎來了發(fā)展機遇,并伴隨著通用或垂直行業(yè)知識的發(fā)展在圖譜構(gòu)建中,NLP 與知識圖譜的綁定關(guān)系將更加緊密。據(jù)艾瑞統(tǒng)計研究,到2021年,中國NLP核心產(chǎn)品規(guī)模將達到171億元,帶動規(guī)模將達到450億元,到2026年,核心產(chǎn)品規(guī)模將達到459億元,驅(qū)動規(guī)模將超過1000億元。

pYYBAGQGqWeAQxWBAAHFb0A_YSY589.png

2019-2026 年中國 NLP 核心產(chǎn)品及帶動相關(guān)產(chǎn)業(yè)規(guī)模

我們認為,作為NLP模型,ChatGPT算法的突破帶來了NLP技術(shù)的進一步提升,有望加速NLP技術(shù)在智能語音、智能客服、機器人等各個行業(yè)和領(lǐng)域的應(yīng)用。

三、AI 視覺

AIGC方興未艾,圖像識別技術(shù)進入落地階段,有望催化進一步迭代。一方面AIGC技術(shù)方興未艾。這種基于AI的人工智能創(chuàng)作有望在未來徹底改變內(nèi)容生產(chǎn)方式,而NLP能力是其生產(chǎn)力的重要組成部分。ChatGPT有望加速其技術(shù)迭代。另一方面,AI圖像識別技術(shù)進入廣泛應(yīng)用階段,以??低?/u>、大華為首的龍頭企業(yè)已將該技術(shù)應(yīng)用于G端安防、B端產(chǎn)業(yè)/文旅等領(lǐng)域,助力降低成本和提高效率。

1、圖像識別技術(shù)已經(jīng)相對成熟,進入廣泛落地階段

人工智能圖像識別技術(shù)進入廣闊應(yīng)用階段,以???、大華為首的人工智能視覺領(lǐng)軍企業(yè)已將技術(shù)應(yīng)用于安防、工業(yè)、文旅等領(lǐng)域。海康、大華等企業(yè)以愿景為切入點,落地AI應(yīng)用,賦能千行百業(yè)降本增效?;谌四樧R別、溫度識別、動態(tài)追蹤等技術(shù),??怠⒋笕A等人工智能龍頭企業(yè)為制造、旅游、金融等行業(yè)提出了智能化解決方案,有效降本增效。

1)在制造業(yè),老板車間與??低暫献?,實現(xiàn)AR數(shù)字車間,助力智能生產(chǎn)。??低暲肁R視頻技術(shù)結(jié)合企業(yè)生產(chǎn)信息化,推出AR數(shù)字車間業(yè)務(wù),為老板電器無人工廠“九天中樞”智能制造平臺提供助力。AR數(shù)字車間可以在直觀的物理世界屏幕上為現(xiàn)場管理人員提供生產(chǎn)線和設(shè)備的實時數(shù)據(jù),并將大量視頻畫面、生產(chǎn)數(shù)據(jù)和設(shè)備數(shù)據(jù)組合成一個視圖,幫助企業(yè)更快地應(yīng)對突發(fā)事件;還可以將現(xiàn)場人員與管理人員或遠程專家聯(lián)系起來,提供遠程實時指導(dǎo);同時,通過視頻圖像可以確定分配給高周轉(zhuǎn)量產(chǎn)品的線邊空間量,實時監(jiān)控裝卸、計劃數(shù)據(jù)、產(chǎn)出數(shù)據(jù),幫助公司優(yōu)化空間。

poYBAGQGqWiASixhAAbnbvH8t0g400.png

??低?AR 數(shù)字工廠示意圖

2)旅游景區(qū):AI機器視覺助力實現(xiàn)客流管理、智能運維、火災(zāi)預(yù)警和環(huán)境動植物監(jiān)測?;谥悄軝z測終端、智能網(wǎng)絡(luò)、物聯(lián)網(wǎng)技術(shù)和移動應(yīng)用,人工智能機器視覺可實現(xiàn)景區(qū)地理、自然資源、基礎(chǔ)設(shè)施和景區(qū)管理的數(shù)字化和可視化;完善旅游景區(qū)車輛、人員、資產(chǎn)和事件的安全管理。同時,通過智能分析和數(shù)據(jù)應(yīng)用,增強景區(qū)安全,優(yōu)化景區(qū)管理,豐富游客服務(wù),助力景區(qū)環(huán)境和經(jīng)濟可持續(xù)發(fā)展。目前,大華股份的旅游景區(qū)解決方案已應(yīng)用于四川大邑縣、福建清源山景區(qū)等地的全域旅游項目。

大華股份智慧景區(qū)項目展示

2、AIGC技術(shù)方興未艾,基于NLP技術(shù)未來有望創(chuàng)新內(nèi)容創(chuàng)作方式

AIGC是一種利用AI技術(shù)自動生成內(nèi)容的生產(chǎn)方式,包括文本、圖片、視頻等多種形式的內(nèi)容。AIGC 是基于人工智能的內(nèi)容生產(chǎn),一般來說,使用形式是將需要生成的內(nèi)容通過句子以一定的格式描述出來,然后讓AI系統(tǒng)自動生成文字/圖片/視頻等。目前,國內(nèi)外已有多家廠商在AIGC領(lǐng)域布局,比如國內(nèi)的 AI 小說續(xù)寫軟件彩云小夢、OpenAI 推出的 AI 繪畫 模型 Dall-E、知名 AI 繪畫網(wǎng)站 midjourney 等。

poYBAGQGqWmAcpi3AAJ-FI-tKMA124.png

AIGC 應(yīng)用領(lǐng)域一覽

NLP 能力決定了 AIGC 應(yīng)用對用戶意圖的理解力,是生產(chǎn)力的重要組成部分,ChatGPT 的到來有望加速其技術(shù)迭代。由于目前 AIGC 的生產(chǎn)模式,是通過語言文字的方式輸入 用戶需求,所以,如何理解用戶所描述的內(nèi)容,就成為決定成品效果的重要因素。而 NLP 技術(shù),正是理解用戶意圖的關(guān)鍵所在。ChatGPT 作為當前效果最好的對話式 NLP 模型之 一,它的出現(xiàn)有望提升 AI 理解人類意圖的水平,從而加速 AIGC 技術(shù)的迭代。

Chat GPT 的底層架構(gòu)

作為一種人工智能模型,ChatGPT 的訓(xùn)練和推理需要大量的計算資源。與 CPU 相比,GPU 具有更高的并行性和處理能力,因此常常被用來加速深度學(xué)習(xí)任務(wù)的運算。因此,ChatGPT 的訓(xùn)練和推理通常會利用 GPU 來加速計算。

在訓(xùn)練過程中,ChatGPT 的架構(gòu)可以采用分布式訓(xùn)練的方式,使用多個 GPU 并行計算,以加速訓(xùn)練過程。在推理階段,ChatGPT 可以使用 GPU 進行加速,以實現(xiàn)更快的響應(yīng)時間和更高的吞吐量。

對于 GPU 的選擇,一般來說,需要考慮 GPU 的計算能力、內(nèi)存大小、功耗、價格等因素。同時,也需要考慮 GPU 的架構(gòu)是否與 ChatGPT 的計算需求相匹配,以獲得最佳的性能和效率。例如,NVIDIA 的 Volta、Turing 和 Ampere 架構(gòu)都被廣泛應(yīng)用于深度學(xué)習(xí)領(lǐng)域,包括 ChatGPT 的訓(xùn)練和推理。

GPU的核心競爭力在于架構(gòu)等因素決定的性能先進性和計算生態(tài)壁壘。國內(nèi)GPU廠商紛紛大力投入研發(fā)快速迭代架構(gòu),推動產(chǎn)業(yè)開放構(gòu)建自主生態(tài),加速追趕全球頭部企業(yè)。國產(chǎn)替代需求持續(xù)釋放疊加國際局勢不確定性加劇, AI、數(shù)據(jù)中心、智能汽車、游戲等GPU需求有望高增,國產(chǎn)GPU迎來發(fā)展黃金期,我們看好國產(chǎn)GPU公司的發(fā)展與投資機遇。

一、如何理解GPU的架構(gòu)

為了充分理解GPU的架構(gòu),讓我們再返回來看下第一張圖,一個顯卡中絕大多數(shù)都是計算核心core組成的海洋。在圖像縮放的例子中,core與core之間不需要任何協(xié)作,因為他們的任務(wù)是完全獨立的,然而,GPU解決的問題不一定這么簡單,讓我們來舉個例子。

假設(shè)我們需要對一個數(shù)組里的數(shù)進行求和,這樣的運算屬于reductuin family類型,因為這樣的運算試圖將一個序列“reduce”簡化為一個數(shù)。計算數(shù)組的元素總和的操作看起來是順序的,我們只需要獲取第一個元素,求和到第二個元素中,獲取結(jié)果,再將結(jié)果求和到第三個元素,以此類推。

pYYBAGQGqWqAUpPgAABAzCsyUSs043.jpg

令人驚訝的是,一些看起來本質(zhì)是順序的運算,其實可以再并行算法中轉(zhuǎn)化。假設(shè)一個長度為8的數(shù)組,在第一步中完全可以并行執(zhí)行兩個元素和兩個元素的求和,從而同時獲得四個元素,兩兩相加的結(jié)果,以此類推,通過并行的方式加速數(shù)組求和的運算速度。具體的操作如下圖所示,

poYBAGQGqWqAFUWbAABBnPKEzGI823.jpg

如上圖計算方式,如果是長度為8的數(shù)組兩兩并行求和計算,那么只需要三次就可以計算出結(jié)果。如果是順序計算需要8次。如果按照兩兩并行相加的算法,N個數(shù)字相加,那么僅需要log2(N)次就可以完成計算。

從GPU的角度來講,只需要四個core就可以完成長度為8的數(shù)組求和算法,我們將四個core編號為0,1,2,3。

那么第一個時鐘下,兩兩相加的結(jié)果通過0號core計算,放入了0號core可以訪問到的內(nèi)存中,另外兩兩對分別由1號2號3號core來計算,第二個個時鐘繼續(xù)按照之前的算法計算,只需要0號和1號兩個core即可完成,以此類推,最終的結(jié)果將在第三個時鐘由0號core計算完成,并儲存在0號core可以訪問到的內(nèi)存中。這樣實際三次就能完成長度為8的數(shù)組求和計算。

pYYBAGQGqWuATCcoAABwpCWUByg206.jpg

如果GPU想要完成上述的推理計算過程,顯然,多個core之間要可以共享一段內(nèi)存空間以此來完成數(shù)據(jù)之間的交互,需要多個core可以在共享的內(nèi)存空間中完成讀/寫的操作。我們希望每個Cores都有交互數(shù)據(jù)的能力,但是不幸的是,一個GPU里面可以包含數(shù)以千計的core,如果使得這些core都可以訪問共享的內(nèi)存段是非常困難和昂貴的。出于成本的考慮,折中的解決方案是將各類GPU的core分類為多個組,形成多個流處理器(Streaming Multiprocessors )或者簡稱為SMs。

二、最終的GPU架構(gòu)

poYBAGQGqWyAXZwwAAFK6Gm7ZDs066.jpg

The Turing architecture

上圖的綠色部分意味著Core計算單元,綠色的塊就是上文談到的Streaming Multiprocessors,理解為Core的集合。黃色的部分名為RT COREs畫的離SMs非常近。單個SM的圖靈架構(gòu)如下圖所示

pYYBAGQGqWyAJZZqAADsZuNMnE0242.jpg

The Turing SM

在SM的圖靈結(jié)構(gòu)中,綠色的部分CORE相關(guān)的,我們進一步區(qū)分了不同類型的CORE。主要分為INT32,FP32,TENSOR CORES。FP32 Cores,執(zhí)行單進度浮點運算,在TU102卡中,每個SM由64個FP32核,TU120由72個SMs因此,F(xiàn)P32 Core的數(shù)量是 72 * 64。

FP64 Cores. 實際上每個SM都包含了2個64位浮點計算核心FP64 Cores,用來計算雙精度浮點運算,雖然上圖沒有畫出,但是實際是存在的。Integer Cores,這些core執(zhí)行一些對整數(shù)的操作,例如地址計算,可以和浮點運算同時執(zhí)行指令。在前幾代GPU中,執(zhí)行這些整型操作指令都會使得浮點運算的管道停止工作。TU102總共有4608個Integer Cores,每個SM有64個SM。

Tensor Cores,張量core是FP16單元的變種,認為是半精度單元,致力于張量積算加速常見的深度學(xué)習(xí)操作。圖靈張量Core還可以執(zhí)行INT8和INT4精度的操作,用于可以接受量化而且不需要FP16精度的應(yīng)用場景,在TU102中,我們每個SM有8個張量Cores,一共有8 * 72個Tensor Cores。

在大致描述了GPU的執(zhí)行部分之后,讓我們回到上文提出的問題,各個核心之間如何完成彼此的協(xié)作?

在四個SM塊的底部有一個96KB的L1 Cache,用淺藍色標注的。這個cache段是允許各個Core都可以訪問的段,在L1 Cache中每個SM都有一塊專用的共享內(nèi)存。作為芯片上的L1 cache的大小是有限的,但它非???,肯定比訪問GMEM快得多。

實際上L1 CACHE擁有兩個功能,一個是用于SM上Core之間相互共享內(nèi)存,另一個則是普通的cache功能。當Core需要協(xié)同工作,并且彼此交換結(jié)果的時候,編譯器編譯后的指令會將部分結(jié)果儲存在共享內(nèi)存中,以便于不同的core獲取到對應(yīng)數(shù)據(jù)。當用作普通cache功能的時候,當core需要訪問GMEM數(shù)據(jù)的時候,首先會在L1中查找,如果沒找到,則回去L2 cache中尋找,如果L2 cache也沒有,則會從GMEM中獲取數(shù)據(jù),L1訪問最快 L2 以及GMEM遞減。緩存中的數(shù)據(jù)將會持續(xù)存在,除非出現(xiàn)新的數(shù)據(jù)做替換。從這個角度來看,如果Core需要從GMEM中多次訪問數(shù)據(jù),那么編程者應(yīng)該將這塊數(shù)據(jù)放入功能內(nèi)存中,以加快他們的獲取速度。其實可以將共享內(nèi)存理解為一段受控制的cache,事實上L1 cache和共享內(nèi)存是同一塊電路中實現(xiàn)的。編程者有權(quán)決定L1 的內(nèi)存多少是用作cache多少是用作共享內(nèi)存。

最后,也是比較重要的是,可以儲存各個core的計算中間結(jié)果,用于各個核心之間共享的內(nèi)存段不僅僅可以是共享內(nèi)存L1,也可以是寄存器,寄存器是離core最近的內(nèi)存段,但是也非常小。最底層的思想是每個線程都可以擁有一個寄存器來儲存中間結(jié)果,每個寄存器只能由相同的一個線程來訪問,或者由相同的warp或者組的線程訪問。

三、海外復(fù)盤:NVIDIA與AMD(ATI)的競爭貫穿GPU發(fā)展歷程,架構(gòu)創(chuàng)新升級和新興AI等領(lǐng)域前瞻探索是領(lǐng)跑的關(guān)鍵

1、NVIDIA長期居于GPU市場領(lǐng)導(dǎo)地位,近年AMD憑借RDNA架構(gòu)在游戲市場強勢崛起。Verified Market Research數(shù)據(jù)顯示,2022年全球獨立GPU市場規(guī)模約448.3億美元,NVIDIA和AMD的市場份額占比約為8:2。根據(jù)JPR數(shù)據(jù),NVIDIA憑借自身性能領(lǐng)先和CUDA生態(tài)優(yōu)勢性 始終占有GPU領(lǐng)域超50%的市場份額,數(shù)據(jù)中心業(yè)務(wù)更是全面領(lǐng)先,在游戲顯卡領(lǐng)域,近年AMD憑借RDNA系列架構(gòu)強勢崛起。

2、NVIDIA先后與AMD等企業(yè)在性能方面競爭博弈,架構(gòu)創(chuàng)新升級和新興領(lǐng)域前瞻探索是領(lǐng)跑GPU行業(yè)的關(guān)鍵。NVIDIA憑借性能領(lǐng)先長期占據(jù)超五成市場份額,AMD(ATI)也曾因架構(gòu)出色、性能驚艷實現(xiàn)反超。同時NVIDIA早在2006年前瞻性布局通用計算、構(gòu)建CUDA生態(tài),為如今AI&數(shù)據(jù)中心領(lǐng)域的全面領(lǐng)先構(gòu)筑牢固的壁壘。NVIDIA積極布局異構(gòu)芯片、汽車、元宇宙等新市場,尋找新的強有力業(yè)務(wù)增長點。

四、國內(nèi)GPU市場:各應(yīng)用場景市場廣闊,國內(nèi)廠商大有可為

1、GPU市場空間廣闊,國內(nèi)企業(yè)規(guī)模逐步起量

2022年全球GPU市場規(guī)模達到448.3億美元,國內(nèi)外市場空間正高速增長,年復(fù)合增長率達到32.8% ,Verified Market Research 數(shù)據(jù)顯示,2020年,全球GPU市場規(guī)模為254.1億美元,且該機構(gòu)預(yù)計2028年市場規(guī)模將達到2465.1億美元, 對應(yīng)年復(fù)合增長率達32.8%。

國際獨立GPU市場由Nvidia、AMD八二分成,國內(nèi)市場中國企業(yè)體量快速增長國際市場上,英偉達、AMD瓜分市場,Jon Peddie Research數(shù)據(jù)顯示2022Q1英偉達占據(jù)79%市場份額,AMD占據(jù)21%。英偉達在獨立GPU領(lǐng)域一枝獨秀,AMD在集成GPU領(lǐng)域可與英偉達競爭。根據(jù)各公司財報,國內(nèi)GPU龍頭企業(yè)景嘉微2022年上半年營業(yè)收入5.44億人民幣,2021年營業(yè)收入10.93億人民幣;2022年上半年海光信息營業(yè)收入為25.3億元,而英偉達2022Q2營收為67億美元,2021年NVIDIA中國區(qū)的營收約為71億美元。相比之下,國產(chǎn)廠商相對規(guī)模暫時較小,未來成長空間廣闊。

poYBAGQGqW2AdbI7AADPQfjBeys108.png

2、國內(nèi)市場:GPU應(yīng)用市場可劃分為—AI和數(shù)據(jù)中心、智能汽車、游戲

1)需求端1—AI

ChatGPT等AI大模型加速對大算力的需求

2022年11月人工智能實驗室 OpenAI 推出了一款A(yù)I對話系統(tǒng)—ChatGPT,ChatGPT模型從 GPT-3.5 系列中的一個模型微調(diào)而成,并在 Azure AI 超級計算基礎(chǔ)設(shè)施上進行訓(xùn)練,能夠進行有邏輯的對話、撰寫代碼、撰寫劇本、糾正錯誤、拒絕不正當?shù)恼埱蟮?,效果超越大眾預(yù)期。這標志著對話類人工智能可以在大范圍、細節(jié)問題上給出較合理準確的答案,并根據(jù)上下文形成一定像人類一樣有邏輯且有創(chuàng) 造力的回答。ChatGPT的優(yōu)化主要來自模型的增大,以及因此帶來的算力增加。GPT、GPT-2和GPT-3(當前開放的版本為GPT-3.5)的參數(shù)量從1.17 億增加到1750億,預(yù)訓(xùn)練數(shù)據(jù)量從5GB增加到45TB,其中GPT-3訓(xùn)練單次的成本就高達460萬美元。

pYYBAGQGqW2AJNTrAAMRqXp_368346.png

大模型算力

數(shù)據(jù)中心和終端場景不斷落地對計算芯片提出更多更高需求

依據(jù)部署位置劃分,AI芯片可以細分為終端芯片和云端芯片,云端芯片市場空間約為終端芯片的2-3倍。云端芯片:云端芯片應(yīng)用于云端服務(wù)器,可以進一步細分為推理芯片和訓(xùn)練芯片。根據(jù)甲子光年數(shù)據(jù),2018年中國云端芯片市場約46.1 億元,該機構(gòu)預(yù)計2023年增長至384.6億元。終端芯片:應(yīng)用于嵌入式、移動終端、智能制造、智能家居等領(lǐng)域的AI芯片,終端芯片需要低功耗和更高的能效比,但是對算力的需求也相對較低,主要應(yīng)用于AI推理。根據(jù)甲子光年數(shù)據(jù),2018年中國終端芯片市場約15億元,該機構(gòu)預(yù)計2023年增長至173億元。

AI芯片總市場232億元,其中云端芯片市場空間更大,預(yù)計終端芯片將隨著AI在多行業(yè)落地將進一步放量。甲子光年預(yù)測,中國AI芯片市場規(guī)模將從2021年232億元增長至2023年的500億元左右,對應(yīng)中國云端芯片市場的復(fù)合增長率為52.8%;終端芯片市場規(guī)模相對較小,但由于人工智能在汽車、安防、智能家居等行業(yè)滲透,屆時市場規(guī)模增長率達到62.2%。

poYBAGQGqW6AFhYtAACBiuk0DW8761.png

中國終端AI芯片市場規(guī)模(億元)

2)需求端2—汽車:汽車智能化浪潮下控制器GPU市場前景廣闊。自動駕駛和智能座艙是智能汽車中具有廣闊前景的方向。蓋世汽車數(shù)據(jù)預(yù)計,2025年自動駕駛域控制器出貨量將達到432萬臺,每臺自動駕駛域控制器配備1-4片高性能計算GPU;智能座艙域控制器出貨量達到528萬臺,絕大多數(shù)智能座艙域控制器配備1片GPU。自動駕駛技術(shù)進一步智能化拉動汽車GPU市場規(guī)模快速擴張。

3)需求端3—游戲:游戲玩家人數(shù)持續(xù)增長,游戲GPU市場穩(wěn)中有升。Newzoo Expert數(shù)據(jù)顯示全球游戲玩家人數(shù)在2021年已達到30.57億人,且預(yù)計2020-2025年全球游戲玩家人數(shù)復(fù)合年增率為4.2%;游戲市場內(nèi),游戲機和PC兩大主體出貨量再創(chuàng)新高,游戲機三大巨頭2021年出貨量高達4008萬臺;2021年Q4全球PC GPU出貨量(包括集成和獨立顯卡)高達11000萬片。

3、國內(nèi)GPU發(fā)展現(xiàn)狀

1)GPU市場規(guī)模逐年增長:據(jù)市場研究公司IDC數(shù)據(jù)顯示,2020年中國GPU市場規(guī)模為92.9億美元,同比增長15.5%。其中游戲、數(shù)據(jù)中心、人工智能等領(lǐng)域是GPU市場的主要需求方。

2)國內(nèi)GPU廠商崛起:中國有多家GPU廠商在市場中嶄露頭角,例如華為、寒武紀、顯現(xiàn)科技、紫光展銳等。這些公司在GPU技術(shù)研發(fā)、產(chǎn)品創(chuàng)新、市場拓展等方面取得了不少成果,并開始在一些領(lǐng)域嶄露頭角。

3)國內(nèi)GPU技術(shù)水平提升:中國在GPU技術(shù)研發(fā)領(lǐng)域也取得了一些成果,例如國產(chǎn)化的GPU服務(wù)器、AI加速卡、圖像處理器等,這些技術(shù)的出現(xiàn)使得國內(nèi)GPU應(yīng)用的范圍進一步擴大。

4)GPU在科研領(lǐng)域的應(yīng)用逐步增多:GPU在科研領(lǐng)域的應(yīng)用逐步增多,例如天河系列超級計算機、中國科學(xué)院的高性能計算平臺等。GPU的應(yīng)用不僅加速了科研進程,也為國家科技創(chuàng)新提供了支撐。

pYYBAGQGqW-AB_WtAAVfv5U7Wd4052.png

總結(jié)

數(shù)字中國建設(shè)是中國國家發(fā)展戰(zhàn)略的一部分,旨在推動數(shù)字化、信息化和網(wǎng)絡(luò)化的全面發(fā)展,提高數(shù)字經(jīng)濟的貢獻率,構(gòu)建數(shù)字社會和數(shù)字政府,加強國家信息安全和網(wǎng)絡(luò)安全等。數(shù)字中國建設(shè)的整體布局規(guī)劃應(yīng)該包括以下幾個方面:

1、建設(shè)數(shù)字基礎(chǔ)設(shè)施:包括建設(shè)高速寬帶網(wǎng)絡(luò)、移動通信網(wǎng)絡(luò)、物聯(lián)網(wǎng)等數(shù)字基礎(chǔ)設(shè)施,提高網(wǎng)絡(luò)帶寬和速度,實現(xiàn)全國覆蓋。

2、推進數(shù)字產(chǎn)業(yè)發(fā)展:包括培育數(shù)字經(jīng)濟新業(yè)態(tài),加強數(shù)字產(chǎn)業(yè)集聚區(qū)建設(shè),促進數(shù)字化轉(zhuǎn)型,提高數(shù)字產(chǎn)業(yè)的國際競爭力。

3、構(gòu)建數(shù)字社會:加強數(shù)字技術(shù)與社會發(fā)展的融合,建立數(shù)字健康、數(shù)字教育、數(shù)字文化等數(shù)字社會基礎(chǔ)設(shè)施,提高人民群眾的數(shù)字素養(yǎng)和數(shù)字生活質(zhì)量。

4、推進數(shù)字政府建設(shè):通過建設(shè)數(shù)字政府平臺、數(shù)字化行政審批、電子政務(wù)等手段,提高政府工作效率和公共服務(wù)水平,推進政府治理現(xiàn)代化。

5、加強信息安全和網(wǎng)絡(luò)安全:建設(shè)信息安全和網(wǎng)絡(luò)安全的法律制度體系,強化網(wǎng)絡(luò)空間安全管理,提高信息安全和網(wǎng)絡(luò)安全能力。

通過數(shù)字中國建設(shè)的整體布局規(guī)劃,可以實現(xiàn)數(shù)字化、信息化和網(wǎng)絡(luò)化的全面發(fā)展,加速數(shù)字經(jīng)濟的發(fā)展,提高社會生產(chǎn)力和國家綜合實力。此外,ChatGPT可以通過學(xué)習(xí)數(shù)字中國建設(shè)的整體布局規(guī)劃,深入了解數(shù)字技術(shù)在國家戰(zhàn)略和社會發(fā)展中的應(yīng)用,從而提高對數(shù)字經(jīng)濟、數(shù)字社會、數(shù)字政府等領(lǐng)域的理解和認知,為未來發(fā)展提供更加全面和深入的思路和支持。

審核編輯黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • amd
    amd
    +關(guān)注

    關(guān)注

    25

    文章

    5586

    瀏覽量

    136326
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    49008

    瀏覽量

    249314
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5561

    瀏覽量

    122785
  • npl
    npl
    +關(guān)注

    關(guān)注

    0

    文章

    5

    瀏覽量

    2467
  • ChatGPT
    +關(guān)注

    關(guān)注

    29

    文章

    1589

    瀏覽量

    9087
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    科技大廠競逐AIGC,中國ChatGPT在哪?

    。 圖源:OpenAI官網(wǎng) 中國AI水平與ChatGPT有多大的差距?中國如何訓(xùn)練出這樣的GPT大模型?難點又在哪里? ChatGPT是AIGC的一種實現(xiàn)。在AIGC的大模型
    發(fā)表于 03-03 14:28

    紫光集團從“芯”到“云”戰(zhàn)略布局,助推數(shù)字中國建設(shè)

    2018年4月22日——首屆數(shù)字中國建設(shè)成果峰會在福建省福州市福州海峽國際會展中心盛大開幕。紫光集團作為中國最大的綜合性集成電路企業(yè),以“從芯到云 紫光芯 ? 強國夢”為主題,攜“芯”、“云”系列成果受邀參加首屆
    的頭像 發(fā)表于 04-24 10:58 ?5657次閱讀

    數(shù)字中國建設(shè)峰會開幕,百度亮出科研成果

    首屆數(shù)字中國建設(shè)峰會將在福建省福州市舉行。作為峰會的重要組成部分,首屆數(shù)字中國建設(shè)峰會成果展覽會率先拉開帷幕,展覽會集中展示十八大以來數(shù)字
    發(fā)表于 06-11 02:27 ?2012次閱讀

    軟件定義存儲助力數(shù)字中國建設(shè)

    2021年初發(fā)布的“十四五”規(guī)劃綱要中提出:“迎接數(shù)字時代,激活數(shù)據(jù)要素潛能,推進網(wǎng)絡(luò)強國建設(shè),加快建設(shè)數(shù)字經(jīng)濟、
    發(fā)表于 05-27 14:13 ?438次閱讀
    軟件定義存儲助力<b class='flag-5'>數(shù)字</b><b class='flag-5'>中國建設(shè)</b>

    中興通訊正持續(xù)推動數(shù)字中國建設(shè)

    以“創(chuàng)新驅(qū)動新變革,數(shù)字引領(lǐng)新格局”為主題的第五屆數(shù)字中國建設(shè)峰會在福州舉行。中興通訊作為數(shù)字經(jīng)濟筑路者,正持續(xù)推動數(shù)字
    的頭像 發(fā)表于 07-25 11:43 ?3163次閱讀

    數(shù)字中國建設(shè)整體布局規(guī)劃印發(fā) 做強做優(yōu)做大數(shù)字經(jīng)濟

    據(jù)新華社報道,《數(shù)字中國建設(shè)整體布局規(guī)劃》正式印發(fā),要求各地區(qū)各部門結(jié)合實際認真貫徹落實。 《規(guī)劃
    的頭像 發(fā)表于 02-28 13:49 ?1117次閱讀

    航天宏圖以數(shù)字鄉(xiāng)村架構(gòu)體系探索踐行數(shù)字中國建設(shè)

    鄉(xiāng)村是鄉(xiāng)村振興的戰(zhàn)略方向之一,也是建設(shè)數(shù)字中國的重要內(nèi)容。 由于城鄉(xiāng)“數(shù)字鴻溝”的存在,農(nóng)村地區(qū)的數(shù)字
    的頭像 發(fā)表于 02-28 15:13 ?2379次閱讀

    數(shù)字中國升級為國策!IoT產(chǎn)業(yè)細分賽道迎來黃金期-IOTE物聯(lián)網(wǎng)展

    近日,中共中央、國務(wù)院印發(fā)了《數(shù)字中國建設(shè)整體布局規(guī)劃》(以下簡稱《規(guī)劃》),對
    的頭像 發(fā)表于 03-01 09:02 ?840次閱讀
    <b class='flag-5'>數(shù)字</b><b class='flag-5'>中國</b>升級為國策!IoT產(chǎn)業(yè)細分賽道迎來黃金期-IOTE物聯(lián)網(wǎng)展

    王春暉解讀《數(shù)字中國建設(shè)整體布局規(guī)劃

    其次,構(gòu)建數(shù)據(jù)資源體系,主要是統(tǒng)籌和建立國家公共數(shù)據(jù)資源體系。國家公共數(shù)據(jù)資源體系的建設(shè)應(yīng)當遵循五項原則,即統(tǒng)籌規(guī)劃、需求導(dǎo)向、分類分級、統(tǒng)一標準、規(guī)范應(yīng)用、安全有序。
    的頭像 發(fā)表于 03-08 10:08 ?785次閱讀

    4月26日飛騰亮相第六屆數(shù)字中國建設(shè)峰會

    式現(xiàn)代化” 為主題,以宣傳貫徹落實《規(guī)劃》為主線,設(shè)置了 “1+3+N” 的系列活動,旨在展示數(shù)字中國建設(shè)最新成果,分享發(fā)展經(jīng)驗,進一步加快數(shù)字中國
    的頭像 發(fā)表于 04-25 18:05 ?1074次閱讀

    西「景」洞察丨《關(guān)于落實數(shù)字中國建設(shè)總體部署,加快推動智慧民航建設(shè)發(fā)展的指導(dǎo)意見》

    日前,中國民用航空局發(fā)布 《關(guān)于落實數(shù)字中國建設(shè)總體部署加快推動智慧民航建設(shè)發(fā)展的指導(dǎo)意見》 (以下簡稱《指導(dǎo)意見》)?!吨笇?dǎo)意見》是中國
    的頭像 發(fā)表于 07-21 18:25 ?1359次閱讀
    西「景」洞察丨《關(guān)于落實<b class='flag-5'>數(shù)字</b><b class='flag-5'>中國建設(shè)</b>總體部署,加快推動智慧民航<b class='flag-5'>建設(shè)</b>發(fā)展的指導(dǎo)意見》

    元宇宙與AI加速推進數(shù)字中國建設(shè),需關(guān)注降本增效

    黨的二十大以來,發(fā)展數(shù)字經(jīng)濟和建設(shè)數(shù)字中國被反復(fù)提及。在今年全國兩會召開前夕,中共中央、國務(wù)院印發(fā)《數(shù)字
    的頭像 發(fā)表于 11-15 17:09 ?827次閱讀

    中興通訊亮相第七屆數(shù)字中國建設(shè)峰會

    第七屆數(shù)字中國建設(shè)峰會在福州拉開帷幕,峰會以“釋放數(shù)據(jù)要素價值,發(fā)展新質(zhì)生產(chǎn)力”為主題,展示數(shù)字成果、探索未來方向,推進數(shù)字中國建設(shè)。
    的頭像 發(fā)表于 10-15 10:43 ?799次閱讀

    誠邁科技助力數(shù)字中國建設(shè)

    第七屆數(shù)字中國建設(shè)峰會及第四屆中國國際數(shù)字產(chǎn)品博覽會在福州盛大舉行。誠邁科技亮相大會,全面展示了助力數(shù)字
    的頭像 發(fā)表于 11-06 16:32 ?682次閱讀

    中科曙光亮相第八屆數(shù)字中國建設(shè)峰會

    日前,第八屆數(shù)字中國建設(shè)峰會在福州召開,來自政、商、學(xué)界的專家、學(xué)者、嘉賓齊聚一堂,共同謀劃數(shù)字中國建設(shè)發(fā)展。中科曙光始終以基礎(chǔ)設(shè)施建設(shè)為支
    的頭像 發(fā)表于 05-06 15:15 ?367次閱讀