一、GPT-4正式發(fā)布,多模態(tài)能力帶來更多應(yīng)用想象
1.1、OpenAI發(fā)布GPT-4,能力全面升級
GPT-4 正式發(fā)布,性能全面升級。2023 年 3 月 15 日凌晨,OpenAI 正式發(fā)布了 GPT-4 預(yù)訓(xùn)練大 模型,相比于 GPT-3.5 模型進(jìn)行了全方位的升級。實(shí)際上在半年前 OpenAI 就已經(jīng)完成了 GPT-4 的模型,隨后又采用對抗性測試對 GPT-4 進(jìn)行了 6 個(gè)月的迭代調(diào)整,保證其在真實(shí)性、可操作性 和安全方面達(dá)到最好。GPT-4 仍為 Transformer 架構(gòu)的預(yù)訓(xùn)練模型,與 ChatGPT 類似,同樣采用 了基于人類反饋的強(qiáng)化學(xué)習(xí)(RLHF)方法,在一些專業(yè)和學(xué)術(shù)領(lǐng)域上已經(jīng)達(dá)到了人類水平,是 OpenAI 在人工智能領(lǐng)域的又一里程碑。
GPT-4 相比 GPT-3.5 具有四方面的能力提升:1) GPT-4 具有一定的多模態(tài)能力,能夠進(jìn)行圖文結(jié)合輸入的分析。GPT-4 是一個(gè)多模態(tài)模型, 它能夠接受圖片和文本輸入,并輸出文本回復(fù),相比 GPT-3.5 增加了對圖像模態(tài)的分析推理 能力。與業(yè)界之前的預(yù)測不同,GPT-4 并不具備多模態(tài)的生成能力,即無法從文本輸入中得 到圖片(類似于 DALL-E),只能對圖片的輸入進(jìn)行分析,并且圖片輸入目前仍處于研究預(yù) 覽階段,還未對公眾開放。根據(jù) OpenAI 顯示,GPT-4 對圖片的處理分析能力達(dá)到了很高的 水準(zhǔn),這相當(dāng)于機(jī)器擁有了視覺并且能夠進(jìn)行思考,在應(yīng)用層面有非常廣的空間。比如,完 全可以成為視力障礙人群的眼睛,給出題目的圖片能夠直接進(jìn)行解題步驟的輸出等,在教育 領(lǐng)域有廣泛的落地場景。
2) GPT-4 在復(fù)雜專業(yè)領(lǐng)域的性能表現(xiàn)大幅超過 GPT-3.5 和當(dāng)下的 SOTA 大模型。據(jù) OpenAI 顯示,GPT-4 和 GPT-3.5 在一些普通的談話測試中的性能區(qū)別不大,但是在處理較為復(fù)雜 和專業(yè)的任務(wù)上,GPT-4 相比 GPT-3.5 則表現(xiàn)更優(yōu)。在美國律師資格考試測試中,GPT-4 的成績可以達(dá)到前 10%,而 GPT-3.5 只能達(dá)到后 10%的水平。與 SOTA 模型(state-of-theart model,目前最好的模型)相比,GPT-4 也展現(xiàn)出了更好的性能。
3) GPT-4 能夠處理更長的文本,具有更好的創(chuàng)作能力和邏輯推理能力。ChatGPT 處理的文本 字?jǐn)?shù)上限為 3000 字,而 GPT-4 可以處理超過 25000 字的長文本,支持內(nèi)容創(chuàng)作、對話拓展 和文檔分析等功能。在創(chuàng)造性方面,GPT-4 可以輔助用戶進(jìn)行生成、處理和迭代創(chuàng)意工作, 例如創(chuàng)作歌曲、編寫劇本或?qū)W習(xí)用戶的寫作風(fēng)格。與 ChatGPT 相比,GPT-4 的邏輯推理能 力更進(jìn)一步,在復(fù)雜的推理問題中表現(xiàn)更佳。4) GPT-4 支持用戶自定義 AI 的對話風(fēng)格。在 OpenAI 的開發(fā)者直播中可以初步窺視 GPT-4 的 頁面布局,用戶可以左側(cè)的 System 欄中輸入命令來定義 GPT-4 的交互對話風(fēng)格,而不是像 ChatGPT 一樣只有一種風(fēng)格。我們認(rèn)為,自定義 AI 對話風(fēng)格對于基于 GPT-4 的二次開發(fā)應(yīng) 用來說是非常方便的,開發(fā)者可以輕松地創(chuàng)造出具有個(gè)人獨(dú)特風(fēng)格的 AI 應(yīng)用。
GPT-4 已開放給 ChatGPT Plus 用戶使用,并且開放了 GPT-4 API 使用申請,使用成本大幅提 升。據(jù) OpenAI 顯示,目前僅有 ChatGPT Plus 的訂閱會員用戶能夠訪問 GPT-4,但存在容量上 限,OpenAI 會對此進(jìn)行持續(xù)擴(kuò)展和優(yōu)化,未來可能會推出免費(fèi)的 GPT-4 試用版和更高級的訂閱 版本以供用戶獲得更多的使用容量。OpenAI 同時(shí)開放了 GPT-4 API 的使用申請,開發(fā)者可以申 請進(jìn)入 GPT-4 API 的等待列表,OpenAI 會逐步邀請開發(fā)人員開始試用 API。目前提供給開發(fā)者 的 API 只能進(jìn)行文本的輸入,分為 8k 和 32k token 兩個(gè)版本,最便宜的 8k-prompt 版本的定價(jià)為 0.03 美元/1k tokens,相比于之前發(fā)布的 GPT-3.5-turbo 的 0.002 美元/1k tokens 要貴十倍以上。
1.2、GPT-4有望帶來多場景智能化升級
GPT-4 已在多領(lǐng)域落地,微軟官宣證實(shí) New Bing 背后的大模型就是 GPT-4。伴隨著 GPT-4 的 發(fā)布,OpenAI 也給出了 GPT-4 的 6 個(gè)應(yīng)用實(shí)例,涵蓋了教育、金融和政府領(lǐng)域。例如在 Duolingo 里加入 AI 與用戶進(jìn)行日常聊天,加速用戶對語言的學(xué)習(xí);摩根士丹利采用 GPT-4 來對 其知識庫進(jìn)行管理,幫助員工快速訪問想要的內(nèi)容。微軟也在 GPT-4 發(fā)布后官宣,New Bing 背 后的模型就是 GPT-4,并且將隨著 GPT-4 的更新持續(xù)迭代。我們在之前的報(bào)告中已多次提到,大 模型的能力將對產(chǎn)業(yè)智能化帶來重大影響。隨著 GPT-4 的發(fā)布以及性能飛躍,大模型在各領(lǐng)域有 望迎來進(jìn)一步的落地應(yīng)用。考慮到其對話交互的特性,我們看好 GPT-4 在如下幾個(gè)領(lǐng)域的應(yīng)用。
1) 教育場景:GPT-4的自定義AI風(fēng)格能力與其連續(xù)對話交互能力與教育場景十分契合,對不 同性格的學(xué)生采用不同風(fēng)格的AI作為虛擬導(dǎo)師,回答學(xué)生的問題、提供個(gè)性化的學(xué)習(xí)建議 和教育資源、分析學(xué)生的學(xué)習(xí)進(jìn)展等,達(dá)成對學(xué)生進(jìn)行個(gè)性化教育的目標(biāo),使得每個(gè)學(xué)生都 能以最大化的效率進(jìn)行學(xué)習(xí)。此外GPT-4還能作為教師的輔助教學(xué)工具,幫助教師更好地 管理教學(xué)過程和學(xué)生。例如,教師可以使用 AI 來分析學(xué)生的學(xué)習(xí)數(shù)據(jù),針對不同的學(xué)生制 定更加個(gè)性化的教學(xué)計(jì)劃和評估學(xué)生的學(xué)習(xí)成果。GPT-4的圖片分析能力還能夠輔助教學(xué)過 程中的閱卷工作,實(shí)現(xiàn)對主觀題的評分,減輕教師工作負(fù)擔(dān),提高閱卷的公正性與準(zhǔn)確性。
2) 醫(yī)療場景:GPT-4 豐富的專業(yè)知識使其能夠做好輔助診斷的工作,通過分析醫(yī)療記錄、病歷 資料、診斷報(bào)告等數(shù)據(jù),提供有關(guān)疾病診斷、治療方案和藥物處方等方面的建議和指導(dǎo),幫 助醫(yī)生更加準(zhǔn)確地診斷和治療疾病,提高醫(yī)療質(zhì)量和治療效果。在醫(yī)學(xué)影像領(lǐng)域,GPT-4 新 增的圖片分析能力也可以用于CT等圖像的診斷,智能標(biāo)記出存在癥狀的圖像區(qū)域。將GPT4 與可穿戴設(shè)備結(jié)合,可實(shí)現(xiàn)對重癥患者的全天候健康監(jiān)測,進(jìn)行實(shí)時(shí)健康風(fēng)險(xiǎn)評估,幫助 患者做好健康管理等。
3) 企業(yè)經(jīng)營管理辦公場景:GPT-4 的對話交互特性與邏輯分析能力可以助力企業(yè)經(jīng)營管理辦公 全流程的效率提升。在企業(yè)的 OA 系統(tǒng)中,GPT-4 可以輔助員工快速智能地進(jìn)行流程辦理;在企業(yè) ERP 系統(tǒng)中,GPT-4 可以通過數(shù)據(jù)分析來輔助企業(yè)進(jìn)行經(jīng)營決策;在辦公環(huán)節(jié), GPT-4 的長文本理解能力有望對會議、文檔和郵箱場景帶來效率提升。4) 工業(yè)設(shè)計(jì)場景:GPT-4 在復(fù)雜專業(yè)領(lǐng)域的性能以及其多模態(tài)分析能力可以成為良好的工業(yè)設(shè) 計(jì)輔助工具。例如在 CAD、CAE、EDA 等工業(yè)設(shè)計(jì)軟件領(lǐng)域,GPT-4 可以作為其中的插件 來進(jìn)行模型的輔助設(shè)計(jì)、圖紙生成等。清華大學(xué)土木工程系的陸新征課題組已經(jīng)將生成對抗 網(wǎng)絡(luò)技術(shù)應(yīng)用到了結(jié)構(gòu)設(shè)計(jì)中,能夠自動為剪力墻進(jìn)行配筋,結(jié)果基本和普通的結(jié)構(gòu)設(shè)計(jì)軟 件給出的配筋結(jié)果一致。能力更強(qiáng)的大模型在這方面的應(yīng)用更加值得期待。
二、百度發(fā)布會召開,文心生態(tài)圈持續(xù)擴(kuò)大
2.1、“文心一言”正式發(fā)布,具備多模態(tài)能力
百度的對話式大模型“文心一言”正式發(fā)布。3 月 16 日下午,百度 CEO 李彥宏在發(fā)布會上正式 揭開了“文心一言”的面紗?!拔男囊谎浴笔前俣刃乱淮R增強(qiáng)大語言模型,它基于百度 ERNIE 及 PLATO 系列模型的基礎(chǔ)進(jìn)行研發(fā),其大模型的訓(xùn)練數(shù)據(jù)包括萬億級網(wǎng)頁數(shù)據(jù)、數(shù)十億的搜索數(shù)據(jù)和圖片數(shù)據(jù)、百億級的語音日均調(diào)用數(shù)據(jù),以及5500億事實(shí)的知識圖譜等。李彥宏表 示,雖然“文心一言”的實(shí)際能力還并不完美,但希望通過發(fā)布后的真實(shí)用戶反饋來幫助大模型 快速迭代,加速模型能力的提升。
“文心一言”具備五大能力:1) 文學(xué)創(chuàng)作:發(fā)布會現(xiàn)場以《三體》為例,“文心一言”能夠?qū)Α度w》進(jìn)行續(xù)寫,并能回答 事實(shí)相關(guān)問題,體現(xiàn)出了強(qiáng)大的總結(jié)分析與推理能力。2) 商業(yè)文案創(chuàng)作:“文心一言”能夠?yàn)?a target="_blank">公司起名提供創(chuàng)意,并能直接進(jìn)行商業(yè)新聞稿的創(chuàng)作, 展現(xiàn)了模型的理解表達(dá)與創(chuàng)作能力。3) 數(shù)理邏輯推算:“文心一言”能夠看出題目本身存在的錯誤,并能給出正確題目的解題步驟, 具備較強(qiáng)的數(shù)理邏輯能力。4) 中文理解:“文心一言”基于大量中文語料進(jìn)行訓(xùn)練,能夠解釋“洛陽紙貴”背后的經(jīng)濟(jì)學(xué) 原理,并能寫出藏頭詩,展現(xiàn)了對中文的強(qiáng)大理解能力。5) 多模態(tài)生成能力:“文心一言”可以輸入文字生成圖像、音頻和視頻,并支持多種方言生成。文字生成視頻的能力現(xiàn)階段還未對外開放,但百度旗下的百家號已經(jīng)在使用這項(xiàng)技術(shù)。
“文心一言”的多模態(tài)生成能力亮眼,多模態(tài)是未來大模型的發(fā)展趨勢。從“文心一言”現(xiàn)場演 示的幾大功能來看,最為亮眼的當(dāng)屬其多模態(tài)的生成能力,能夠支持圖像、音頻和視頻多種模態(tài) 內(nèi)容的生成,而 OpenAI 的 GPT-4 目前還沒有多模態(tài)的生成能力,在應(yīng)用領(lǐng)域?qū)懈鼜V闊的的 空間。我們認(rèn)為,多模態(tài)是未來 AI 大模型的發(fā)展趨勢,隨著百度多模態(tài)統(tǒng)一大模型的能力增強(qiáng), “文心一言”的多模態(tài)生成能力也會不斷提升。
“文心一言”是新一代知識增強(qiáng)大語言模型,具有六大核心基礎(chǔ)模塊。百度 CTO 王海峰提到, “文心一言”與別的大語言模型相比,除了有監(jiān)督精調(diào)(Supervised Fine-Tune)、人類反饋的 強(qiáng)化學(xué)習(xí)(RLHF)、提示(Prompt)這三項(xiàng)大模型均會采用的基礎(chǔ)訓(xùn)練模塊外,增加了三項(xiàng)具 有百度特色的核心基礎(chǔ)模塊:知識增強(qiáng)、檢索增強(qiáng)、對話增強(qiáng),充分利用了百度旗下的百度知識 圖譜和百度搜索引擎等產(chǎn)品的能力。
1) 知識增強(qiáng):“文心一言”的知識增強(qiáng)主要是通過知識內(nèi)化和知識外用兩種方式。知識內(nèi)化是 從大規(guī)模知識和無標(biāo)注數(shù)據(jù)中,基于語義單元學(xué)習(xí),利用知識構(gòu)造訓(xùn)練數(shù)據(jù),將知識學(xué)習(xí)到 模型參數(shù)中;知識外用,是引入外部多源異構(gòu)知識,做知識推理、提示構(gòu)建等等。2) 檢索增強(qiáng):“文心一言”的檢索增強(qiáng),來自以語義理解與語義匹配為核心技術(shù)的新一代搜索 架構(gòu)。通過引入搜索結(jié)果,可以為大模型提供時(shí)效性強(qiáng)、準(zhǔn)確率高的參考信息,更好地滿足 用戶需求。3) 對話增強(qiáng):基于對話技術(shù)和應(yīng)用積累,“文心一言”具備記憶機(jī)制、上下文理解和對話規(guī)劃 能力,實(shí)現(xiàn)更好的對話連貫性、合理性和邏輯性。
2.2、文心生態(tài)圈持續(xù)擴(kuò)大,大模型帶來新的產(chǎn)業(yè)機(jī)會
“文心一言”生態(tài)圈已加入650家企業(yè),落地場景涵蓋各行各業(yè)。李彥宏在發(fā)布會上宣布,已有 650 家企業(yè)首批接入了“文心一言”,涵蓋了互聯(lián)網(wǎng)、媒體、金融、保險(xiǎn)、汽車、企業(yè)軟件等行 業(yè),百度大模型在 B端的生態(tài)圈迅速擴(kuò)大。我們認(rèn)為,隨著“文心一言”的首批生態(tài)企業(yè)應(yīng)用逐 步落地,百度將建立起開發(fā)者及用戶調(diào)用和模型迭代之間的飛輪,加速構(gòu)建開放繁榮的技術(shù)生態(tài), 在推動公司增長的同時(shí),也對中國生成式 AI 的發(fā)展帶來了巨大的促進(jìn)作用。
“文心一言”將在 3 月 27 日正式開放,大模型的發(fā)展將帶來三大產(chǎn)業(yè)機(jī)會?!拔男囊谎浴蹦壳?仍處于邀請制內(nèi)測階段,百度智能云官方宣布將于 3 月 27 日召開發(fā)布會,屆時(shí)“文心一言”將正 式向大眾開放。李彥宏在“文心一言”發(fā)布會上預(yù)測,大模型的發(fā)展有望帶來三大產(chǎn)業(yè)機(jī)會:新型云計(jì)算、行業(yè)模型精調(diào)和應(yīng)用開發(fā)。我們在之前的報(bào)告《文心一言發(fā)布在即,大模型有望引領(lǐng) 產(chǎn)業(yè)智能化變革》也有展望過,MaaS 未來將有望成為大模型落地的新形態(tài),通過模型蒸餾技術(shù) 將大模型“瘦身”成為垂直行業(yè)模型,能夠大大降低模型搭建的成本。我們認(rèn)為,隨著“文心一 言”的發(fā)布,基于大模型的垂直場景化模型以及基于垂直模型的應(yīng)用開發(fā)將會快速增加,AI 市場 有望迎來需求的大幅增長。
百度具有人工智能全棧布局,長期的技術(shù)積累和生態(tài)優(yōu)勢助力百度成為國內(nèi)對話式大模型先行者?;谒阉饕孢@一天然的自然語言理解與處理的入口,百度從誕生開始就逐漸在NLP、語義理解方面進(jìn)行持續(xù)的技術(shù)積累。過去數(shù)十年,百度深耕人工智能領(lǐng)域,目前已經(jīng)擁有芯片、框架、模型和應(yīng)用四層技術(shù)棧,文心大模型自2019年推出以來也歷經(jīng)了多次迭代,目前已經(jīng)具備較強(qiáng)的泛化能力與性能。良好的技術(shù)儲備與自身的生態(tài)優(yōu)勢使得百度成為了國內(nèi)對話式大模型的先行者,我們也十分看好“文心一言”發(fā)布后在各個(gè)產(chǎn)業(yè)中的落地應(yīng)用。
三、微軟和英偉達(dá)相繼召開發(fā)布會,AI應(yīng)用廣泛落地
3.1、微軟推出Microsoft 365 Copilot,辦公場景根本性變革
微軟宣布 Microsoft 365 服務(wù)全面接入 AI 驅(qū)動工具 Copilot。3 月 16 日晚,微軟在“The Future Work with AI”發(fā)布會上宣布將人工智能大語言模型技術(shù)(LLM)引入 Office 應(yīng)用程序,推出了 AI 助手——Microsoft 365 Copilot,幫助用戶提高辦公生產(chǎn)力。該 AI 助手由 OpenAI 的 GPT-4 技術(shù) 驅(qū)動,出現(xiàn)在 Microsoft 365 應(yīng)用的側(cè)邊欄,可以作為一個(gè)聊天機(jī)器人隨時(shí)召喚,帶來更智能、更 高效的辦公體驗(yàn)。微軟 CEO 表示,Copilot 的核心特點(diǎn)是通過自然語言理解用戶的需求提供更加 個(gè)性化的服務(wù),基于自然語言技術(shù)將大模型、用戶數(shù)據(jù)和應(yīng)用結(jié)合起來。
Copilot 打通微軟辦公產(chǎn)品線,數(shù)據(jù)在各個(gè)產(chǎn)品中自由流通。Microsoft 365 Copilot 將大語言模型 的能力與儲存在 Microsoft Graph 中的數(shù)據(jù)如郵件、文檔、會議、日程、聊天等以及 Word、Excel、 PowerPoint、Teams、Outlook 等辦公產(chǎn)品全部聯(lián)系到一起,通過四個(gè)步驟將用戶的文本命令輸 入轉(zhuǎn)化為應(yīng)用層的執(zhí)行。Copilot 以迭代的方式來處理和編排這一系列流程服務(wù),形成了集合大模 型、用戶數(shù)據(jù)和應(yīng)用的 Copilot System,實(shí)現(xiàn)了多種令人驚嘆的功能。
1) 第一步:用戶在辦公產(chǎn)品端通過文本輸入 prompt,Copilot 接收用戶的 prompt,并通過 Grounding 技術(shù)對 prompt 進(jìn)行預(yù)處理,其核心是調(diào)用 Microsoft Graph 來檢索與此 prompt 相關(guān)的業(yè)務(wù)內(nèi)容背景信息,并基于這些信息對 Prompt 進(jìn)行修改;2) 第二步:Copilot 將修改后的 prompt 發(fā)送給大語言模型 LLM;3) 第三步:Copilot 獲取到 LLM 對 prompt 產(chǎn)生的回應(yīng),并再次通過 Grounding 技術(shù)對回應(yīng)進(jìn)行 后處理,包括額外的圖形調(diào)用、對 AI 生成結(jié)果的安全性、合規(guī)性檢查等,并生成對應(yīng)用的 調(diào)用命令;4) 第四步:Copilot 向用戶發(fā)送最終回復(fù)和對應(yīng)用程序的調(diào)用命令。
Copilot 與 Microsoft 365 應(yīng)用緊密集成。微軟將 AI 助手 Copilot 與 Word、Excel、PowerPoint、 Outlook、Teams 等產(chǎn)品緊密結(jié)合,成為高效的生產(chǎn)力工具。用戶可以用 Copilot 實(shí)現(xiàn)在 Word 中 生成文稿,為 PPT 增加圖片和動畫效果,在 Excel 里分析用戶輸入的數(shù)據(jù)并將結(jié)果生成可視化圖 表,幫助 Outlook 進(jìn)行郵件管理和智能生成回復(fù),在 Teams 里進(jìn)行會議實(shí)時(shí)總結(jié)和會議紀(jì)要生成 等功能,甚至可以在不同的產(chǎn)品應(yīng)用間進(jìn)行格式轉(zhuǎn)換,例如要求其根據(jù)給定的 Word 文檔創(chuàng)建 PPT,極大地提高了用戶在辦公場景的效率。
Business Chat 功能將數(shù)據(jù)轉(zhuǎn)化為知識,大幅提升辦公效率。Copilot 提供了 Business Chat 功能, 橫跨了所有的數(shù)據(jù)和應(yīng)用,用 Microsoft Graph 將來自文檔、PPT、電子郵件、日歷、便箋和聯(lián)系 人等的數(shù)據(jù)匯集在一起。比如可以直接通過與客戶的聊天、郵件、日歷等信息進(jìn)行總結(jié),按照 A 文件的格式編寫包含 B 計(jì)劃的時(shí)間表并給相關(guān)聯(lián)系人發(fā)送郵件等。同時(shí),團(tuán)隊(duì)中的每個(gè)人都可以 在同一個(gè)Chat頁面上共同進(jìn)行業(yè)務(wù)的推進(jìn),比如在員工 A 創(chuàng)建了文檔后,員工B可以直接命令Copilot對文檔進(jìn)行修改,實(shí)現(xiàn)了協(xié)同辦公效率的大幅提升。
Copilot 作為流程編排引擎驅(qū)動流程自動化與業(yè)務(wù)應(yīng)用開發(fā)的 AI 變革。微軟將 Copilot 也接入到 了旗下的低代碼開發(fā)平臺 Power Platform 中,用戶可以在 Power Apps、Power Virtual Agents 和 Power Automate 中用自然語言描述他們想要的應(yīng)用、功能和流程,Copilot 可以在幾秒鐘內(nèi)完成 應(yīng)用和流程的創(chuàng)建,并提供改進(jìn)的建議。在 2022 年 10 月上線的預(yù)覽版 Power Automate 中,采 用了 AI 驅(qū)動的流程自動化創(chuàng)建能夠節(jié)省約 50%的時(shí)間,大幅提高了業(yè)務(wù)工作效率。
3.2、英偉達(dá)GTC 2023召開,展現(xiàn)AI多領(lǐng)域應(yīng)用
英偉達(dá) GTC 2023 正式召開,展現(xiàn) AI、加速計(jì)算及其他領(lǐng)域的突破性進(jìn)展。北京時(shí)間 3 月 21 日 晚,英偉達(dá) CEO 黃仁勛為 GTC 2023 進(jìn)行了主題演講,對英偉達(dá)在 AI 應(yīng)用、加速計(jì)算等軟硬件 領(lǐng)域取得的新進(jìn)展進(jìn)行了介紹。經(jīng)過幾十年的經(jīng)營,英偉達(dá)不僅成為了全球領(lǐng)先的 AI 算力提供商, 也構(gòu)建了一套圍繞著實(shí)際產(chǎn)業(yè)運(yùn)轉(zhuǎn)的 AI 應(yīng)用生態(tài),在自然科學(xué)、化學(xué)制藥、視覺解析、數(shù)據(jù)處理、 機(jī)器學(xué)習(xí)和大模型領(lǐng)域成為不可或缺的一環(huán)。
AI 產(chǎn)業(yè)迎來“iPhone”時(shí)刻,英偉達(dá)聯(lián)手云廠商推出 DGX 云服務(wù)。黃仁勛在演講中多次表示, AI 產(chǎn)業(yè)正處于“iPhone”時(shí)刻,生成式 AI 技術(shù)的快速進(jìn)步引發(fā)了全球企業(yè)對 AI 戰(zhàn)略制定的緊迫 感。為了方便企業(yè)客戶更快地訪問英偉達(dá) AI 算力與應(yīng)用庫,黃仁勛在演講中宣布英偉達(dá)將與微軟 Azure、谷歌云、Oracle OCI 合作,推出英偉達(dá) DGX 云服務(wù)。這一合作將英偉達(dá)的生態(tài)系統(tǒng)引入 了云服務(wù)廠商,極大地?cái)U(kuò)展了英偉達(dá)的觸及范圍。這意味著當(dāng)下性能最佳的 DGX AI 超級計(jì)算機(jī) 將成為能夠提供多租戶的云服務(wù)設(shè)施,一眾試圖訓(xùn)練自營大語言模型、圖片模型的企業(yè),將能直 接通過云服務(wù)快速實(shí)現(xiàn)自己的愿景。目前已有 50 余家企業(yè)客戶已經(jīng)開始使用 DGX 云服務(wù),涵蓋 了醫(yī)療、媒體、金融等多個(gè)行業(yè)領(lǐng)域。
生成式 AI 將重塑幾乎所有行業(yè),行業(yè)模型有望成為未來大趨勢。生成式 AI 是一種新型的計(jì)算平 臺,與 PC、互聯(lián)網(wǎng)、移動設(shè)備和云誕生的時(shí)代類似,先行者們已經(jīng)在利用生成式 AI 打造新的應(yīng) 用,利用其智能自動化和協(xié)同創(chuàng)作能力來改變傳統(tǒng)的行業(yè)運(yùn)行模式。對于某些具有較高專業(yè)性的 領(lǐng)域比如醫(yī)療、藥物等行業(yè),可能需要用專屬的行業(yè)數(shù)據(jù)來構(gòu)建定制化的行業(yè)模型,以滿足該行 業(yè)的特定要求。我們在之前的報(bào)告《文心一言發(fā)布在即,大模型有望引領(lǐng)產(chǎn)業(yè)智能化變革》也有 展望過,通過模型蒸餾技術(shù)將大模型“瘦身”成為垂直行業(yè)模型,能夠大大降低模型搭建的成本, MaaS 在未來將有望成為大模型落地的新形態(tài)。
英偉達(dá)推出 AI Foundations 云服務(wù),提供從建立模型到上線運(yùn)營的全套服務(wù)。對想要建立獨(dú)有 的垂直領(lǐng)域行業(yè)模型的客戶,英偉達(dá)推出了 AI Foundations 一站式云服務(wù),從模型的構(gòu)建到生成 應(yīng)用上線,英偉達(dá)就類似于芯片行業(yè)的臺積電,成為了生成式 AI 領(lǐng)域的代工廠,協(xié)助客戶快速構(gòu) 建、優(yōu)化和運(yùn)營大模型,把制造大模型的能力傳遞到每一個(gè)用戶。英偉達(dá) AI Foundations 由三個(gè) 部分組成:
1) NEMO:NEMO 是用于自然語言文本的生成式模型,提供 80 億、430 億、5300 億參數(shù)的 GPT 模型,客戶也可以引入自己想要的模型。Nemo 會定期更新額外的訓(xùn)練數(shù)據(jù),可以幫助 企業(yè)為客服、企業(yè)搜索、文檔處理、市場分析等場景定制生產(chǎn)生成式 AI 模型。2) PICASSO:PICASSO 是一項(xiàng)視覺語言模型的制作服務(wù),可以用于訓(xùn)練能夠生成圖像、視頻 和 3D 素材的模型??蛻艨梢曰谟ミ_(dá)提供的 Edify 大模型或是自建定制模型來進(jìn)行訓(xùn)練 和優(yōu)化,得到自己想要的生成式 AI 模型。Shtterstock 目前正在與英偉達(dá)合作開發(fā)一款以其 專業(yè)的圖像、3D 和視頻素材庫進(jìn)行訓(xùn)練的 Edify-3D 生成式模型,用于簡化創(chuàng)意制作、數(shù)字 孿生和虛擬協(xié)作中 3D 素材的創(chuàng)建過程。Adobe 也與英偉達(dá)合作,發(fā)布了 Adobe Firefly 這一 生成式 AI 工具,將生成式 AI 融入了營銷人員和創(chuàng)意工作者的日常工作流中。
3) BIONEMO:BIONEMO 是針對于生物制藥領(lǐng)域的 AI 模型服務(wù)。生物制藥行業(yè)目前正在轉(zhuǎn)向 利用生成式 AI 來發(fā)現(xiàn)疾病靶因、設(shè)計(jì)新型分子或蛋白質(zhì)類藥物、以及預(yù)測藥物對機(jī)體的作 用等。BIONEMO 可以為用戶提供創(chuàng)建、微調(diào)、提供自定義模型的平臺,包括 AlphaFold、 ESMFold、OpenFold 等蛋白質(zhì)預(yù)測模型。生成式 AI 模型可以在給出氨基酸序列的條件下快 速準(zhǔn)確地預(yù)測目標(biāo)蛋白質(zhì)結(jié)構(gòu),預(yù)測蛋白質(zhì)和分子的相互作用等,極大地提升了最佳候選藥 物研發(fā)的效率。
工業(yè)軟件領(lǐng)域與 AI 大模型能力的結(jié)合值得期待。本次英偉達(dá) CEO 的主題演講中,AI 與專業(yè)的創(chuàng) 意設(shè)計(jì)、工業(yè)設(shè)計(jì)、模擬仿真類軟件結(jié)合方式為 AI 大模型的落地帶來了新的場景,在駕駛仿真、 粒子特效運(yùn)算、動畫制作、材質(zhì)表面生成、物理效果等領(lǐng)域都有良好的應(yīng)用。我們認(rèn)為,隨著 AI 能力的持續(xù)進(jìn)步和業(yè)界對 AI 應(yīng)用方式的不斷探索,像 CAD、EDA、BIM 等工業(yè)軟件也有較大成 長的機(jī)會,其模型設(shè)計(jì)、圖紙生成等功能都與大模型能力十分契合。未來隨著國外頭部廠商進(jìn)行 大模型方向的創(chuàng)新應(yīng)用,國內(nèi)的相關(guān)工業(yè)軟件企業(yè)也會有較大發(fā)展空間。
四、生成與通用領(lǐng)域雙線發(fā)展,人工智能邁入“雙G時(shí)代”
大語言模型的誕生帶來了新的知識表示和調(diào)用方式的變遷。自計(jì)算機(jī)誕生以來,知識表示和調(diào)用 方式歷經(jīng)了兩次大的變遷。在互聯(lián)網(wǎng)誕生之前,最為常見的知識表示方式是關(guān)系型數(shù)據(jù)庫,通過 SQL 語句進(jìn)行調(diào)用,精確度高但調(diào)用的方式較為復(fù)雜,代表的公司比如 Oracle 等數(shù)據(jù)庫的巨頭公 司。隨著互聯(lián)網(wǎng)的誕生與搜索引擎的誕生,知識的調(diào)用方式變化為了關(guān)鍵詞搜索,方便程度提高了,但是對于知識調(diào)用的精確度卻有所降低。而大模型的誕生進(jìn)一步提高了知識調(diào)用方式的自然 度,僅需通過自然語言交互即可訪問想要的知識。
當(dāng)下人工智能在生成和通用兩條主線上不斷發(fā)展,邁入“雙 G 時(shí)代”。目前人工智能最火熱的兩 個(gè)賽道分別是生成(Generation)和通用(General),這兩條賽道相互交織并行,AI 領(lǐng)域也進(jìn) 入了“雙 G 時(shí)代”。在生成領(lǐng)域,以 DALLE-2、Stable Diffusion 等引領(lǐng)的生成式 AI 技術(shù)與 AIGC 概念如火如荼;在通用領(lǐng)域,AI 研究者們現(xiàn)在都在朝著通用人工智能(Artificial General Intelligence, AGI)的方向不斷努力,大模型不斷增強(qiáng)的多模態(tài)感知能力就是邁向 AGI 的重要途徑。這兩條賽道是密不可分的,像百度的“文心一言”大模型就既具有多模態(tài)的生成能力,又能夠回 答大部分的通用問題,具有一定的通用人工智能能力。
OpenAI 及其 GPT 系列模型是當(dāng)前人工智能賽道上的領(lǐng)跑者,超大規(guī)模模型帶來的知識涌現(xiàn)能力 是 ChatGPT 出圈的關(guān)鍵。OpenAI 和 GPT-4 毫無疑問是當(dāng)下人工智能領(lǐng)域最為耀眼的明珠,回 顧 GPT 系列模型的發(fā)展歷程,2018 年 OpenAI 發(fā)布 GPT-1 模型,僅有 1.17 億參數(shù),性能也落后 于谷歌隨后發(fā)布的 BERT 模型,BERT 也成為當(dāng)時(shí) NLP 領(lǐng)域最常用的模型。OpenAI 持續(xù)在 GPT 模型上發(fā)力,陸續(xù)推出規(guī)模更大的迭代版本 GPT-2 和 GPT-3,在 OpenAI 的研究中,發(fā)現(xiàn)了當(dāng)模 型參數(shù)到達(dá)一定規(guī)模時(shí),模型會開始涌現(xiàn)出 In-context learning(上下文學(xué)習(xí))、Chain ofThoughts(思維鏈)、Zero-shot(能夠處理未見任務(wù))等能力,而這樣的能力成為了 ChatGPT 能夠“更像人”的關(guān)鍵。
“文心一言”已達(dá)“能用”標(biāo)準(zhǔn),我國在人工智能賽道上將持續(xù)追趕。從近期的“文心一言”相 關(guān)測試來看,距離 GPT-4 還有很大差距,但是其能力展現(xiàn)已有 GPT-3 的水平,達(dá)到了“能用” 標(biāo)準(zhǔn),在 B 端、垂直行業(yè)端等都有應(yīng)用的空間。我們認(rèn)為,我國的人工智能技術(shù)起步晚,經(jīng)驗(yàn)積累不足,但是發(fā)展速度較快。隨著我國相關(guān)科技公司大力投入生成式 AI、大語言模型的研究,我 國在 AI 的“雙 G 時(shí)代”中將持續(xù)扮演追趕者的角色,爭取和國際領(lǐng)先水平縮小差距。
服務(wù)器產(chǎn)業(yè)鏈如何受益于AI大模型
(報(bào)告出品方:華泰證券)
產(chǎn)業(yè)鏈公司梳理
以 ChatGPT 為代表的 AI 應(yīng)用掀起 AI 落地千行百業(yè)的浪潮,驅(qū)動算力需求增長。我們認(rèn)為 服務(wù)器產(chǎn)業(yè)鏈將深度受益于 AI 算力需求,產(chǎn)業(yè)鏈公司包括:1)服務(wù)器品牌及整機(jī):聯(lián)想、 浪潮、工業(yè)富聯(lián)、中興通訊、紫光股份;2)PCB&CCL&ABF 載板:滬電股份、深南電路、 生益電子、興森科技、勝宏科技、生益科技、華正新材等;3)主機(jī)板:環(huán)旭電子;4)半 導(dǎo)體:寒武紀(jì)、海光信息、龍芯中科、瀾起科技、杰華特、東微半導(dǎo)、華潤微、聞泰科技 等;5)光模塊及光芯片:中際旭創(chuàng)、新易盛、天孚通信、華工科技、源杰科技等;5)光 纖光纜:長飛光纖光纜、亨通光電、中天科技等;6)熱管理:英維克、申菱環(huán)境。
AI 大模型如何推動服務(wù)器產(chǎn)業(yè)鏈需求
為了滿足 AI 市場的需求,英偉達(dá)今年 GTC2023 上不僅發(fā)布了 L4 Tensor Core GPU、L40 GPU、H100 NVL GPU 和 Grace Hopper 等芯片,還進(jìn)一步推出 NVIDIA DGX 超級計(jì)算機(jī), 成為大語言模型實(shí)現(xiàn)突破背后的引擎。英偉達(dá)在 GTC2023 中表示,《財(cái)富》100 強(qiáng)企業(yè)中 有一半安裝了 DGX AI 超級計(jì)算機(jī),DGX 已成為 AI 領(lǐng)域的必備工具。DGX 配有 8 個(gè) H100 GPU 模組,H100 配有 Transformer 引擎,旨在支持類似 ChatGPT 的大模型。這 8 個(gè) H100 模組通過 NVLINK Switch 彼此相連,以實(shí)現(xiàn)全面無阻塞通信。8 個(gè) H100 協(xié)同工作,形成一個(gè)巨型 GPU。通過 400 Gbps 超低延遲的 NVIDIA Quantum InfiniBand 進(jìn)行網(wǎng)絡(luò)內(nèi)計(jì)算,將成千上萬個(gè) DGX 節(jié)點(diǎn)連接成一臺 AI 超級計(jì)算機(jī),并不斷擴(kuò) 展應(yīng)用范圍,成為全球客戶構(gòu)建 AI 基礎(chǔ)設(shè)施的藍(lán)圖。
服務(wù)器廠商如何把握 AI 大模型機(jī)會
AI 大模型訓(xùn)練和推理催生 GPU 需求上漲,AI 服務(wù)器采用異構(gòu)式架構(gòu),NVIDIA DGX A100 服務(wù)器 8 個(gè) GPU+2 個(gè) CPU 的配置遠(yuǎn)高于普通服務(wù)器 1~2 個(gè) CPU 的配置,能夠滿足 AI 大模型需求。在單芯片計(jì)算訓(xùn)練性能不斷提升的基礎(chǔ)上,服務(wù)器整體能效的提升同樣受到 關(guān)注。IDC 預(yù)計(jì),全球 AI 服務(wù)器市場規(guī)模穩(wěn)健增長,2021-2026E CAGR 預(yù)計(jì)達(dá) 17%。我 們認(rèn)為,AI 大模型將帶動算力需求增長,催生對 AI 服務(wù)器的需求。工業(yè)富聯(lián)、聯(lián)想、中興 通訊、紫光股份等公司有望把握住AI大模型帶來的機(jī)會,受益于AI服務(wù)器需求的持續(xù)提升。
全球 AI 服務(wù)器市場規(guī)模穩(wěn)健增長,2021-2026E CAGR 預(yù)計(jì)達(dá) 17%
根據(jù) IDC 數(shù)據(jù),2014-2021 年,全球服務(wù)器廠商銷售總額總體呈上升趨勢,2021 年全球服 務(wù)器市場規(guī)模達(dá)到 USD99bn。其中,戴爾、HPE、聯(lián)想、浪潮市場份額排名前列,合計(jì)占 比超過 40%。IDC 認(rèn)為 2021-2026E 全球 AI 服務(wù)器廠商市場規(guī)模將穩(wěn)健增長,2026 年市 場規(guī)模有望達(dá) USD35mn,預(yù)計(jì) 2021-2026E CAGR 達(dá)到 17%。1H21 全球 AI 服務(wù)器廠商 競爭格局相對集中,其中浪潮信息占比最高(20.2%),其次是戴爾、HPE、聯(lián)想。
AI 服務(wù)器采用異構(gòu)式架構(gòu),GPU 數(shù)量遠(yuǎn)高于普通服務(wù)器
AI 大模型訓(xùn)練和推理催生 GPU 需求上漲。目前 AI 訓(xùn)練主要采用:1)英偉達(dá)在 AI 訓(xùn)練 GPGPU:包括 V100/A100/H100(22 年下半年開始量產(chǎn)出貨)以及美國限制出口后英偉達(dá) 推出的裁剪版 A800。2)AMD 推出的 AI 訓(xùn)練芯片包括 MI 250/250X/300。在推理芯片的選用方面,相較于訓(xùn)練更多關(guān)注模型大小而言,推理更依賴于任務(wù)本質(zhì),以 此決定所需芯片種類。當(dāng)需要大量內(nèi)容/圖像 AI 生成式時(shí),需要 GPU 進(jìn)行推理計(jì)算(如英 偉達(dá)主流的 T4 芯片);而對于較簡單的推理過程(語音識別等),CPU 有時(shí)也會成為較好 的推理引擎。AI 服務(wù)器采用異構(gòu)式架構(gòu),GPU 數(shù)量遠(yuǎn)高于普通服務(wù)器。隨著多模態(tài)大模型 AI 服務(wù)器和 普通服務(wù)器的主要區(qū)別在于:1)架構(gòu)不同。AI 服務(wù)器采用 CPU+GPU/FPGA/ASIC 等異構(gòu) 式架構(gòu),而普通服務(wù)器一般是 CPU 架構(gòu);2)GPU 數(shù)量差異顯著。比較 NVIDIA DGX A100 和浪潮英信服務(wù)器 NF5280M6 構(gòu)造,NVIDIA DGX A100 包括 8 個(gè) A100 GPU 和 2 個(gè) AMD Rome CPU,而浪潮英信服務(wù)器 NF5280M6 僅配置 1-2 個(gè)英特爾第三代 Xeon 處理器。僅 在 GPU 方面,一臺 AI 服務(wù)器就能夠帶來約 10 萬美元的價(jià)值量提升。
在單芯片計(jì)算訓(xùn)練性能提升的基礎(chǔ)上,服務(wù)器整體能效的提升同樣受到關(guān)注
英偉達(dá)在此次 GTC 大會上推出 DGX H100 服務(wù)器,配有 8 個(gè) H100 GPU 模組,配有 Transformer 引擎以支持處理類似 ChatGPT 的生成式訓(xùn)練模型,F(xiàn)P8 精度在大型語言模型 相較上一代 A00 的訓(xùn)練和推理能力分別提升 9/30 倍。8 個(gè) H100 模組通過 NVLINK Switch 相連,確保 GPU 之間的合作和通信。我們認(rèn)為,AI 服務(wù)器整體能效的提升驅(qū)動服務(wù)器各零部件升級需求,包括且不限于:1)AI 訓(xùn)練和推理對網(wǎng)絡(luò)帶寬提出更高要求,有望催生光模塊速率進(jìn)一步升級需求,其中 800G 光模塊有望加速放量;2)PCB:AI 服務(wù)器用 PCB 一般是 20-28 層,傳統(tǒng)服務(wù)器最多 16 層,每提升一層,PCB 價(jià)值量提升 1000 元左右,因此單臺 AI 服務(wù)器的 PCB 價(jià)值量約為 單臺傳統(tǒng)服務(wù)器的 3-4 倍;3)服務(wù)器半導(dǎo)體:GPU 方面,一臺 AI 服務(wù)器就能夠帶來約 10 萬美元的價(jià)值量提升,而大功率供電需求也驅(qū)動多相電源用量增長,進(jìn)一步提升價(jià)值量。
服務(wù)器廠商有望借助“AI 算力革命”機(jī)遇再創(chuàng)高峰
工業(yè)富聯(lián)作為提供服務(wù)器代工服務(wù)的龍頭廠商,將深度受益于 AI 服務(wù)器市場擴(kuò)容帶來的機(jī) 會,有望憑借高性能的 AI 服務(wù)器迎來營收增長??蛻舴矫妫噍^于 2021 年,2022 年工業(yè) 富聯(lián)服務(wù)器營收中云服務(wù)商比重由 35%上升至 42%,來自云服務(wù)商客戶的營收占比持續(xù)提 升;產(chǎn)品方面,伴隨著 AI 硬件市場迅速成長,公司相關(guān)產(chǎn)品 2022 年出貨加倍,AI 服務(wù)器 及 HPC 出貨增長迅速,在 2022 年云服務(wù)商產(chǎn)品中占比增至約 20%。算力時(shí)代的開啟為高 效 AI 服務(wù)器提供了更廣闊的發(fā)展空間,據(jù)公司 2022 年報(bào),相關(guān)新產(chǎn)品將在 2023 年陸續(xù)研 發(fā)推出。2022 年,工業(yè)富聯(lián)云服務(wù)設(shè)備占總營收比例超過 40%,考慮到收入增速超平均 的 CSP 業(yè)務(wù)占公司云設(shè)備業(yè)務(wù)比重上升,我們預(yù)測工業(yè)富聯(lián)服務(wù)器 23/24/25 年的收入增 幅為 8.6%/8.2%/8.2%,高于行業(yè)平均。
環(huán)旭電子:服務(wù)器和高速交換機(jī)主機(jī)板供應(yīng)商,協(xié)助客戶推出邊緣 AI 計(jì)算服務(wù)器
環(huán)旭為客戶提供 ODM/JDM/EMS 伺服器、存儲、NAS 和 SSD 產(chǎn)品以及制造服務(wù),并提供 L10 系統(tǒng)設(shè)計(jì)服務(wù),包括主機(jī)板、固件 BIOS 和 BMC、子卡(背板、附加卡等)、外殼和散 熱設(shè)計(jì)以及系統(tǒng)集成。Al 服務(wù)器方面,環(huán)旭提供設(shè)計(jì)制造(JDM)服務(wù),協(xié)助品牌客戶推出 邊緣 Al 計(jì)算服務(wù)器。根據(jù)環(huán)旭電子 2022 年業(yè)績快報(bào),云端及存儲類業(yè)務(wù)營收達(dá) 69.89 億 元,同比增長 41.1%,占公司營收比例由 2021 年的 8.7%增長至 2022 年的 10.2%。我們 認(rèn)為,受益于 AI 帶來的云端及邊緣計(jì)算新需求,公司云端及存儲類產(chǎn)品營收有望實(shí)現(xiàn)長期 穩(wěn)健增長。
PCB 廠商如何把握 AI 大模型機(jī)會
從下游應(yīng)用來看,服務(wù)器/數(shù)據(jù)存儲是 PCB 重要的下游應(yīng)用領(lǐng)域之一。根據(jù) Prismark 數(shù)據(jù), 預(yù)估 2021 年服務(wù)器/數(shù)據(jù)存儲占全球 PCB 產(chǎn)值的 10%,并預(yù)測其 2021-2026 年產(chǎn)值復(fù)合 增速在 PCB 下游細(xì)分領(lǐng)域中排名第一。
PCB 在服務(wù)器中主要用于:1)主板:服務(wù)器標(biāo)配,且使用的 PCB 價(jià)值量最高;2)電源 背板:單獨(dú)設(shè)置或與主板集成;3)功能性配板:網(wǎng)卡、硬盤、內(nèi)存、CPU 等。服務(wù)器用 PCB 的特點(diǎn)主要體現(xiàn)在高層數(shù)、高縱橫比、高密度及高傳輸速率,以高多層板、封裝基板 為主。
AIGC 大模型的訓(xùn)練和推理需要大量的高性能計(jì)算算力支持,對 AI 服務(wù)器需求提升,同時(shí) 將進(jìn)一步加速服務(wù)器平臺升級。整體來看,AI 大模型的發(fā)展對 PCB 的核心影響在于價(jià)值量 提升,包括:1)服務(wù)器平臺升級;2)AI 服務(wù)器對 PCB 的高要求。
服務(wù)器平臺升級對 PCB 的影響關(guān)鍵在于總線標(biāo)準(zhǔn)升級
價(jià)#1:服務(wù)器平臺升級對 PCB 的影響關(guān)鍵在于總線標(biāo)準(zhǔn)升級。其價(jià)增邏輯在于,服務(wù)器平 臺升級→PCIe 總線標(biāo)準(zhǔn)升級→傳輸速率提升→走線密度增加→PCB 層數(shù)、材料等級、工藝 (如背鉆)要求更高、更嚴(yán)格→PCB 價(jià)值量提升。以 Intel 服務(wù)器平臺為例,從 Purley 到 Whitley 再到即將量產(chǎn)的 Eagle Stream,對應(yīng)的 PCIe 接口級別依次提升,分別為 PCIe 3.0、 4.0 和 5.0,PCB 層數(shù)從 12 層以下增加至 16 層以上,CCL 材料等級從 Mid Loss 升級至 Ultra Low Loss,對背鉆等技術(shù)的管控更嚴(yán)格。根據(jù)產(chǎn)業(yè)調(diào)研,從 Whitley 到 Engle Stream, PCB 層數(shù)雖僅增加 2-4 層,但價(jià)格差不多翻倍。以 ChatGPT 大模型引領(lǐng)的新一輪 AI 技術(shù)革命,將加速新一代服務(wù)器平臺滲透率提升及下 一代服務(wù)器平臺研發(fā)。從主流廠商規(guī)劃來看,AMD 的 Zen4 平臺和 Intel 的 Engle Stream 預(yù)計(jì)將在今年 Q3-Q4 開始上量,有望開啟新一輪服務(wù)器 PCB 上行周期。
相比傳統(tǒng)服務(wù)器,AI 服務(wù)器的 PCB 層數(shù)更高,單臺 PCB 價(jià)值量大幅提升
價(jià)#2:相比傳統(tǒng)服務(wù)器,AI 服務(wù)器的 PCB 層數(shù)更高,單臺 PCB 價(jià)值量大幅提升。AI 服務(wù) 器與傳統(tǒng)服務(wù)器的區(qū)別主要在于:1)硬件架構(gòu)更復(fù)雜:多采用“CPU+其他加速卡”的異 構(gòu)形式,且目前 CPU+GPU 為主流;2)加速卡數(shù)量更多:一般配置四塊及以上加速卡;3) 設(shè)計(jì)更獨(dú)特:針對系統(tǒng)結(jié)構(gòu)、散熱、拓?fù)涞葘iT設(shè)計(jì);4)技術(shù)更專用:如服務(wù)器平臺需要 更大內(nèi)存帶寬,NVlink 提供更大的顯存位寬帶寬,TensorCore 提供更強(qiáng)的 AI計(jì)算力等。這些區(qū)別,尤其是 NVlink 這些特殊接口都使得 AI 服務(wù)器對 PCB 層數(shù),通信速度都提出了 更高要求,從而帶動 AI 服務(wù)器的 PCB 價(jià)值量大幅提升。根據(jù)產(chǎn)業(yè)調(diào)研, AI 服務(wù)器用 PCB 一般是 20-28 層,傳統(tǒng)服務(wù)器最多 16 層,每提升一層, PCB 價(jià)值量提升 1000 元左右,因此單臺 AI 服務(wù)器的 PCB 價(jià)值量相較傳統(tǒng)服務(wù)器的 PCB 價(jià)值量將有明顯提升。
AI 服務(wù)器占全球服務(wù)器出貨量比例將逐年提升,長期仍有量增空間
量:AI 服務(wù)器占全球服務(wù)器出貨量比例將逐年提升,長期仍有量增空間。目前 AI 服務(wù)器占 整體服務(wù)器出貨量的比例并不高,但在智算算力需求的潛在預(yù)期下占比有望逐年提升,長 期看對 PCB/CCL 有增量空間。據(jù) TrendForce 數(shù)據(jù),截至 2022 年為止,預(yù)估搭載 GPGPU 的 AI 服務(wù)器年出貨量占整體服務(wù)器比重近 1%,預(yù)計(jì)在 ChatBot 相關(guān)應(yīng)用加持下,2023 年 出貨量年增長可達(dá) 8%,另外預(yù)測其 2022-2026 年 CAGR 將達(dá) 10.8%,是全球整體服務(wù)器 的復(fù)合增速的 2 倍多。因此,AI 服務(wù)器對 PCB 的影響,短期以價(jià)值量提升為主,長期仍有 增量空間。
從競爭格局上看,大陸 PCB 廠商在全球服務(wù)器的競爭中已占據(jù)一席之地,但在 AI 服務(wù)器 領(lǐng)域參與度不高。AI 大模型要求多張 GPU 通過 NVLINK 等特殊接口緊密鏈接形成一張超 級 GPU,對高密度 PCB 板的層數(shù)、通信速度等提出更高要求。產(chǎn)業(yè)鏈公司包括生產(chǎn)通信 用高密度 PCB 的深南電路、滬電,興森科技等,以及生產(chǎn)高速 PCB 板用材料(M6)的生 益科技。
高算力需求帶動先進(jìn)封裝需求,ABF 載板有望充分受益
高算力需求帶動先進(jìn)封裝需求,ABF 載板有望充分受益。以 AI 大模型為基礎(chǔ)的 AIGC 新應(yīng) 用快速興起,對算力的要求提高,服務(wù)器單機(jī)將搭載更多的 CPU/GPU 等芯片,解決多芯 片間高速互連的先進(jìn)封裝成為關(guān)鍵。而 IC 載板作為先進(jìn)封裝的關(guān)鍵材料,有望進(jìn)一步打開 價(jià)值空間。尤其 ABF 載板,相較于 BT 載板具備層數(shù)多、面積大、線路密度高、線寬線距 小等特點(diǎn),更能承載 AI 高性能運(yùn)算,在 CPU、GPU、FPGA、ASIC 等高運(yùn)算性能 IC 放量 預(yù)期下將更充分受益。據(jù) Prismark 預(yù)測,ABF 載板為 IC 載板行業(yè)規(guī)模最大、增速最快的 細(xì)分領(lǐng)域,預(yù)計(jì)全球 ABF 載板市場規(guī)模 2026 年將達(dá)到 121 億美元,2021-2026 年 CAGR 為 11.5%。
從競爭格局看,載板技術(shù)壁壘較高,長期以日韓臺廠商為主,國內(nèi)起步較晚。我們認(rèn)為, 隨著半導(dǎo)體產(chǎn)業(yè)鏈的國產(chǎn)化替代加速,國內(nèi)廠商仍有較大上升空間。
半導(dǎo)體廠商如何把握 AI 大模型機(jī)會
電源芯片:AI 服務(wù)器多相電源用量提升,國產(chǎn)替代空間廣闊
隨著大數(shù)據(jù)、云計(jì)算、人工智能概念的興起, CPU、GPU 對供電電壓調(diào)節(jié)器(VRM/Vcore) 和負(fù)載點(diǎn)電源 (PoL)的效率和功率提出了嚴(yán)峻挑戰(zhàn)。多相Buck電源包含控制器及DrMOS, 是一種多路交錯并聯(lián)的同步 Buck 拓?fù)?,被公認(rèn)為是此類應(yīng)用場景的最佳解決方案。通過多 相控制器和 DrMOS 的組合使用,將多個(gè)降壓電路的輸出并聯(lián)使用,從而輸出數(shù)百安培到數(shù) 千安培的電流,適用于超大功率供電的需求。DrMOS 能給 CPU /GPU 電源設(shè)計(jì)帶來三點(diǎn) 優(yōu)勢:1)更穩(wěn)定的電源;2)power 零部件減少;3)power 零件小型化與線路簡潔化,滿 足下游產(chǎn)品輕薄短小但高效的需求。
根據(jù) MPS 數(shù)據(jù),服務(wù)器主板電源解決方案涉及 CPU/GPU 供電、存儲 DDR 供電、POL 以及 EFuse 等產(chǎn)品,CPU 服務(wù)器及 GPU 服務(wù)器電源合計(jì)市場規(guī)模約 20 億美金。具體來 看 CPU、GPU 供電主要采用多相控制器+ DrMOS 模式。根據(jù) MPS 官網(wǎng),最初 CPU 采用 4 相,6 相,GPU 已經(jīng)演進(jìn)至采用 16 相供電,總市場規(guī)模約 6 億美金。POL(負(fù)載點(diǎn)電源) 則是分布與各個(gè)功能單元電路前端的 DC/DC 穩(wěn)壓器,一臺服務(wù)器上有十多顆 POL,對應(yīng)市 場規(guī)模約 6000 萬美金。由于 DDR5 標(biāo)準(zhǔn)將直流供電功能從主板轉(zhuǎn)移至內(nèi)存條,因此每一 個(gè)內(nèi)存條將額外包含一組 DC-DC 直流變壓電路。這種方式無疑會增加成本,總市場規(guī)模 約 2.8 億美金。電子保險(xiǎn)絲 EFuse 用于為子電路或 PC 板提供局部快速響應(yīng)保護(hù), 對應(yīng)全 球市場規(guī)模約 6000 萬美金。
AI 服務(wù)器采用異構(gòu)式架構(gòu),NVIDIA DGX A100 服務(wù)器 8 個(gè) GPU+2 個(gè) CPU 的配置遠(yuǎn)高于 普通服務(wù)器 1~2 個(gè) CPU 的配置。單顆 NVIDIA A100 至少需要 16 相電源解決方案,單臺 AI 服務(wù)器所需多相電源數(shù)量呈幾何式增長。IDC 預(yù)計(jì),全球 AI 服務(wù)器市場規(guī)模穩(wěn)健增長, 2021-2026E CAGR 預(yù)計(jì)達(dá) 21%。我們認(rèn)為,AI 大模型將帶動算力需求增長,催生對 AI 服務(wù)器的需求,帶動多相電源市場需求增加。
國外廠商主導(dǎo) DrMOS及多相控制器市場,國內(nèi)空白亟待彌補(bǔ)。由于DrMOS技術(shù)難點(diǎn)較多:1)大功率大電流的工藝——BCD 工藝;2)設(shè)計(jì);3)封裝,DrMOS 在國內(nèi)尚屬空白,國 產(chǎn)替代亟待推進(jìn)。DrMOS 主要廠商為 MPS、ADI、TI 和安森美等,目前下游廠商幾乎只采 用海外 DrMOS 產(chǎn)品,如微星 B650 迫擊炮采用 MPS 產(chǎn)品, 2206/MP87670 單相提供額定 80A 電流。大陸廠商僅杰華特具有 DrMOS 量產(chǎn)能力,單芯片已經(jīng)做到 70 安培,性能可與 國際一流廠商相比,有望彌補(bǔ)國內(nèi)空白,目前公司 DrMOS 產(chǎn)品在服務(wù)器、筆電領(lǐng)域均實(shí) 現(xiàn)批量出貨。公司多相控制器產(chǎn)品目前處于送樣階段,未來會與 DrMOS 配套出貨。
計(jì)算芯片/存儲控制芯片:增加 AI 加速器芯片,提升計(jì)算效率
芯片端:增加 GPU 等 AI 加速芯片提升計(jì)算效率
AI 服務(wù)器與普通服務(wù)器相比,AI 服務(wù)器的芯片通常被優(yōu)化和設(shè)計(jì)用于執(zhí)行機(jī)器學(xué)習(xí)和深度 學(xué)習(xí)算法,常采用異構(gòu)計(jì)算的方式。具體來看 1)CPU:AI 服務(wù)器和普通服務(wù)器都使用 CPU。但 AI 服務(wù)器通常會使用性能更高的 CPU, 以便更快地處理復(fù)雜的計(jì)算任務(wù)。2)GPU:GPU 是 AI 服務(wù)器的核心組成部分,在矩陣運(yùn)算和深度學(xué)習(xí)模型訓(xùn)練方面具有更 高的效率。相比之下,普通服務(wù)器通常只使用 CPU 而不使用 GPU。以浪潮信息為例,我 們看到 AI/HPC 服務(wù)器分別配備 8 顆 A800 GPU 以及 4 顆 V100/ P100 等英偉達(dá) GPU。3)FPGA/ASIC:是專門為特定任務(wù)設(shè)計(jì)的芯片,與通用 CPU 或 GPU 相比,這兩類芯片 可以更快地執(zhí)行特定的計(jì)算任務(wù)。我們看到 HPC 服務(wù)器相比通用/AI 服務(wù)器多配備 2 顆賽 靈思 FPGA,整體服務(wù)器的單機(jī)臺芯片用量預(yù)計(jì)隨著 AI 服務(wù)器的用量而顯著提升。
寒武紀(jì)訓(xùn)練卡:思元 370 推訓(xùn)一體實(shí)現(xiàn)硬件升級,同英偉達(dá)數(shù)據(jù)中心產(chǎn)品 T4/A10 直面競 爭,思元 590 加入浮點(diǎn)計(jì)算實(shí)測性能優(yōu)異。目前寒武紀(jì)核心發(fā)力云端,其核心產(chǎn)品包括:1) 思元 370 于 2021 年推出,是寒武紀(jì)第三代云端產(chǎn)品采用 7nm 制程工藝,是寒武紀(jì)首款采 用 Chiplet(芯粒)技術(shù)的人工智能芯片。思元 370 智能芯片最大算力高達(dá) 256TOPS(INT8), 是寒武紀(jì)第二代云端推理產(chǎn)品思元270算力的2倍,產(chǎn)品形態(tài)包括3款加速卡:MLU370-S4、 MLU370-X4、MLU370-X8,已與國內(nèi)主流互聯(lián)網(wǎng)廠商開展深入的應(yīng)用適配。2)思元 590 在上一代思元 290 的基礎(chǔ)上增加浮點(diǎn)計(jì)算能力,采用 MLUarch05 全新架構(gòu),實(shí)測訓(xùn)練性能 較在售旗艦產(chǎn)品有了大幅提升,它提供了更大的內(nèi)存容量和更高的內(nèi)存帶寬,其 IO 和片間 互聯(lián)接口也較上代實(shí)現(xiàn)大幅升級。
海光 DCU:公司 DCU 產(chǎn)品主要面向智能計(jì)算以及人工智能市場,采用高性能計(jì)算市場目 前主流的 GPGPU 架構(gòu)。當(dāng)前 DCU 產(chǎn)品綜合性能約為英偉達(dá) A100 產(chǎn)品的 70%-80%,與 國內(nèi)同行相比,公司的優(yōu)勢在于:①全精度計(jì)算:公司產(chǎn)品覆蓋 64 位、32 位、16 位以 及整型 8 位訓(xùn)練/推理;②兼容主流生態(tài):兼容“類 CUDA”環(huán)境,能夠較好地適配、適應(yīng) 國際主流商業(yè)計(jì)算軟件和人工智能軟件,并通過更好的性價(jià)比實(shí)現(xiàn)國產(chǎn)替代。海光 DCU 集 成片上高帶寬內(nèi)存芯片,可以在大規(guī)模數(shù)據(jù)計(jì)算過程中提供優(yōu)異的數(shù)據(jù)處理能力,使海光 DCU 可以廣泛應(yīng)用于不同的場景。目前該產(chǎn)品可廣泛應(yīng)用于大數(shù)據(jù)處理、人工智能、商業(yè) 計(jì)算等計(jì)算密集類應(yīng)用領(lǐng)域,我們預(yù)計(jì)將在超算中心首先得到應(yīng)用,長期來看將憑借當(dāng)前 與互聯(lián)網(wǎng)公司、AI 廠商、先進(jìn)計(jì)算中心以及智算中心的深度合作關(guān)系,實(shí)現(xiàn)從政府項(xiàng)目到 行業(yè)的破圈。
通信設(shè)備廠商如何把握 AI 大模型機(jī)會
光模塊:數(shù)據(jù)中心市場空間廣闊,2023 年有望迎 800G 放量元年
全球光模塊市場穩(wěn)健增長,數(shù)據(jù)中心光模塊市場空間廣闊。根據(jù) LightCounting 的統(tǒng)計(jì)及 預(yù)測,2019~2021 年,全球光模塊市場規(guī)模從 89 億美元增長到 114 億美元,預(yù)測 2025 年 全球光模塊市場將達(dá)到 171 億美元,對應(yīng) 2022~2025 年 CAGR 為 10.65%。全球光模塊市 場結(jié)構(gòu)方面,CWDM/DWDM 光模塊和用于數(shù)據(jù)中心的以太網(wǎng)光模塊占比較高,二者出貨 金額合計(jì)占比從 2019 年的 74%提升至 2021 年的 79%,其中光模塊市場規(guī)模為 47億美元, 占比為 41%,為光模塊中最大細(xì)分品類市場。
800G 有望迎接放量元年。隨著云計(jì)算、AI、元宇宙等技術(shù)產(chǎn)業(yè)的快速發(fā)展和傳統(tǒng)產(chǎn)業(yè)數(shù)字 化的轉(zhuǎn)型,全球范圍內(nèi)數(shù)據(jù)快速的增長對網(wǎng)絡(luò)帶寬提出新的要求,有望催生光模塊速率升 級需求。LightCounting 指出,AI 應(yīng)用等帶來的數(shù)據(jù)流量的增長,超預(yù)期的數(shù)據(jù)中心帶寬需 求以及光模塊廠商技術(shù)的迭代都是推動 800G 應(yīng)用的動力。根據(jù) LightCounting 于 2022 年 4 月發(fā)布的預(yù)測,2022~2024 年全球 800G 以太網(wǎng)光模塊出貨量有望達(dá) 11、39、119 萬只。我們認(rèn)為隨著 800G 光模塊有望迎來放量元年,國內(nèi)頭部光模塊以及上游光器件、光芯片 廠商有望迎發(fā)展機(jī)遇。
國內(nèi)光模塊廠商彰顯全球競爭力。根據(jù) Lightcounting 于 2022 年 5 月發(fā)布的統(tǒng)計(jì)數(shù)據(jù),2021 年全球前十大光模塊廠商,中國廠商占據(jù)六席,分別為旭創(chuàng)(與 II-VI 并列第一)、華為海思 (第三)、海信寬帶(第五)、光迅科技(第六)、華工正源(第八)及新易盛(第九);相 比于 2010 年全球前十大廠商主要為海外廠商,國內(nèi)僅 WTD(武漢電信器件有限公司,2012 年與光迅科技合并)一家公司入圍,體現(xiàn)出十年以來國產(chǎn)光模塊廠商競爭實(shí)力及市場地位 的快速提升。
以太網(wǎng)交換機(jī)芯片:交換機(jī)核心部件,國產(chǎn)替代空間廣闊
以太網(wǎng)交換芯片是交換機(jī)核心部件。以太網(wǎng)交換機(jī)為用于網(wǎng)絡(luò)信息交換的網(wǎng)絡(luò)設(shè)備,是實(shí) 現(xiàn)各種類型網(wǎng)絡(luò)終端互聯(lián)互通的關(guān)鍵設(shè)備。交換設(shè)備由以太網(wǎng)交換芯片、CPU、PHY、PCB、 接口/端口子系統(tǒng)等組成,其中以太網(wǎng)交換芯片為最核心部件。交換芯片是用于交換處理大量數(shù)據(jù)及報(bào)文轉(zhuǎn)發(fā)的專用芯片,是針對網(wǎng)絡(luò)應(yīng)用優(yōu)化的專用集成電路(ASIC)。
全球以太網(wǎng)交換芯片市場增長穩(wěn)健,國內(nèi)增速領(lǐng)先。根據(jù)盛科通信招股書和灼識咨詢預(yù)測, 2020 年全球以太網(wǎng)交換芯片市場規(guī)模為 368 億元,同比下降 4.3%,預(yù)計(jì) 2020-2025E 年 均復(fù)合增速為 3.4%,2025 年全球市場規(guī)模為 434 億元。2020 年我國交換芯片市場規(guī)模為 90 億元,同比增長 25.2%,灼識咨詢預(yù)測 2025 年我國市場規(guī)模可達(dá) 171.4 億元,對應(yīng) 2021E-2025E 復(fù)合增速為 13.8%,顯著領(lǐng)先全球增速。根據(jù)信通院,國內(nèi)市場由于數(shù)據(jù)中 心等新基建領(lǐng)域政策環(huán)境向好(如東數(shù)西算、算力網(wǎng)絡(luò)建設(shè)等政策),而交換機(jī)作為搭建數(shù) 據(jù)中心架構(gòu)的骨骼,用以保證數(shù)據(jù)傳輸穩(wěn)定可靠,將隨之大量提振需求。
“高速化”:100G 及以上端口速率將成主流,應(yīng)對下一代數(shù)據(jù)中心帶寬需求。端口速率是 以太網(wǎng)芯片的每個(gè)端口每秒鐘傳輸?shù)淖畲?bit 數(shù)量,是衡量芯片性能的重要指標(biāo)。近年數(shù)字 經(jīng)濟(jì)的快速發(fā)展,推動了云計(jì)算、人工智能、大數(shù)據(jù)等技術(shù)產(chǎn)業(yè)的快速發(fā)展和傳統(tǒng)產(chǎn)業(yè)數(shù) 字化的轉(zhuǎn)型,全球范圍內(nèi)數(shù)據(jù)快速的增長對網(wǎng)絡(luò)帶寬提出新的要求。根據(jù)信通院《數(shù)據(jù)中 心產(chǎn)業(yè)圖譜研究報(bào)告》預(yù)測,100G、400G 及以上的市場需求將逐漸增多,預(yù)計(jì) 400G 產(chǎn) 品最終會占據(jù)優(yōu)勢地位,中長期來看,預(yù)計(jì) 400G 數(shù)據(jù)中心交換機(jī) 2022 年末有望成為營收 主力,2023 年開始 800G 交換機(jī)有望得到快速發(fā)展。根據(jù)灼識咨詢預(yù)測,100G 以上占比 將從 2020 年的 24.1%提升至 2025 年的 44.2%。
國內(nèi)商用交換芯片行業(yè)集中度高,海外巨頭壟斷,盛科通信為頭部國產(chǎn)商。以太網(wǎng)交換芯 片領(lǐng)域由少數(shù)參與者掌握大部分份額,2020 年中國商用以太網(wǎng)交換芯片市場中,博通、美 滿和瑞昱分別以 61.7%、20.0%和 16.1%分列前三,CR3 達(dá)到 97.8%,博通的產(chǎn)品在超大 規(guī)模的云數(shù)據(jù)中心、HPC 集群與企業(yè)網(wǎng)絡(luò)市場上占據(jù)較高份額,為以太網(wǎng)交換芯片的全球 龍頭,是盛科發(fā)展方向借鑒的對象。由于交換芯片具備較高技術(shù)、客戶、應(yīng)用和資金壁壘, 行業(yè)整體國產(chǎn)化程度較低,國內(nèi)參與廠商較少。盛科通信在中國商用以太網(wǎng)交換芯片市場 中,以銷售額計(jì)占據(jù) 1.6%的份額,排名第四,在國產(chǎn)廠商中排名第一。此外,2020 年中 國萬兆以上商用以太網(wǎng)交換芯片市場中,盛科通信市占率達(dá) 2.3%。
AI產(chǎn)業(yè)化再加速,GPU智能大時(shí)代已開啟
(報(bào)告出品方/作者:華金證券,孫遠(yuǎn)峰、王臣復(fù)、王海維)
1.由專用走向通用,GPU賽道壁壘高筑
什么是GPU
圖形處理器(graphics processing unit,縮寫:GPU), 又稱顯示核心、視覺處理器、顯示芯片,是一種專門在個(gè) 人電腦、工作站、游戲機(jī)和一些移動設(shè)備(如平板電腦、 智能手機(jī)等)上做圖像和圖形相關(guān)運(yùn)算工作的微處理器。NVIDIA公司在1999年發(fā)布GeForce 256圖形處理芯片時(shí)首 先提出GPU的概念。從此NVIDIA顯卡的芯片就用這個(gè)新名 字GPU來稱呼。GPU使顯卡削減了對CPU的依賴,并執(zhí)行部 分原本CPU的工作,尤其是在3D圖形處理時(shí)。
始于圖形處理設(shè)備
最早計(jì)算機(jī)是黑白顯示的時(shí)代,機(jī)器對于顯示的要求極低,隨著計(jì)算機(jī)的普及和軟件的多樣化,使用者對于顯示的要求越來越高。VGA(Video Graphics Array,視頻圖形陣列)是一種標(biāo)準(zhǔn)的顯示接口,是IBM于1987年提出的一個(gè)使用模擬信號的電腦顯示標(biāo)準(zhǔn)。VGA標(biāo)準(zhǔn)由于可以呈現(xiàn)的彩色顯示能力大大加強(qiáng),因此迅速成為了顯示設(shè)備的標(biāo)準(zhǔn),也推動了VGA Card也即是顯卡的誕生。早期的VGA Card的唯一功能是輸出圖像,圖形運(yùn)算全部依賴CPU,當(dāng)微軟Windows操作系統(tǒng)出現(xiàn)后,大量的圖形運(yùn)算占據(jù)了CPU的大量資源,如果沒有專門的芯片來處理圖形運(yùn)算,Windows界面運(yùn)作會大受影響而變得卡頓,因此出現(xiàn)專門處理圖形運(yùn)算的芯片成為必然趨勢。1993年1月,英偉達(dá)創(chuàng)立,1999年,英偉達(dá)發(fā)布了劃時(shí)代的產(chǎn)品GeForce 256,首次推出了所謂圖形處理器(GPU,Graphic Processing Unit)的概念,它帶來了3D圖形性能的一次革命。
浮點(diǎn)計(jì)算能力與可編程性結(jié)合
GeForce 256 是一款用于實(shí)時(shí)圖形處理的專用處理器,GeForce圖形處理器的發(fā)布,實(shí)現(xiàn)了頂點(diǎn)的矩陣變換和光照計(jì)算,圖形實(shí)時(shí)處理應(yīng)用需要高內(nèi)存帶寬和大量的浮點(diǎn)計(jì)算能力。2001年英偉達(dá)發(fā)布了第三代顯示核心GeForce3,GeForce3不僅集成了來自之前GeForce 256和GeForce2芯片的“靜態(tài)”座標(biāo)轉(zhuǎn)換和照明引擎,更增加了稱為“頂點(diǎn)著色單元”的可編程頂點(diǎn)處理器功能。游戲開發(fā)者可借由加上頂點(diǎn)程序,讓游戲產(chǎn)生令人驚艷的全新效果??删幊绦耘c浮點(diǎn)計(jì)算能力相結(jié)合,基于GPU的通用計(jì)算也開始出現(xiàn),GPU朝著通用計(jì)算的方向持續(xù)演進(jìn)。2006年,英偉達(dá) CUDA(Compute Unified Device Architecture,統(tǒng)一計(jì)算設(shè)備架構(gòu)),及對應(yīng)工業(yè)標(biāo)準(zhǔn)的OpenCL的出現(xiàn),讓GPU實(shí)現(xiàn)更廣泛的通用計(jì)算功能,GPGPU的概念落地。
GPU發(fā)展三大方向
GPU最初用在PC和移動端上運(yùn)行繪圖運(yùn)算工作的微處理器,與CPU集成以集成顯卡(核顯)的形態(tài)發(fā)揮功能。NVIDIA于2007年率先推出獨(dú)立GPU(獨(dú)顯),使其作為“協(xié)處理器”在PC和服務(wù)器端負(fù)責(zé)加速計(jì)算,承接CPU計(jì)算密集部分的工作負(fù)載,同時(shí)由CPU繼續(xù)運(yùn)行其余程序代碼。2019年NVIDIA的中國GTC大會設(shè)置了兩大主題:AI和圖形。從大會的關(guān)注重點(diǎn)可以看出,GPU未來趨勢主要是3個(gè):大規(guī)模擴(kuò)展計(jì)算能力的高性能計(jì)算(GPGPU)、人工智能計(jì)算(AIGPU)、更加逼真的圖形展現(xiàn)(光線追蹤RayTracingGPU)。
GeForce RTX 40系列,時(shí)代最強(qiáng)
2022秋季GTC大會上,英偉達(dá)發(fā)布GeForce RTX 40系列GPU,旨在為游戲玩家和創(chuàng)作者提供革命 性性能,其中新旗艦產(chǎn)品RTX 4090 GPU的性能相 較上一代提升最高可達(dá)4倍。作為全球首款基于 全新NVIDIA Ada Lovelace架構(gòu)的GPU,RTX 40 系列在性能和效率上都實(shí)現(xiàn)了巨大的代際飛躍, 根據(jù)NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛的介紹, RTX光線追蹤和神經(jīng)網(wǎng)絡(luò)渲染的時(shí)代正在全面展 開。RTX 40系列GPU具有一系列新的技術(shù)創(chuàng)新:包括 流式多處理器具有高達(dá)83 TFLOPS的著色器能力、 第三代RT Cores的有效光線追蹤計(jì)算能力達(dá)到 191 TFLOPS、第四代Tensor Cores具有高達(dá)1.32 Petaflops的FP8張量處理性能、著色器執(zhí)行重排 序(SER)通過即時(shí)重新安排著色器負(fù)載來提高 執(zhí)行效率、Ada光流加速器帶來2倍的性能提升、 架構(gòu)上改進(jìn)來實(shí)現(xiàn)與TSMC 4N定制工藝技術(shù)緊密 結(jié)合等。
2. 產(chǎn)業(yè)化路徑顯現(xiàn),全球AI競賽再加速
AI技術(shù)賦能實(shí)體經(jīng)濟(jì)面臨的瓶頸
過去,絕大部分人工智能企業(yè)和研究機(jī)構(gòu)遵循算法、算力和數(shù)據(jù)三位一體的研究范式,即以一定的算力和數(shù)據(jù)為基礎(chǔ),使用開源算法框架訓(xùn)練智能模型。而這也導(dǎo)致了當(dāng)前大部分人工智能處于“手工作坊式”階段,面對各類行業(yè)的下游應(yīng)用,AI逐漸展現(xiàn)出碎片化、多樣化的特點(diǎn),也出現(xiàn)了模型通用性不高的缺陷。這不僅是AI技術(shù)面臨的挑戰(zhàn),也限制了AI的產(chǎn)業(yè)化進(jìn)程。隨著人工智能賦能實(shí)體經(jīng)濟(jì)進(jìn)入深水區(qū),企業(yè)通常面臨數(shù)據(jù)資源有限、算力投資難度大、模型泛化能力差、高水平人才稀缺的發(fā)展瓶頸。
ChatGPT的破圈
聊天生成型預(yù)訓(xùn)練變換模型(Chat Generative Pre-trained Transformer)簡稱ChatGPT,是OpenAI開發(fā)的人工智慧聊天機(jī)器人程序,于2022年11月推出,上線兩個(gè)月后已有上億用戶。ChatGPT目前仍以文字方式互動,而除了可以用人類自然對話方式來互動,還可以用于甚為復(fù)雜的語言工作,包括自動生成文本、自動問答、自動摘要等多種任務(wù)。
ChatGPT的成功離不開預(yù)訓(xùn)練大模型
人工智能需要用大量的數(shù)據(jù)對其進(jìn)行訓(xùn)練,理論上來講,投喂數(shù)據(jù)越多、數(shù)據(jù)質(zhì)量越高,模型效果就會越好。而預(yù)訓(xùn)練 (Pre-trained Models,PTMs),就是預(yù)先訓(xùn)練好的模型,可以幫助人們降低模型創(chuàng)建和訓(xùn)練的成本。預(yù)訓(xùn)練大模型需要深度學(xué)習(xí)的算法,也需要大的數(shù)據(jù)、大的算力,做自監(jiān)督學(xué)習(xí)(模型直接從無標(biāo)簽數(shù)據(jù)中自行學(xué)習(xí),無需標(biāo)注數(shù)據(jù)),再面向不同的任務(wù)、在不同的應(yīng)用場景里做少量任務(wù)數(shù)據(jù)進(jìn)行遷移學(xué)習(xí),進(jìn)而應(yīng)用于很多場景。ChatGPT能夠?qū)崿F(xiàn)當(dāng)前的交互,離不開OpenAI在AI預(yù)訓(xùn)練大模型領(lǐng)域的積累。
預(yù)訓(xùn)練模型的發(fā)展歷程
預(yù)訓(xùn)練的研究最早起源于遷移學(xué)習(xí)。遷移學(xué) 習(xí)的核心思想,即運(yùn)用已有的知識來學(xué)習(xí)新 的知識,通俗來說就是將一個(gè)預(yù)訓(xùn)練的模型 被重新用在另一個(gè)任務(wù)中。早期的預(yù)訓(xùn)練模 型主要基于有標(biāo)簽數(shù)據(jù)。而在NLP領(lǐng)域,由 于下游任務(wù)的多樣性以及數(shù)據(jù)標(biāo)注的復(fù)雜性, 導(dǎo)致無法獲得一個(gè)像ImageNet這樣大規(guī)模的 有標(biāo)簽數(shù)據(jù),所以NLP領(lǐng)域嘗試使用自監(jiān)督 學(xué)習(xí)的方法來獲取預(yù)訓(xùn)練模型,自監(jiān)督學(xué)習(xí) 的主要思想就是利用文本間的內(nèi)在聯(lián)系為監(jiān) 督信號。2017年出現(xiàn)的Transformer結(jié)構(gòu),給NLP領(lǐng)域 預(yù)訓(xùn)練模型的發(fā)展帶來了絕大的突破。Transformer的成功,也誘使CV領(lǐng)域加入了 自監(jiān)督預(yù)訓(xùn)練模型的賽道。如今,自監(jiān)督預(yù) 訓(xùn)練已經(jīng)成為當(dāng)前人工智能研究的重點(diǎn),幾 乎所有的最新的PTM都是采用類Transformer 結(jié)構(gòu)與自監(jiān)督學(xué)習(xí)的方法。
Transformer架構(gòu)成主流
2017年,谷歌團(tuán)隊(duì)首先提出Transformer模型。該團(tuán)隊(duì)將Transformer概括為一句話:“Attention is AllYouNeed.”目前Transformer已經(jīng)成為自然語言處理領(lǐng)域的主流模型,基于Transformer的預(yù)訓(xùn)練語言模型更是成為主流。除了NLP 之外,Transformer 也逐漸成為很多基于序列的語音應(yīng)用的主流AI模型,在很多場景中已取代RNN/LSTM,比如自動語音識別、語音合成等等 。Transformer受歡迎的主要原因是其架構(gòu)引入了并行化,它利用了強(qiáng)大的TPU和并行訓(xùn)練,從而減少了訓(xùn)練時(shí)間。
3. 全維智能化大時(shí)代,國產(chǎn)算力行則必至
全球數(shù)據(jù)中心負(fù)載任務(wù)量快速增長
大規(guī)模張量運(yùn)算、矩陣運(yùn)算是人工智能在計(jì)算層面的突出需求,高并行度的深度學(xué)習(xí)算法在視覺、語音和自然語言處理等領(lǐng)域上的廣泛應(yīng)用使得計(jì)算能力需求呈現(xiàn)指數(shù)級增長。根據(jù)IDC的預(yù)測,從2018年至2025年,全球的數(shù)據(jù)增長量達(dá)到5倍以上,將從2018年的32ZB增至2025年的175ZB。中國將在2025年以48.6ZB的數(shù)據(jù)量及27.8%的占比成為全球最大的數(shù)據(jù)匯集地。根據(jù)Cisco的預(yù)計(jì),2021年全球數(shù)據(jù)中心負(fù)載任務(wù)量將超過2016年的兩倍,從2016年的不到250萬個(gè)負(fù)載任務(wù)量增長到2021年的近570萬個(gè)負(fù)載任務(wù)量。
全球計(jì)算產(chǎn)業(yè)投資空間巨大
根據(jù)《鯤鵬計(jì)算產(chǎn)業(yè)發(fā)展白皮書》內(nèi)容顯示,數(shù)字化浪潮正重塑世界經(jīng)濟(jì)格局,數(shù)字經(jīng)濟(jì)正在成為全球可持續(xù)增長的引擎。IDC預(yù)測,到2023年數(shù)字經(jīng)濟(jì)產(chǎn)值將占到全球GDP的62%,全球進(jìn)入數(shù)字經(jīng)濟(jì)時(shí)代。新的計(jì)算產(chǎn)業(yè)鏈將推動全球計(jì)算產(chǎn)業(yè)快速發(fā)展,帶動全球數(shù)字經(jīng)濟(jì)走向繁榮。IDC預(yù)測,到2023年,全球計(jì)算產(chǎn)業(yè)投資空間1.14萬億美元。中國計(jì)算產(chǎn)業(yè)投資空間1043億美元,接近全球的10%,是全球計(jì)算產(chǎn)業(yè)發(fā)展的主要推動力和增長引擎。
預(yù)訓(xùn)練大模型對于GPU的需求
根據(jù)TrendForce的估計(jì),2020年,GPT模型處理訓(xùn)練數(shù)據(jù)所需的GPU數(shù)量達(dá)到了20000左右。展望未來,GPT模型(或ChatGPT)商業(yè)化所需的GPU數(shù)量預(yù)計(jì)將達(dá)到30000個(gè)以上。這些均使用英偉達(dá)的A100 GPU作為計(jì)算基礎(chǔ)。根據(jù)中關(guān)村在線的新聞顯示,目前英偉達(dá)A100顯卡的售價(jià)在1.00~1.50萬美元之間。英偉達(dá)還將A100作為DGXA100系統(tǒng)的一部分進(jìn)行銷售,該系統(tǒng)具有八塊A100,兩塊AMD Rome 7742 CPU,售價(jià)高達(dá)199,000美元。
國內(nèi)市場需求將保持高增長
人工智能領(lǐng)域的應(yīng)用目前處于技術(shù)和需求融合的高速發(fā)展階段,在運(yùn)算加速方面逐漸形成了以GPGPU解決方案為主的局面。根據(jù)前瞻產(chǎn)業(yè)研究院的數(shù)據(jù),未來幾年內(nèi),中國人工智能芯片市場規(guī)模將保持年均40%至50%的增長速度,到2024年,市場規(guī)模將達(dá)到785億元。聚集強(qiáng)大人工智能算力的智算中心是中國數(shù)字經(jīng)濟(jì)高速發(fā)展的產(chǎn)物,是一種新型的公共基礎(chǔ)設(shè)施。國家已經(jīng)出臺了相關(guān)政策,并把智算中心列為“新基建”。
云計(jì)算及云部署方式
云計(jì)算廣義的來說是廠商通過建立網(wǎng)絡(luò)服務(wù)器集群,向各種不同類型客戶提供在線軟件服務(wù)、硬件租借、數(shù)據(jù)存儲、計(jì)算分析等不同類型的服務(wù)。云計(jì)算按后臺位置主要分為公有云、私有云(含政務(wù)云)、混合云三種形態(tài)。目前國內(nèi)主流公有云如阿里云、華為云、騰訊云等。私有云如政務(wù)云、金融云、工業(yè)云、物流云等。
企業(yè)上云持續(xù)向細(xì)分行業(yè)滲透
據(jù)Gartner公司測算,2015-2021年,全球政府和企業(yè)的云計(jì)算市場滲透率逐年上升,由4.3%上升至15.3%。云計(jì)算用戶已經(jīng)遍及互聯(lián)網(wǎng)、政務(wù)、金融、教育、制造等各個(gè)行業(yè)。在中國,互聯(lián)網(wǎng)行業(yè)是云計(jì)算產(chǎn)業(yè)的主流應(yīng)用行業(yè),占比約為1/3;在政策驅(qū)動下,中國政務(wù)云近年來實(shí)現(xiàn)高增長,政務(wù)云占比約為29%;交通物流、金融、制造等行業(yè)領(lǐng)域的云計(jì)算應(yīng)用水平正在快速提高,占據(jù)了更重要的市場地位。
4.重點(diǎn)公司分析
瑞芯微主要致力于大規(guī)模集成電路及應(yīng)用方案的設(shè)計(jì)、開發(fā)和銷售,在大規(guī)模SoC芯片設(shè)計(jì)、數(shù)模混合芯片設(shè)計(jì)、影像處理、高清視頻編解碼、人工智能及系統(tǒng)軟件開發(fā)上具有豐富的經(jīng)驗(yàn)和技術(shù)儲備,形成了多層次、多平臺、多場景的專業(yè)解決方案,賦能智能硬件、機(jī)器視覺、行業(yè)應(yīng)用、消費(fèi)電子、汽車電子等多元領(lǐng)域。公司產(chǎn)品涵蓋智能應(yīng)用處理器芯片、數(shù)?;旌闲酒?、接口轉(zhuǎn)換芯片、無線連接芯片及與自研芯片相關(guān)的模組產(chǎn)品等,并為客戶提供技術(shù)服務(wù)。
晶晨股份
晶晨半導(dǎo)體是全球布局、國內(nèi)領(lǐng)先的無晶圓半導(dǎo)體系統(tǒng)設(shè)計(jì)廠商,為智能機(jī)頂盒、智能電視、音視頻系統(tǒng)終端、無線連接及車載信息娛樂系統(tǒng)等多個(gè)產(chǎn)品領(lǐng)域提供多媒體SoC芯片和系統(tǒng)級解決方案,業(yè)務(wù)覆蓋全球主要經(jīng)濟(jì)區(qū)域,積累了全球知名的客戶群。產(chǎn)品技術(shù)先進(jìn)性和市場覆蓋率位居行業(yè)前列,為智能機(jī)頂盒芯片的領(lǐng)導(dǎo)者、智能電視芯片的引領(lǐng)者和音視頻系統(tǒng)終端芯片的開拓者。晶晨半導(dǎo)體擁有豐富的SoC全流程設(shè)計(jì)經(jīng)驗(yàn),堅(jiān)持超高清多媒體編解碼和顯示處理、內(nèi)容安全保護(hù)、系統(tǒng)IP等核心軟硬件技術(shù)開發(fā),整合業(yè)界領(lǐng)先的CPU/GPU技術(shù)和先進(jìn)制程工藝,實(shí)現(xiàn)前所未有的成本、性能和功耗優(yōu)化,提供基于多種開放平臺的完整系統(tǒng)解決方案,幫助全球頂級運(yùn)營商、OEM、ODM等客戶快速部署市場。
星宸科技
公司為全球領(lǐng)先的視頻監(jiān)控芯片企業(yè),主營業(yè)務(wù)為視頻監(jiān)控芯片的研發(fā)及銷售,產(chǎn)品主要應(yīng)用于智能安防、視頻對講、智能車載等領(lǐng)域。公司在芯片設(shè)計(jì)全流程具有豐富經(jīng)驗(yàn),可支撐大型先進(jìn)工藝下的SoC設(shè)計(jì)。公司自研全套AI技術(shù),包含AI處理器指令集、AI處理器IP及其編譯器、仿真器等全套AI處理器工具鏈。公司擁有大量核心IP資源,包含圖像IP、視頻IP、高速模擬IP和音頻IP等。公司在視頻監(jiān)控領(lǐng)域持續(xù)研發(fā)創(chuàng)新,在圖像信號處理、音視頻編解碼、顯示處理等領(lǐng)域具有領(lǐng)先優(yōu)勢,并積極投入AI等新領(lǐng)域的芯片研發(fā)。公司擁有ISP技術(shù)、AI處理器技術(shù)、多模視頻編碼技術(shù)、高速高精度模擬電路技術(shù)、先進(jìn)制程SoC芯片設(shè)計(jì)技術(shù)等多項(xiàng)核心技術(shù),公司擁有已授權(quán)專利92項(xiàng),其中境內(nèi)發(fā)明專利11項(xiàng),境外專利81項(xiàng);在申請中專利154項(xiàng),其中境內(nèi)發(fā)明專利63項(xiàng),境外專利91項(xiàng)。
公司是領(lǐng)先的智能應(yīng)用處理器SoC、高性能模擬器件和無線互聯(lián)芯片設(shè)計(jì)廠商。公司目前的主營業(yè)務(wù)為系智能應(yīng)用處理器SoC、高性能模擬器件和無線互聯(lián)芯片的研發(fā)與設(shè)計(jì)。主要產(chǎn)品為智能應(yīng)用處理器SoC、高性能模擬器件和無線互聯(lián)芯片,產(chǎn)品廣泛適用于智能硬件、平板電腦、智能家電、車聯(lián)網(wǎng)、機(jī)器人、虛擬現(xiàn)實(shí)、網(wǎng)絡(luò)機(jī)頂盒以及電源模擬器件、無線通信模組、智能物聯(lián)網(wǎng)等多個(gè)產(chǎn)品領(lǐng)域。公司以客戶為中心,凝聚卓越團(tuán)隊(duì)和堅(jiān)持核心技術(shù)長期投入,在超高清視頻編解碼、高性能CPU/GPU/AI多核整合、先進(jìn)工藝的高集成度、超低功耗、全棧集成平臺等方面提供具有市場突出競爭力的系統(tǒng)解決方案和貼心服務(wù)。
報(bào)告節(jié)選:
編輯:黃飛
?
評論