9月14-15日,2023全球AI芯片峰會將在深圳灣萬麗酒店舉行。清華大學教授、中國半導體行業(yè)協(xié)會副理事長魏少軍領銜50+位演講嘉賓,NVIDIA高通英特爾AMD齊聚,近30家中國AI芯片與算力企業(yè)登臺交鋒,4家Chiplet創(chuàng)業(yè)創(chuàng)新團隊亮相,6位分析師和投資人帶來報告分享。峰會最終議程已公布,歡迎大家報名,線下參會交流。
由 GPT-4 等大型語言模型 (LLM) 支持的生成式人工智能在科技界引起了巨大震動。ChatGPT 的迅速崛起引發(fā)了全球科技行業(yè)對人工智能的重新評估和優(yōu)先考慮,實時重塑了產(chǎn)品戰(zhàn)略。
LLM 的整合為產(chǎn)品開發(fā)人員提供了一種簡便的方法,將人工智能驅動的功能融入到他們的產(chǎn)品中。但并非一帆風順。產(chǎn)品領導者面臨著一個巨大的挑戰(zhàn):GPU 短缺和成本飆升。
01.LLMs的興起和GPU短缺
越來越多的人工智能初創(chuàng)公司和服務導致對 A100 和 H100 等高端 GPU 的高需求,從而壓垮了 Nvidia 及其制造合作伙伴臺積電,兩者都在努力滿足供應。Reddit 等在線論壇上充斥著對 GPU 可用性的不滿,這呼應了整個技術社區(qū)的情緒。情況變得如此可怕,AWS 和 Azure 都別無選擇,只能實施配額系統(tǒng)。
這個瓶頸不僅擠壓了初創(chuàng)企業(yè),也擠壓了初創(chuàng)企業(yè)的發(fā)展。對于 OpenAI 這樣的科技巨頭來說,這是一個絆腳石。最近在倫敦舉行的一次非正式會議上,OpenAI 首席執(zhí)行官 Sam Altman坦誠承認,計算機芯片短缺正在阻礙 ChatGPT 的進步。據(jù)報道,Altman 感嘆計算能力的缺乏導致 API 可用性低于標準,并阻礙 OpenAI 為 ChatGPT 推出更大的“上下文窗口”。
推薦一場會議。2023全球AI芯片峰會將于9月14-15日在深圳灣萬麗酒店舉行,NVIDIA 解決方案與架構技術總監(jiān)張瑞華首次參會,將圍繞《生成式 AI 與大語言模型時代的 NVIDIA GPU 生態(tài)》這一主題帶來演講。歡迎大家報名參會~
02.優(yōu)先考慮AI功能
一方面,產(chǎn)品領導者發(fā)現(xiàn)自己陷入了不懈的創(chuàng)新之中,面臨著利用新一代人工智能的力量提供尖端功能的期望。另一方面,他們還要應對 GPU 容量限制的嚴峻現(xiàn)實。這是一個復雜的雜耍行為,無情的優(yōu)先順序不僅成為戰(zhàn)略決策,而且成為必要。 鑒于 GPU 可用性在可預見的未來仍將是一個挑戰(zhàn),產(chǎn)品領導者必須戰(zhàn)略性地考慮 GPU 分配。傳統(tǒng)上,產(chǎn)品領導者依賴于優(yōu)先級劃分技術,例如客戶價值/需求與努力矩陣。無論這種方法在計算資源豐富的世界中多么合乎邏輯,現(xiàn)在都需要進行一些重新評估。 在我們當前的范式中,計算是限制因素,而不是軟件人才,產(chǎn)品領導者必須重新定義如何確定各種產(chǎn)品或功能的優(yōu)先級,將 GPU 的限制帶到戰(zhàn)略決策的最前沿。 對于科技行業(yè)來說,圍繞容量限制進行規(guī)劃似乎不尋常,但在其他行業(yè)卻是一種常見策略。基本概念很簡單:最有價值的因素是在受限資源上花費的時間,目標是優(yōu)化在該約束上花費的每單位時間的價值。
03.技術成功指標
作為一名前顧問,我已成功地將這個框架應用于各個行業(yè)。我相信,在 GPU 限制存在的情況下,科技產(chǎn)品領導者也可以使用類似的方法來確定產(chǎn)品或功能的優(yōu)先級。應用此框架時,最直接的價值衡量標準是盈利能力。 然而,在科技領域,盈利能力可能并不總是合適的衡量標準,特別是在涉足新市場或新產(chǎn)品時。因此,我調(diào)整了該框架,以與技術中普遍使用的成功指標保持一致,概述了一個簡單的四個步驟過程:
1.貢獻 首先也是最重要的,確定你的北極星指標。這是每個產(chǎn)品或功能的貢獻,概括了其價值的本質。一些具體的例子可能包括:
收入和利潤增加
市場份額的增長
日/月活躍用戶數(shù)增長
2. 所需GPU數(shù)量 衡量每個產(chǎn)品或功能所需的 GPU 數(shù)量。重點關注關鍵因素,包括:
每個用戶每天的查詢數(shù)
日活躍用戶數(shù)
查詢的復雜性(每個查詢消耗多少令牌)
3.計算每個GPU的貢獻
把它分解到具體細節(jié)。每個 GPU 對總體目標有何貢獻?了解這一點將使您清楚地了解 GPU 的最佳分配位置。 根據(jù)每個 GPU 的貢獻確定產(chǎn)品的優(yōu)先級 現(xiàn)在,是時候做出艱難的決定了。根據(jù)每個 GPU 的貢獻對您的產(chǎn)品進行排名,然后進行相應的排列。首先關注每 GPU 貢獻最高的產(chǎn)品,確保將有限的資源投入到能夠產(chǎn)生最大影響的領域。 由于GPU 限制不再是盲點,而是決策過程中的可量化因素,您的公司可以更有策略地應對 GPU 短缺問題。為了使這個框架變得生動起來,讓我們想象一個場景,在這個場景中,作為產(chǎn)品領導者,您正在努力應對在四種不同產(chǎn)品之間確定優(yōu)先級的挑戰(zhàn):
盡管產(chǎn)品 A 具有最高的收入潛力,但它并沒有為每個 GPU 帶來最高的貢獻。令人驚訝的是,產(chǎn)品 D 的收入潛力最小,但每個 GPU 的回報卻最高。通過根據(jù)此指標確定優(yōu)先級,您可以最大化總潛在收入。 假設您總共有 1,000 個 GPU 可供使用。一個簡單的選擇可能會讓您選擇產(chǎn)品 A,從而產(chǎn)生 1 億美元的潛在收入。但是,通過應用上述優(yōu)先級策略,您可以獲得 1.55 億美元的收入:
同樣的方法可以應用于其他貢獻指標,例如市場份額增益:
同樣,選擇產(chǎn)品 A 會導致市場份額增加 5%。然而,應用上述優(yōu)先級策略,您可以獲得 7.75% 的市場份額增益:
04.優(yōu)點和限制
這種替代的優(yōu)先級框架引入了一種更加細致和更具戰(zhàn)略性的方法。通過專注于每個 GPU 的貢獻,您可以戰(zhàn)略性地調(diào)整資源,使其能夠發(fā)揮最大的作用,無論是在收入、市場份額還是任何其他定義指標方面。 但優(yōu)點還不止于此。這種方法還可以增強產(chǎn)品團隊的清晰度和客觀性。根據(jù)我的經(jīng)驗,包括我早期在一家醫(yī)療保健公司領導數(shù)字化轉型以及后來與麥肯錫的各種客戶合作時,這種方法在容量限制是關鍵因素的情況下改變了游戲規(guī)則。它使我們能夠以更加數(shù)據(jù)驅動和理性的方式確定計劃的優(yōu)先順序,從而將傳統(tǒng)政治邊緣化,否則決策可能會落在房間里最響亮的聲音的手中。 然而,不存在一刀切的解決方案,并且值得承認這種方法的潛在局限性。例如,這種方法可能并不總是體現(xiàn)某些投資的戰(zhàn)略重要性。因此,雖然可以而且應該對框架做出例外,但應該仔細考慮例外情況,而不是規(guī)范。這樣可以保持流程的完整性,并確保任何偏差都是在考慮到更廣泛的戰(zhàn)略背景的情況下做出的。
05.結論
產(chǎn)品領導者面臨著前所未有的GPU 短缺局面,因此需要尋找新的資源管理方法。用偉大的軍事家孫子的話來說,“混亂之中也蘊藏著機遇”。 GPU 短缺確實是一個挑戰(zhàn),但如果采取正確的方法,它也可能成為差異化和成功的催化劑。所提出的優(yōu)先級框架側重于每個 GPU 的貢獻,提供了一種確定優(yōu)先級的戰(zhàn)略方法。通過專注于每個 GPU 的貢獻,公司可以最大限度地提高投資回報,將資源調(diào)整到能夠產(chǎn)生最大影響的地方,并專注于對公司長期成功最重要的事情。
編輯:黃飛
-
NVIDIA
+關注
關注
14文章
5308瀏覽量
106342 -
gpu
+關注
關注
28文章
4943瀏覽量
131203 -
人工智能
+關注
關注
1806文章
49008瀏覽量
249289 -
AI芯片
+關注
關注
17文章
1983瀏覽量
35896 -
ChatGPT
+關注
關注
29文章
1589瀏覽量
9084
原文標題:GPU短缺和成本問題,如何破?
文章出處:【微信號:算力基建,微信公眾號:算力基建】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
SMT加工成本飆升:原材料短缺與價格上漲的雙重夾擊
可以手動構建imx-gpu-viv嗎?
無法在GPU上運行ONNX模型的Benchmark_app怎么解決?
OpenVINO?檢測到GPU,但網(wǎng)絡無法加載到GPU插件,為什么?
《CST Studio Suite 2024 GPU加速計算指南》
【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】--了解算力芯片GPU
【一文看懂】大白話解釋“GPU與GPU算力”

常見GPU問題及解決方法
如何選擇適合的GPU
GPU算力租用平臺怎么樣

評論