NVIDIA 為部分大型亞馬遜 Titan 基礎(chǔ)模型提供訓(xùn)練支持

本文將介紹亞馬遜如何使用 NVIDIA NeMo 框架、GPU

以及亞馬遜云科技的 EFA 來(lái)訓(xùn)練其

最大的新一代大語(yǔ)言模型（LLM）。

大語(yǔ)言模型的一切都很龐大——巨型模型是在數(shù)千顆 NVIDIA GPU 和海量的數(shù)據(jù)集上所訓(xùn)練而成。

不過(guò)這可能會(huì)給想要使用生成式 AI 的企業(yè)帶來(lái)很多巨大的挑戰(zhàn)。NVIDIA NeMo（一個(gè)用于構(gòu)建、自定義和運(yùn)行 LLM 的框架）能夠幫助企業(yè)克服上述挑戰(zhàn)。

亞馬遜云科技（AWS）有一支由資深科學(xué)家和開(kāi)發(fā)者組成的團(tuán)隊(duì)，致力于為 Amazon Bedrock（一項(xiàng)用于基礎(chǔ)模型的生成式 AI 服務(wù)）創(chuàng)建 Amazon Titan 基礎(chǔ)模型。該團(tuán)隊(duì)在過(guò)去幾個(gè)月中一直在使用 NVIDIA NeMo。

亞馬遜云科技高級(jí)應(yīng)用科學(xué)家 Leonard Lausen 表示：“我們使用 NeMo 的一大原因是它具有可擴(kuò)展性，其優(yōu)化功能使我們能夠以較高的 GPU 利用率運(yùn)行，同時(shí)能夠擴(kuò)展到更大的集群，進(jìn)而能夠更快地訓(xùn)練出模型，并向客戶交付。”

實(shí)現(xiàn)真正的大規(guī)模訓(xùn)練

NeMo 的并行技術(shù)可實(shí)現(xiàn)高效的大規(guī)模 LLM 訓(xùn)練。當(dāng)與亞馬遜云科技的 Elastic Fabric Adapter（EFA）配合使用時(shí)，團(tuán)隊(duì)可以將 LLM 擴(kuò)展到多顆 GPU 上，從而加快訓(xùn)練速度。

EFA 為亞馬遜云科技客戶提供了一個(gè) UltraCluster 聯(lián)網(wǎng)基礎(chǔ)設(shè)施，可直接連接 1 萬(wàn)多顆 GPU，并使用 NVIDIA GPUDirect 繞過(guò)操作系統(tǒng)和 CPU。

這一結(jié)合使亞馬遜云科技的科學(xué)家們能夠提供出色的模型質(zhì)量，這是只依靠其他數(shù)據(jù)并行方法無(wú)法大規(guī)模實(shí)現(xiàn)的。

通用框架

Lausen 表示：“NeMo 的靈活性支持亞馬遜云科技根據(jù)新的 Titan 模型、數(shù)據(jù)集和基礎(chǔ)設(shè)施的具體情況來(lái)定制訓(xùn)練軟件。

亞馬遜云科技的創(chuàng)新成果包括從 Amazon Simple Storage Service（Amazon S3）到 GPU 集群的高效流式傳輸。Lausen 表示：“由于 NeMo 本身就是基于標(biāo)準(zhǔn)化 LLM 訓(xùn)練管線組件的常用程序庫(kù)（如 PyTorch Lightning）所構(gòu)建的，因此整合這些改進(jìn)很容易?！?/p>

亞馬遜云科技和 NVIDIA 的共同目標(biāo)是將雙方的合作經(jīng)驗(yàn)融入到 NVIDIA NeMo 等產(chǎn)品和 Amazon Titan 等服務(wù)中，最終造福客戶。

GTC 2024 將于 2024 年 3 月 18 至 21 日在美國(guó)加州圣何塞會(huì)議中心舉行，線上大會(huì)也將同期開(kāi)放。掃描下方海報(bào)二維碼，立即注冊(cè) GTC 大會(huì)。

原文標(biāo)題：NVIDIA 為部分大型亞馬遜 Titan 基礎(chǔ)模型提供訓(xùn)練支持

文章出處：【微信公眾號(hào)：NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

英偉達(dá)

英偉達(dá)

+關(guān)注

關(guān)注
22

文章
3954

瀏覽量
93853

原文標(biāo)題：NVIDIA 為部分大型亞馬遜 Titan 基礎(chǔ)模型提供訓(xùn)練支持

文章出處：【微信號(hào)：NVIDIA-Enterprise，微信公眾號(hào)：NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

NVIDIA英偉達(dá)企業(yè)解決方案
專欄

0 文章 0 閱讀 0 粉絲 0 點(diǎn)贊

關(guān)注個(gè)人主頁(yè)

Hot NVIDIA將深度學(xué)習(xí)引入計(jì)算機(jī)圖形領(lǐng)域以推動(dòng)行業(yè)發(fā)展
Hot 一文講述Quadro RTX 5000帶來(lái)的性能提升

New 全新NVIDIA AI Blueprint精準(zhǔn)檢測(cè)信用卡交易欺詐
New 通過(guò)NVIDIA Cosmos模型增強(qiáng)機(jī)器人學(xué)習(xí)

精選推薦
更多

文章

資料

帖子

詳解上海貝嶺16/24位高精度低功耗模數(shù)轉(zhuǎn)換器BL1090系列最高速率達(dá)960SPS

上海貝嶺
6小時(shí)前

248 閱讀

凡億Allegro Skill工藝輔助之導(dǎo)出PDF

凡億PCB
8小時(shí)前

295 閱讀

基于FPGA和USB3.0通信的UVC攝像機(jī)設(shè)計(jì)方案

FPGA技術(shù)江湖
9小時(shí)前

327 閱讀

PMOS電路設(shè)計(jì)分析

張飛電子實(shí)戰(zhàn)營(yíng)
9小時(shí)前

293 閱讀

借助TI ±80V接地電平轉(zhuǎn)換器解決失調(diào)電壓挑戰(zhàn)

德州儀器
9小時(shí)前

395 閱讀

教你如何輕松解決DC-DC電源模塊常見(jiàn)應(yīng)用問(wèn)題

Hx
289KB

1積分

59下載

CodeQL掃描源碼漏洞

南中南
31.77 MB

2積分

1下載

Minikube輕松創(chuàng)建單機(jī)版Kubernetes集群

ah此生不換
83.91 MB

免費(fèi)

0下載

xiami-tools蝦米工具包

鳳毛麟角
0.01 MB

2積分

1下載

Open Policy Agent通用策略引擎

王帥
87.94 MB

免費(fèi)

0下載

【微五科技CF5010RBT60開(kāi)發(fā)板試用體驗(yàn)】使用微五科技CF5010RBT60藍(lán)牙進(jìn)行通信

jf_61512546
1天前

123 閱讀

每周推薦！電源設(shè)計(jì)及EMI精解、電機(jī)設(shè)計(jì)資料分享

ElecFans小喇叭
1天前

285 閱讀

【米爾RK3576開(kāi)發(fā)板免費(fèi)體驗(yàn)】4、移植SOEM主站

EPTmachine
1天前

257 閱讀

【米爾RK3576開(kāi)發(fā)板免費(fèi)體驗(yàn)】3、移植EtherCAT Igh

EPTmachine
1天前

283 閱讀

【RA4L1-SENSOR】電壓檢測(cè)器第一個(gè)程序FreeRTOS增加讀key,rtc,uart隊(duì)列

lustao
1天前

374 閱讀

推薦專欄
更多

企業(yè)產(chǎn)品

資料

方案
更多

搜索歷史

NVIDIA 為部分大型亞馬遜 Titan 基礎(chǔ)模型提供訓(xùn)練支持

評(píng)論