在近日舉行的 GTC 大會上,蔚來 AI 平臺負責人白宇利帶來非常有價值的分享,他首次對外透露了蔚來自研的全棧式自動駕駛系統(tǒng)(NAD)的部署和開發(fā)情況,同時也將蔚來自動駕駛研發(fā)平臺(NADP)這個神秘的“Peta Factory”帶到了公眾視野中。
據(jù)了解,NADP是服務于蔚來自動駕駛核心業(yè)務方向的研發(fā)平臺,用于開發(fā) NAD 功能。以“Peta”為名是因為每輛車每天能生成 55 petabit數(shù)據(jù)(1 petabit = 10^6 gigabit = 10^9 megabit = 10^15 bits),而 NADP 是所有流程、工作流、數(shù)據(jù)以及底層軟硬件的組合。NADP 能夠以一站式平臺管理大量復雜的 AI 應用,并將模型開發(fā)效率提高 20 倍,從而縮短自動駕駛汽車的上市周期,開發(fā)出更新、更快的架構(gòu)。
在模型訓練、測試和部署的過程中,為了確保新改進能夠切實地解決相應問題,且不會引發(fā)任何新問題, NADP 需要執(zhí)行 10 萬項推理任務,包括數(shù)據(jù)挖掘、仿真和回歸測試。經(jīng)過眾多方案的對比和篩選,蔚來選用了NVIDIA Triton 推理服務器作為核心組件,構(gòu)建了 NADP 的高性能推理服務。
正如白宇利在分享中提到:“我們基于 NVIDIA Triton 推理服務器構(gòu)建了高性能推理服務。此服務非常適用于 NADP,并可輕松集成模型倉庫、工作流、Jupyter、Prometheus 和許多其他組件,從而簡化 AI 推理。Triton 讓編排和擴展變得更輕松,還能將推理速度提高至 6 倍,并可節(jié)省 24% 的資源?!?/p>
蔚來基于 NVIDIA Triton 搭建的推理服務平臺,在數(shù)據(jù)挖掘業(yè)務場景下,通過服務器端模型前處理和多模型 DAG 式編排,GPU 資源平均節(jié)省 24%;在部分核心 pipeline 上,吞吐能力提升為原來的 5 倍,整體時延降低為原來的 1/ 6。
Triton 在設計之初,就融入了云原生的設計思路,為后面逐步圍繞 Triton 搭建完整的云原生平臺性推理解決方案提供了相當大的便利。
作為 NADP 推理平臺的核心組件,Triton 與 NADP 的各個組件形成了一套完整的推理一站式解決方案。從集成效率、高性能、易用性、高可用四方面,在 NADP 推理平臺中提供助力。
目前,NADP 數(shù)據(jù)挖掘業(yè)務下的相關模型預測服務已經(jīng)全部遷移至 Triton 推理服務器,為上百個模型提供了高吞吐預測能力。同時在某些任務基礎上,通過自實現(xiàn)前處理算子、前后處理服務化、BLS 串聯(lián)模型等手段,將一些模型任務合并起來,極大的提升了處理效率。
審核編輯:湯梓紅
-
NVIDIA
+關注
關注
14文章
5188瀏覽量
105445 -
自動駕駛
+關注
關注
788文章
14129瀏覽量
168893 -
蔚來
+關注
關注
1文章
515瀏覽量
14796
原文標題:成功案例:蔚來 NADP + NVIDIA Triton,搭建穩(wěn)定高效的推理平臺
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關推薦
企業(yè)使用NVIDIA NeMo微服務構(gòu)建AI智能體平臺
英偉達GTC2025亮點:Oracle與NVIDIA合作助力企業(yè)加速代理式AI推理

英偉達GTC25亮點:NVIDIA Dynamo開源庫加速并擴展AI推理模型
Oracle 與 NVIDIA 合作助力企業(yè)加速代理式 AI 推理

蔚來能源與長城汽車達成充電服務合作
企業(yè)云服務器平臺設計與搭建
蔚來能源與阿維塔達成充電服務合作協(xié)議
廣東電網(wǎng)與蔚來合作,肇慶首座蔚來換電站正式上線
NVIDIA與思科合作打造企業(yè)級生成式AI基礎設施
NVIDIA助力提供多樣、靈活的模型選擇
全新 NVIDIA NeMo Retriever微服務大幅提升LLM的準確性和吞吐量

評論