蔚來基于NVIDIA Triton搭建的推理服務平臺

在近日舉行的 GTC 大會上，蔚來 AI 平臺負責人白宇利帶來非常有價值的分享，他首次對外透露了蔚來自研的全棧式自動駕駛系統(tǒng)（NAD）的部署和開發(fā)情況，同時也將蔚來自動駕駛研發(fā)平臺（NADP）這個神秘的“Peta Factory”帶到了公眾視野中。

據(jù)了解，NADP是服務于蔚來自動駕駛核心業(yè)務方向的研發(fā)平臺，用于開發(fā) NAD 功能。以“Peta”為名是因為每輛車每天能生成 55 petabit數(shù)據(jù)（1 petabit = 10^6 gigabit = 10^9 megabit = 10^15 bits），而 NADP 是所有流程、工作流、數(shù)據(jù)以及底層軟硬件的組合。NADP 能夠以一站式平臺管理大量復雜的 AI 應用，并將模型開發(fā)效率提高 20 倍，從而縮短自動駕駛汽車的上市周期，開發(fā)出更新、更快的架構。

在模型訓練、測試和部署的過程中，為了確保新改進能夠切實地解決相應問題，且不會引發(fā)任何新問題， NADP 需要執(zhí)行 10 萬項推理任務，包括數(shù)據(jù)挖掘、仿真和回歸測試。經(jīng)過眾多方案的對比和篩選，蔚來選用了NVIDIA Triton 推理服務器作為核心組件，構建了 NADP 的高性能推理服務。

正如白宇利在分享中提到：“我們基于 NVIDIA Triton 推理服務器構建了高性能推理服務。此服務非常適用于 NADP，并可輕松集成模型倉庫、工作流、Jupyter、Prometheus 和許多其他組件，從而簡化 AI 推理。Triton 讓編排和擴展變得更輕松，還能將推理速度提高至 6 倍，并可節(jié)省 24% 的資源?！?/p>

蔚來基于 NVIDIA Triton 搭建的推理服務平臺，在數(shù)據(jù)挖掘業(yè)務場景下，通過服務器端模型前處理和多模型 DAG 式編排，GPU 資源平均節(jié)省 24%；在部分核心 pipeline 上，吞吐能力提升為原來的 5 倍，整體時延降低為原來的 1/ 6。

Triton 在設計之初，就融入了云原生的設計思路，為后面逐步圍繞 Triton 搭建完整的云原生平臺性推理解決方案提供了相當大的便利。

作為 NADP 推理平臺的核心組件，Triton 與 NADP 的各個組件形成了一套完整的推理一站式解決方案。從集成效率、高性能、易用性、高可用四方面，在 NADP 推理平臺中提供助力。

目前，NADP 數(shù)據(jù)挖掘業(yè)務下的相關模型預測服務已經(jīng)全部遷移至 Triton 推理服務器，為上百個模型提供了高吞吐預測能力。同時在某些任務基礎上，通過自實現(xiàn)前處理算子、前后處理服務化、BLS 串聯(lián)模型等手段，將一些模型任務合并起來，極大的提升了處理效率。

審核編輯：湯梓紅

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

NVIDIA

NVIDIA

+關注

關注
14

文章
5309

瀏覽量
106348
自動駕駛

自動駕駛

+關注

關注
789

文章
14314

瀏覽量
170589
蔚來

蔚來

+關注

關注
1

文章
537

瀏覽量
14923

原文標題：成功案例：蔚來 NADP + NVIDIA Triton，搭建穩(wěn)定高效的推理平臺

文章出處：【微信號：NVIDIA_China，微信公眾號：NVIDIA英偉達】歡迎添加關注！文章轉載請注明出處。

NVIDIA英偉達
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot VR、AR與MR的發(fā)展歷史以及商業(yè)應用實例
Hot NVIDIA RTX與GTX的區(qū)別是什么？

New 2025 NVIDIA創(chuàng)業(yè)企業(yè)展示杭州站圓滿收官
New NVIDIA 將恢復H20芯片在中國的銷售 NVIDIA CEO 黃仁勛在美國和中國加大推廣AI

精選推薦
更多

文章

資料

帖子

地平線征程6B成功點亮！18TOPS，助推高性價比一體機征戰(zhàn)全球市場

章鷹觀察
1小時前

515 閱讀

基于FPGA的數(shù)字識別系統(tǒng)設計

FPGA技術江湖
1小時前

139 閱讀

一文詳解CKS32K148微控制器的LPI2C模塊

中科芯MCU
1小時前

138 閱讀

codesys怎么和觸摸屏通訊

工控論壇
1小時前

151 閱讀

PWM逆變器的不同調(diào)制方法對比

翠展微電子
2小時前

154 閱讀

內(nèi)置型數(shù)據(jù)寶安裝說明

吳湛
2232

2積分

6下載

通信系統(tǒng)_西蒙赫金

小十_
16.6 MB

免費

0下載

p2pvc彩色終端視頻聊天

李舒桀
0.10 MB

免費

0下載

Peach文件下載緩存服務器

陳鍵
0.06 MB

2積分

1下載

upBootstrap3WP Bootstrap3的Wordpress主題框架

tr4578
0.32 MB

2積分

1下載

【RA-Eco-RA6M4開發(fā)板評測】——3.RA6M4的coremark跑分測試

jf_43382582
15小時前

105 閱讀

差分輸出 × 超低抖動：打造高速穩(wěn)定的大型數(shù)據(jù)同步時脈

五三一
15小時前

102 閱讀

PWM相移問題：下面是我的代碼，請問各位大佬是什么原因導致的？

jf_08053489
15小時前

217 閱讀

【RA-Eco-RA6M4開發(fā)板評測】開箱+Keil環(huán)境搭建+點燈

gtbestom
15小時前

198 閱讀

【HZ-RK3568開發(fā)板免費體驗】合眾HZ-RK3568開發(fā)環(huán)境搭建

ouxiaolong
1天前

163 閱讀

推薦專欄
更多

企業(yè)產(chǎn)品

資料

方案
更多

一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

搜索歷史

蔚來基于NVIDIA Triton搭建的推理服務平臺

評論