概述
我們正在開發(fā)的 AI 編譯器是可以從預訓練的深度神經(jīng)網(wǎng)絡為瑞薩的 R-Car 設備生成高性能可執(zhí)行代碼的軟件。
背景
實時執(zhí)行 CNN 推理是一項非常具有挑戰(zhàn)性的工作,因為嵌入式硬件在計算和功耗的硬件資源方面面臨著嚴格的限制。為了在 R-Car V 系列設備上有效地執(zhí)行 CNN 推理,瑞薩設計了異構架構,該架構分為可編程處理器 (CPU) 和專用于計算網(wǎng)絡各層的加速器。
至于AI編譯器,常見的軟件架構包含兩部分:編譯器“前端”和編譯器“后端”,如圖所示。深度神經(jīng)網(wǎng)絡在 AI 編譯器中被翻譯成多級 IR。編譯器前端負責與硬件無關的轉(zhuǎn)換(圖 IR)和圖優(yōu)化,而編譯器后端負責特定于硬件的優(yōu)化、代碼生成。
例子
瑞薩主要開發(fā)硬件相關的優(yōu)化算法,最大限度地利用R-Car V系列的異構架構。為了進一步提高性能,有必要了解與深度神經(jīng)網(wǎng)絡相關的最新論文,并與工程師進行技術討論。我們正在尋找該領域積極進取的工程師。
結論
深度神經(jīng)網(wǎng)絡是近年來得到廣泛研究并不斷發(fā)展的技術領域之一。瑞薩將提供先進的人工智能工具來協(xié)助自動駕駛技術的發(fā)展。
圖像
審核編輯:郭婷
-
神經(jīng)網(wǎng)絡
+關注
關注
42文章
4814瀏覽量
103583 -
AI
+關注
關注
88文章
35109瀏覽量
279634 -
編譯器
+關注
關注
1文章
1662瀏覽量
50208
發(fā)布評論請先 登錄
邊緣設備AI部署:編譯器如何實現(xiàn)輕量化與高性能?
BP神經(jīng)網(wǎng)絡與卷積神經(jīng)網(wǎng)絡的比較
BP神經(jīng)網(wǎng)絡與深度學習的關系
深度學習入門:簡單神經(jīng)網(wǎng)絡的構建與實現(xiàn)
Triton編譯器在機器學習中的應用
Triton編譯器與其他編譯器的比較
Triton編譯器功能介紹 Triton編譯器使用教程
卷積神經(jīng)網(wǎng)絡的實現(xiàn)工具與框架
卷積神經(jīng)網(wǎng)絡與傳統(tǒng)神經(jīng)網(wǎng)絡的比較
深度學習中的卷積神經(jīng)網(wǎng)絡模型
Moku人工神經(jīng)網(wǎng)絡101

評論