亚洲综合久久成人A片黑豆,高清无码免费在线DVD,国模冰冰一区二区

一個(gè)完整的醫(yī)療影像推理流程一般包含數(shù)據(jù)的前處理、AI 推理以及數(shù)據(jù)后處理這幾部分。通常情況下，我們可以通過(guò) TensorRT， TensorFlow 或者 PyTorch 這些框架來(lái)實(shí)現(xiàn) GPU 加速的 AI 推理部分，然而數(shù)據(jù)前后處理部分往往是放在 CPU 上執(zhí)行的。對(duì)于一些比較大的數(shù)據(jù)，比如 CT 或者 MR 這種 3D 圖像，CPU 上的數(shù)據(jù)前后處理會(huì)成為整個(gè)推理流程的瓶頸，導(dǎo)致推理的時(shí)延變長(zhǎng)，GPU 使用效率不高。醫(yī)療影像推理的另一個(gè)需要考慮的問(wèn)題是如何實(shí)現(xiàn)高效的部署。我們往往需要部署多個(gè)醫(yī)療影像 AI 應(yīng)用，那么如何去調(diào)度多個(gè)模型，如何并發(fā)處理多個(gè)請(qǐng)求，并充分利用 GPU 資源成為挑戰(zhàn)。

什么是 MONAI

MONAI 是一個(gè)專門針對(duì)醫(yī)療圖像的深度學(xué)習(xí)開(kāi)源框架。MONAI 致力于：

發(fā)展一個(gè)學(xué)術(shù)界、工業(yè)界和臨床研究人員共同合作的社區(qū)；

為醫(yī)療圖像創(chuàng)建最先進(jìn)的端到端工作流；

為研究人員提供創(chuàng)建和評(píng)估深度學(xué)習(xí)模型的優(yōu)化和標(biāo)準(zhǔn)化的方法。

MONAI 中包含一系列的 transforms 對(duì)醫(yī)療圖像數(shù)據(jù)進(jìn)行前后處理。在 MONAI 0.7 中，我們?cè)?transforms 中引入基于 PyTorch Tensor 的計(jì)算，許多 transforms 既支持 NumPy array，也支持 PyTorch Tensor 作為輸入類型和計(jì)算后端。當(dāng)以 PyTorch Tensor 作為輸入數(shù)據(jù)時(shí)，我們可以使用 GPU 來(lái)加速數(shù)據(jù)前后處理的計(jì)算。

什么是 NVIDIA Triton 推理服務(wù)器

Triton 推理服務(wù)器是一個(gè)開(kāi)源的 AI 模型部署軟件，可以簡(jiǎn)化深度學(xué)習(xí)推理的大規(guī)模部署。它能夠?qū)Χ喾N框架（TensorFlow、TensorRT、PyTorch、ONNX Runtime 或自定義框架），在任何基于 GPU 或 CPU 的環(huán)境上（云、數(shù)據(jù)中心、邊緣）大規(guī)模部署經(jīng)過(guò)訓(xùn)練的 AI 模型。Triton 可提供高吞吐量推理，以實(shí)現(xiàn) GPU 使用率的最大化。

在較新的版本中，Triton 增加了 Python backend 這一新特性，Python backend 的目標(biāo)是讓使用者可以更加容易的部署 Python 寫的模型，無(wú)需再去編寫任何 C++ 代碼。在一些場(chǎng)景下，我們的推理流程中可能會(huì)出現(xiàn)循環(huán)、條件判斷、依賴于運(yùn)行時(shí)數(shù)據(jù)的控制流和其他自定義邏輯與模型混合執(zhí)行。使用 Triton Python backend，開(kāi)發(fā)人員可以更加容易地在自己的推理流程中實(shí)現(xiàn)這些控制流，并且在 Python 模型中調(diào)用 Triton 部署的其他模型。

使用 MONAI 和 Triton 高效搭建和部署 GPU 加速的醫(yī)療影像推理流程

在本文介紹的例子中，我們將使用 MONAI 中 GPU 加速的數(shù)據(jù)處理以及 Triton 的 Python backend 來(lái)構(gòu)建一個(gè) GPU 加速的醫(yī)療影像推理流程。通過(guò)這個(gè)例子，讀者可以了解到，在 GPU 上進(jìn)行數(shù)據(jù)處理所帶來(lái)的性能增益，以及如何使用 Triton 進(jìn)行高效的推理部署。

整個(gè)推理流程如下圖所示，包含數(shù)據(jù)預(yù)處理，AI 模型推理，和數(shù)據(jù)后處理三部分。

通過(guò) EnsureType 這個(gè) transform，我們將輸入數(shù)據(jù)轉(zhuǎn)換成 PyTorch Tensor 并放到 GPU 上，這樣之后的數(shù)據(jù)預(yù)處理操作都會(huì)在 GPU 上進(jìn)行。我們使用 Triton 的 Torch backend 來(lái)作為 3DUnet 的推理后端，輸出的結(jié)果為 GPU 上的 Torch Tensor，并作為后處理模塊的輸入，在 GPU 上進(jìn)行后處理計(jì)算。

使用 Triton 的 Python backend，我們可以非常容易的將整個(gè)流程串聯(lián)起來(lái)，即：按照 Triton Python backend 要求的模型結(jié)構(gòu)構(gòu)建前后處理的 Python 代碼，并在其中調(diào)用 3DUnet 的推理。以下是我們例子中的代碼片段。

以 MSD Spleen 3D 數(shù)據(jù)作為輸入，經(jīng)過(guò)整個(gè)推理流程，將得到分割后的脾臟區(qū)域以及其輪廓。

性能測(cè)試

我們?cè)?RTX 8000 上對(duì)整個(gè)推理流程進(jìn)行了性能測(cè)試，以了解 Triton 及 MONAI 不同特性對(duì)性能的影響。

HTTP vs. gRPC vs. shared memory

目前 Triton 支持 HTTP， gRPC 和共享內(nèi)存等方式進(jìn)行數(shù)據(jù)通信。由于三維醫(yī)學(xué)圖像通常很大，通信帶來(lái)的開(kāi)銷不容忽視。對(duì)于許多常見(jiàn)的醫(yī)學(xué)圖像人工智能應(yīng)用，客戶端與服務(wù)器位于同一臺(tái)機(jī)器上，因此使用共享內(nèi)存是減少發(fā)送/接收開(kāi)銷的一種可行方法。在測(cè)試中，我們比較了客戶端和服務(wù)器之間使用不同通信方式對(duì)性能的影響。所有過(guò)程（前/后處理和AI推理）都在 GPU 上。我們可以得出結(jié)論，當(dāng)數(shù)據(jù)傳輸量很大時(shí)，使用共享內(nèi)存將大大減少延遲。

Pre/Post-processing on GPU vs. CPU

接著我們測(cè)試了分別在 GPU 和 CPU 進(jìn)行前后數(shù)據(jù)處理時(shí)，整個(gè)推理流程的速度?？梢钥吹剑?dāng)使用 GPU 進(jìn)行數(shù)據(jù)處理時(shí)，可以實(shí)現(xiàn) 12 倍的加速。

審核編輯：彭菁

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

服務(wù)器

服務(wù)器

+關(guān)注

關(guān)注
13

文章
9795

瀏覽量
88001
醫(yī)療

醫(yī)療

+關(guān)注

關(guān)注
8

文章
1906

瀏覽量
59942
數(shù)據(jù)通信

數(shù)據(jù)通信

+關(guān)注

關(guān)注
2

文章
470

瀏覽量
34474
人工智能

人工智能

+關(guān)注

關(guān)注
1807

文章
49029

瀏覽量
249584

一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

搜索歷史

基于醫(yī)療圖像的深度學(xué)習(xí)開(kāi)源框架

評(píng)論