一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用CUDA PCL 1.0加速Jetson的點云處理

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-04-27 10:53 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

很多Jetson用戶在自動化解決方案中選擇激光雷達進行定位和感知。激光雷達使用3D點云描繪周圍的空間環(huán)境。點云可以高精度長距離采樣物體表面信息以便于上層應(yīng)用的障礙感知、繪圖、定位和路徑規(guī)劃算法

使用CUDA-PCL處理點云

CUDA PCL 1.0是基于CUDA開發(fā)的點云處理庫,在本文中,我們將介紹目前所有的三個庫:ICP,segmentation 和 filter。

CUDA-ICP

迭代最近點算法(Iterative Closest Point,ICP) 用于計算兩幀點云數(shù)據(jù)之間的坐標變換矩陣,從而能夠使不同的坐標下的點云數(shù)據(jù)合并到同一個坐標系統(tǒng)中。ICP算法 通過計算兩幀點云的距離誤差從而修正變換矩陣(平移和旋轉(zhuǎn))以便最小化距離誤差,通常兩幀點云之間的距離誤差是通過匹配點的距離計算得來。ICP算法應(yīng)用廣泛,能夠獲得很高的匹配結(jié)果且有很高的魯棒性,同時會耗費大量的計算資源。為了改進ICP算法在Jetson上的性能,我們推薦使用基于CUDA加速的CUDA-ICP。

使用CUDA-ICP

以下是CUDA ICP的使用實例

我們僅僅需要初始化相關(guān)的類對象,并調(diào)用接口函數(shù)即可。

    cudaICP icpTest(nPCountM, nQCountM, stream);
    icpTest.icp(cloud_source, nPCount,
            float *cloud_target, int nQCount,
            int Maxiterate, double threshold,
            Eigen::Matrix4f &transformation_matrix, stream);

CUDA-ICP 計算的輸出是 transformation_matrix,代表的含義如下:

源點云(P)* transformation = 目標坐標系的點云(Q)

因為激光類型的輸出點云的數(shù)量為固定值,所以CUDA-ICP在輸出化的時候,要求輸入兩幀點云的最大數(shù)量,從而分配計算資源。

class cudaICP
{
public:
    /*
       nPCountM and nQCountM are the maximum of count for input clouds
       They are used to pre-allocate memory.
    */
    cudaICP(int nPCountM, int nQCountM, cudaStream_t stream = 0);
    ~cudaICP(void);

    /*
    cloud_target = transformation_matrix *cloud_source
    When the Epsilon of transformation_matrix is less than threshold,
    the function will return transformation_matrix.
    Input:
        cloud_source, cloud_target: data pointer for points cloud
        nPCount: the points number of cloud_source
        nQCount: the points number of cloud_target
        Maxiterate: the threshold for iterations
        threshold: When the Epsilon of transformation_matrix is less than
            threshold, the function will return transformation_matrix.
    Output:
        transformation_matrix
    */

    void icp(float *cloud_source, int nPCount,

Figure 1. 執(zhí)行ICP之前的兩幀點云。

Figure 2. 經(jīng)過ICP匹配后的兩幀點云。

CUDA-Segmentation

點云地圖包含大量的地面點,不僅會使得地圖變的雜亂,也會干擾之后的點云的分類和識別。因此在實際處理中,我們會首先使用點云分割移除點云中的地面。CUDA-Segmentation 使用隨機樣本一致性算法(random sample consensus, Ransac)進行點云的分割。

使用CUDA- Segmentation

以下代碼是CUDA Segmentation的使用實例。

我們直接初始化對象并調(diào)用相關(guān)的接口函數(shù)即可。

  //Now Just support: SAC_RANSAC + SACMODEL_PLANE
  std::vector indexV;
  cudaSegmentation cudaSeg(SACMODEL_PLANE, SAC_RANSAC, stream);
  segParam_t setP;
  setP.distanceThreshold = 0.01; 
  setP.maxIterations = 50;
  setP.probability = 0.99;
  setP.optimizeCoefficients = true;
  cudaSeg.set(setP);
  cudaSeg.segment(input, nCount, index, modelCoefficients);
  for(int i = 0; i < nCount; i++)
  {
    if(index[i] == 1) 
    indexV.push_back(i);
  }

CUDA Segmentation分割擁有nCount個的點云,并輸出索引表index用于指示輸入點云中的被分割掉的點和modelCoefficients用于指示尋找的平面公式。

typedef struct {
  double distanceThreshold; 
  int maxIterations;
  double probability;
  bool optimizeCoefficients;
} segParam_t;

class cudaSegmentation
{
public:
    //Now Just support: SAC_RANSAC + SACMODEL_PLANE
    cudaSegmentation(int ModelType, int MethodType, cudaStream_t stream = 0);

    ~cudaSegmentation(void);

    /*
    Input:
        cloud_in: data pointer for points cloud
        nCount: count of points in cloud_in
    Output:
        Index: data pointer which has the index of points in a plane from input
      modelCoefficients: data pointer which has the group of coefficients of the plane
    */
    int set(segParam_t param);
    void segment(float *cloud_in, int nCount,
            int *index, float *modelCoefficients);
private:
    void *m_handle = NULL;
}; 

讓我們查看下面的實例,第一張圖是原始的點云,第二張圖是經(jīng)過算法尋找到的平面。這是一個非常典型的平面移除的應(yīng)用。

Figure 3. cuda-segmentaion處理之前的點云。

Figure 4. cuda-segmentaion找到的點云平面。

CUDA-Filter

濾波器是在分割,檢測和識別之前,點云數(shù)據(jù)中最重要的處理。

帶通點云濾波是最簡單的方法,僅僅是過濾X,Y和Z軸方向的點云。

目前CUDA-Filter僅支持帶通操作,更多的濾波器會在后續(xù)加入。

使用CUDA- Filter

這個是CUDA Filter的使用實例。

我們僅僅需要初始化對象并調(diào)用相關(guān)的接口函數(shù)即可。

我們僅僅需要初始化對象并調(diào)用相關(guān)的接口函數(shù)即可。

  cudaFilter filterTest(stream);
  FilterParam_t setP;
  FilterType_t type = PASSTHROUGH;
  setP.type = type;
  setP.dim = 2;
  setP.upFilterLimits = 1.0;
  setP.downFilterLimits = 0.0;
  setP.limitsNegative = false;
  filterTest.set(setP);
  filterTest.filter(output, &countLeft, input, nCount);

CUDA-Filter使用指定的參數(shù)過濾nCount有個點的點云數(shù)據(jù),過濾后輸出的點云數(shù)量為countLeft。


typedef struct {
    FilterType_t type;
    //0=x,1=y,2=z
    int dim;
    float upFilterLimits;
    float downFilterLimits;
    bool limitsNegative;

} FilterParam_t;

class cudaFilter
{
public:
    cudaFilter(cudaStream_t stream = 0);
    ~cudaFilter(void);
    int set(FilterParam_t param);
    /*
    Input:
        source: data pointer for points cloud
        nCount: count of points in cloud_in
    Output:
        output: data pointer which has points filtered by CUDA
        countLeft: count of points in output
    */
    int filter(void *output, unsigned int *countLeft, void *source, unsigned int nCount);

    void *m_handle = NULL;
}; 

讓我們看下X軸方向的帶通濾波實例。

Figure 5. 原始點云。

Figure 6. X周過濾后的數(shù)據(jù)。

開始使用 CUDA-PCL

我們希望通過本文介紹使用CUDA-PCL從而獲得更好的點云處理性能。

因為PCL在Jetson上無法使用CUDA進行點云的加速處理,所以我們開發(fā)了基于CUDA的點云處理庫CUDA-PCL。

關(guān)于作者

范磊是英偉達高級CUDA軟件工程師,在TSE China 小組致力于CUDA軟件方案的開發(fā)和優(yōu)化。

李雨倩負責(zé)基于Jetson的自主機器解決方案和生態(tài)發(fā)展建設(shè),讓開發(fā)者在Jetson上開發(fā)機器人應(yīng)用獲得更好更全面的體驗和支持。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 激光雷達
    +關(guān)注

    關(guān)注

    971

    文章

    4235

    瀏覽量

    192838
  • CUDA
    +關(guān)注

    關(guān)注

    0

    文章

    122

    瀏覽量

    14121
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    NVIDIA RTX AI加速FLUX.1 Kontext現(xiàn)已開放下載

    NVIDIA RTX 與 NVIDIA TensorRT 現(xiàn)已加速 Black Forest Labs 的最新圖像生成和編輯模型;此外,Gemma 3n 現(xiàn)可借助 RTX 和 NVIDIA Jetson 加速運行。
    的頭像 發(fā)表于 07-16 09:16 ?190次閱讀

    PCl Express M.2規(guī)格書

    電子發(fā)燒友網(wǎng)站提供《PCl Express M.2規(guī)格書.pdf》資料免費下載
    發(fā)表于 06-25 15:41 ?0次下載

    使用NVIDIA CUDA-X庫加速科學(xué)和工程發(fā)展

    NVIDIA GTC 全球 AI 大會上宣布,開發(fā)者現(xiàn)在可以通過 CUDA-X 與新一代超級芯片架構(gòu)的協(xié)同,實現(xiàn) CPU 和 GPU 資源間深度自動化整合與調(diào)度,相較于傳統(tǒng)加速計算架構(gòu),該技術(shù)可使計算工程工具運行速度提升至原來的 11 倍,計算規(guī)模增加至 5 倍。
    的頭像 發(fā)表于 03-25 15:11 ?698次閱讀

    驥智行借助NVIDIA Jetson打造“域腦”通用計算平臺

    本案例中,驥智行(Pegasus Technology)借助 NVIDIA Jetson 打造“域腦”通用計算平臺,實現(xiàn)了在人形機器人、智能新終端等具身智能場景的部署應(yīng)用,滿足多場景算力需求,保障系統(tǒng)安全穩(wěn)定運行并推動功能拓展。
    的頭像 發(fā)表于 02-21 11:41 ?854次閱讀

    操作指南:pytorch服務(wù)器怎么設(shè)置?

    設(shè)置PyTorch服務(wù)器需選擇平臺,創(chuàng)建合適的GPU實例,安裝操作系統(tǒng)、Python及Anaconda,創(chuàng)建虛擬環(huán)境,根據(jù)CUDA版本安裝PyTorch,配置環(huán)境變量,最后驗證安裝。過程中需考慮
    的頭像 發(fā)表于 02-08 10:33 ?354次閱讀

    GPU加速服務(wù)器怎么用的

    GPU加速服務(wù)器是將GPU硬件與計算服務(wù)相結(jié)合,通過服務(wù)提供商的平臺,用戶可以根據(jù)需求靈活租用帶有GPU資源的虛擬機實例。那么,GPU加速
    的頭像 發(fā)表于 12-26 11:58 ?453次閱讀

    華為 Flexus X 實例 MySQL 性能加速評測及對比

    場景需求 3 二、Flexus 服務(wù)器 X 購買 3 2.1 Flexus X 實例購買 4 2.2 購買 MySQL 加速鏡像 4 2.3 重置密碼 5 2.4?登錄服務(wù)器 6 三、Flexus
    的頭像 發(fā)表于 12-25 17:10 ?550次閱讀
    華為<b class='flag-5'>云</b> Flexus X 實例 MySQL 性能<b class='flag-5'>加速</b>評測及對比

    數(shù)據(jù)庫和主機哪個好一?

    數(shù)據(jù)庫和主機哪個好一主機和數(shù)據(jù)庫各有優(yōu)勢,選擇哪個更好取決于具體需求。主機提供虛擬
    的頭像 發(fā)表于 12-04 13:50 ?452次閱讀

    基于深度學(xué)習(xí)的三維分類方法

    近年來,云表示已成為計算機視覺領(lǐng)域的研究熱點之一,并廣泛應(yīng)用于自動駕駛、虛擬現(xiàn)實、機器人等許多領(lǐng)域。雖然深度學(xué)習(xí)技術(shù)在處理常規(guī)結(jié)構(gòu)化的二維網(wǎng)格圖像數(shù)據(jù)方面取得了巨大成功,但在處理不規(guī)則、非結(jié)構(gòu)化的
    的頭像 發(fā)表于 10-29 09:43 ?1575次閱讀
    基于深度學(xué)習(xí)的三維<b class='flag-5'>點</b><b class='flag-5'>云</b>分類方法

    什么是三維分割

    是世界的一種非結(jié)構(gòu)化三維數(shù)據(jù)表示,通常由激光雷達傳感器、立體相機或深度傳感器采集。它由一系列單個組成,每個由 x、y 和 z 坐標定義。
    的頭像 發(fā)表于 10-29 09:21 ?651次閱讀

    有沒有大佬知道NI vision 有沒有辦法通過gpu和cuda加速圖像處理

    有沒有大佬知道NI vision 有沒有辦法通過gpu和cuda加速圖像處理
    發(fā)表于 10-20 09:14

    怎么在TMDSEVM6678: 6678自帶的FFT接口和CUDA提供CUFFT函數(shù)庫選擇?

    請教一下gpgpu上包括4個Riscv cpu和一個DPU, 沒有6678,要替換原來信號處理用的6678,該怎么在6678自帶的FFT接口和CUDA提供CUFFT函數(shù)庫選擇?
    發(fā)表于 09-27 07:20

    LiDAR激光數(shù)據(jù)處理軟件處理流程

    、形狀等信息。LiDAR技術(shù)在地形測繪、城市規(guī)劃、林業(yè)、交通、考古等領(lǐng)域有著廣泛的應(yīng)用。本文將介紹LiDAR激光數(shù)據(jù)處理軟件的處理流程。 一、LiDAR數(shù)據(jù)采集 飛行平臺選擇:Li
    的頭像 發(fā)表于 08-29 17:05 ?2465次閱讀

    如何理解計算?

    據(jù)的安全性。 **高性能計算:**計算平臺提供高性能的計算資源,用于處理復(fù)雜的科學(xué)和工程計算任務(wù)。用戶可以使用平臺來進行高性能計算、模擬和仿真,加速科學(xué)研究和工程設(shè)計的進程。 **
    發(fā)表于 08-16 17:02

    打破英偉達CUDA壁壘?AMD顯卡現(xiàn)在也能無縫適配CUDA

    電子發(fā)燒友網(wǎng)報道(文/梁浩斌)一直以來,圍繞CUDA打造的軟件生態(tài),是英偉達在GPU領(lǐng)域最大的護城河,尤其是隨著目前AI領(lǐng)域的發(fā)展加速,市場火爆,英偉達GPU+CUDA的開發(fā)生態(tài)則更加穩(wěn)固,AMD
    的頭像 發(fā)表于 07-19 00:16 ?5942次閱讀