一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

0參數(shù)量+0訓(xùn)練,3D點(diǎn)云分析方法Point-NN刷新多項(xiàng)SOTA

OpenCV學(xué)堂 ? 來(lái)源:機(jī)器之心 ? 2023-07-19 16:29 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

不引入任何可學(xué)習(xí)參數(shù)或訓(xùn)練,是否可以直接實(shí)現(xiàn) 3D 點(diǎn)云的分類(lèi)、分割和檢測(cè)?

32cc21fc-2609-11ee-962d-dac502259ad0.png

論文鏈接:https://arxiv.org/pdf/2303.08134.pdf

代碼地址:https://github.com/ZrrSkywalker/Point-NN

本文提出了一個(gè)用于 3D 點(diǎn)云分析的非參數(shù)網(wǎng)絡(luò) Point-NN,它僅由純不可學(xué)習(xí)的組件組成:最遠(yuǎn)點(diǎn)采樣(FPS)、k 近鄰(k-NN)、三角函數(shù)(Trigonometric Functions)以及池化(Pooling)操作。不需要參數(shù)和訓(xùn)練,它能夠在各種 3D 任務(wù)上都取得不錯(cuò)的準(zhǔn)確率,甚至在 few-shot 分類(lèi)上可以大幅度超越現(xiàn)有的完全訓(xùn)練的模型。 基于 Point-NN 的非參數(shù)框架,這項(xiàng)研究對(duì)于當(dāng)前 3D 領(lǐng)域的貢獻(xiàn)如下: 1、首先,我們可以通過(guò)插入簡(jiǎn)單的線(xiàn)性層,來(lái)構(gòu)建 Point-NN 的參數(shù)化網(wǎng)絡(luò),Point-PN。由于 Point-NN 具有強(qiáng)大的非參數(shù)基礎(chǔ),所構(gòu)建出的 Point-PN 僅需要少量可學(xué)習(xí)參數(shù)就可以表現(xiàn)出優(yōu)秀的 3D 分類(lèi)和分割性能。 2、其次,由于 Point-NN 不需要訓(xùn)練的屬性,我們可以將其作為一個(gè)即插即用的增強(qiáng)模塊,去增強(qiáng)現(xiàn)有已經(jīng)訓(xùn)練好的 3D 模型。通過(guò)提供互補(bǔ)知識(shí),Point-NN 可以在各種 3D 任務(wù)上提升原本的 SOTA 性能。 一、引言1. 動(dòng)機(jī) 3D 點(diǎn)云的處理和分析是一項(xiàng)具有挑戰(zhàn)性的任務(wù),并且在學(xué)術(shù)界和工業(yè)界都取得了廣泛的關(guān)注。自從 PointNet++ 起,后續(xù)的 3D 模型為了提升性能,一方面設(shè)計(jì)了更加復(fù)雜的局部空間算子,一方面增大了網(wǎng)絡(luò)的可學(xué)習(xí)參數(shù)量。然而,除了不斷更新的可學(xué)習(xí)模塊,他們基本都沿用了同一套潛在的多尺度網(wǎng)絡(luò)框架,包括最遠(yuǎn)點(diǎn)采樣(FPS)、k 近鄰(k-NN)和池化(Pooling)操作。目前,還幾乎沒(méi)有研究去探索這些非參數(shù)組件的潛力;因此,本文提出并探索了以下問(wèn)題:這些非參數(shù)組件對(duì)于 3D 理解的貢獻(xiàn)有多大??jī)H僅使用非參數(shù)組件,能否實(shí)現(xiàn)無(wú)需訓(xùn)練的 3D 點(diǎn)云分析? 2. 貢獻(xiàn)

332ce4b0-2609-11ee-962d-dac502259ad0.png

為了解決以上問(wèn)題,本文首次提出了一個(gè)非參數(shù)化(Non-Parametric)的 3D 網(wǎng)絡(luò),Point-NN,整體結(jié)構(gòu)如上圖所示。Point-NN 由一個(gè)用于 3D 特征提取的非參數(shù)編碼器(Non-Parametric Encoder)和一個(gè)用于特定任務(wù)識(shí)別的點(diǎn)云記憶庫(kù)(Point-Memory Bank)組成。非參數(shù)編碼器采用了多階段的結(jié)構(gòu)設(shè)計(jì),使用了最遠(yuǎn)點(diǎn)采樣(FPS)、k 近鄰(k-NN)、三角函數(shù)(Trigonometric Functions)和池化(Pooling)來(lái)逐步聚合局部幾何圖形,為點(diǎn)云生成一個(gè)高維度的全局特征。我們僅僅采用了簡(jiǎn)單的三角函數(shù)來(lái)捕捉局部空間幾何信息,沒(méi)有使用任何可學(xué)習(xí)算子。接下來(lái),我們使用此編碼器,去提取到所有訓(xùn)練集點(diǎn)云的特征,并緩存為點(diǎn)云記憶庫(kù)。進(jìn)行測(cè)試時(shí),點(diǎn)云記憶庫(kù)通過(guò)對(duì)測(cè)試點(diǎn)云和訓(xùn)練集點(diǎn)云的特征,進(jìn)行相似度匹配,來(lái)輸出特定任務(wù)的預(yù)測(cè)。 不需要任何訓(xùn)練,Point-NN 可以在多種 3D 任務(wù)中實(shí)現(xiàn)優(yōu)越的性能,例如 3D 分類(lèi)、分割、檢測(cè),甚至可以超過(guò)一些現(xiàn)有的經(jīng)過(guò)完全訓(xùn)練的模型?;诖?,我們進(jìn)一步提出了兩點(diǎn) Point-NN 對(duì)于現(xiàn)今 3D 領(lǐng)域的貢獻(xiàn),如下圖(a)和(b)所示:

33621eb4-2609-11ee-962d-dac502259ad0.png

1)以 Point-NN 為基礎(chǔ)框架,我們通過(guò)在 Point-NN 的每個(gè)階段插入簡(jiǎn)單的線(xiàn)性層,引入了其 parameter-efficient 的變體 Point-PN,如上圖 (a) 所示。Point-PN 不包含復(fù)雜的局部算子,僅僅包含線(xiàn)性層以及從 Point-NN 繼承的三角函數(shù)算子,實(shí)現(xiàn)了效率和性能的雙贏(yíng)。 2)我們將 Point-NN 作為一個(gè)即插即用的模塊,為各種 3D 任務(wù)中訓(xùn)練好的模型提供互補(bǔ)知識(shí),并在推理過(guò)程中可以直接提升這些訓(xùn)練模型的性能,如上圖 (b) 所示。 二、方法 1.Point-NN Point-NN 由一個(gè) Non-Parametric Encoder (EncNP) 和一個(gè) Point-Memory Bank (PoM) 組成。對(duì)于輸入的點(diǎn)云,我們使用 EncNP 提取其全局特征,并通過(guò) PoM 的特征相似度匹配,來(lái)輸出分類(lèi)結(jié)果,公式如下圖所示:

33c2635a-2609-11ee-962d-dac502259ad0.png

接下來(lái),我們依次介紹 Point-NN 中的這兩個(gè)模塊。 (1)非參數(shù)編碼器 (Non-Parametric Encoder) 非參數(shù)編碼器首先將輸入點(diǎn)云進(jìn)行 Raw-point Embedding,將 3 維的原始點(diǎn)坐標(biāo)轉(zhuǎn)化為高維度特征,再經(jīng)過(guò) 4 個(gè)階段的 Local Geometry Aggregation 逐步聚合局部特征得到最終的點(diǎn)云全局特征,如下圖所示。

33e9ab5e-2609-11ee-962d-dac502259ad0.png

a. 原始點(diǎn)云映射 (Raw-point Embedding) 我們參考了 Transformer 中的 positional encoding,對(duì)于輸入點(diǎn)云的一個(gè)點(diǎn)

3444b71a-2609-11ee-962d-dac502259ad0.png

,利用三角函數(shù)將它嵌入到一個(gè)維向量中:

3466c67a-2609-11ee-962d-dac502259ad0.png

其中

34932c88-2609-11ee-962d-dac502259ad0.png

分別表示三個(gè)軸的位置編碼。以34aedd3e-2609-11ee-962d-dac502259ad0.png為例,對(duì)于通道索引

34c7d8d4-2609-11ee-962d-dac502259ad0.png

,具體的位置編碼公式如下:

34da2692-2609-11ee-962d-dac502259ad0.png

其中,α,β 分別控制了尺度和波長(zhǎng)。通過(guò)這種三角函數(shù)的編碼,我們可以將點(diǎn)云的絕對(duì)位置信息映射到高維度的特征空間中,并通過(guò)后續(xù)的點(diǎn)乘操作可以根據(jù)權(quán)重獲取不同點(diǎn)之間的相對(duì)位置信息,并捕獲三維形狀的細(xì)粒度結(jié)構(gòu)變化。 b. 局部幾何特征的聚合 (Local Geometry Aggregation) 對(duì)于每一個(gè)點(diǎn)云尺度的處理,我們分為三個(gè)步驟。 首先是特征擴(kuò)維 (Feature Expansion)。我們使用 FPS 進(jìn)行點(diǎn)云數(shù)量的下采樣,對(duì)于下采樣后得到的每一個(gè)中心點(diǎn)350e138a-2609-11ee-962d-dac502259ad0.png,我們采用 k-NN 去找到他的 k 個(gè)鄰域點(diǎn)35217060-2609-11ee-962d-dac502259ad0.png以及對(duì)應(yīng)的特征353aadaa-2609-11ee-962d-dac502259ad0.png?;诖?,我們將中心點(diǎn)特征35511f54-2609-11ee-962d-dac502259ad0.png353aadaa-2609-11ee-962d-dac502259ad0.png在特征維度進(jìn)行拼接,實(shí)現(xiàn)特征擴(kuò)維,這樣可以在更深的網(wǎng)絡(luò)層中編碼更多的語(yǔ)義信息: ?

357ee1fa-2609-11ee-962d-dac502259ad0.png

其次是幾何信息提取 (Geometry Extraction)。我們先使用均值和標(biāo)準(zhǔn)差對(duì)35b4399a-2609-11ee-962d-dac502259ad0.png的坐標(biāo)進(jìn)行歸一化,并使用三角函數(shù)進(jìn)行相對(duì)位置

35c8ab46-2609-11ee-962d-dac502259ad0.png

的編碼,來(lái)獲取35b4399a-2609-11ee-962d-dac502259ad0.png的相對(duì)幾何權(quán)重,標(biāo)記為

35f63a98-2609-11ee-962d-dac502259ad0.png

。之后,我們通過(guò)下面的公式得到加權(quán)后的鄰域特征3614a122-2609-11ee-962d-dac502259ad0.png。 ?

362cca54-2609-11ee-962d-dac502259ad0.png

最后是局部特征聚和 (Feature Aggregation)。我們利用最大池化和平均池化來(lái)進(jìn)行局部特征聚合。

36581efc-2609-11ee-962d-dac502259ad0.png

在完成 4 個(gè)階段的 Local Geometry Aggregation 后,我們?cè)俅芜\(yùn)用最大池化和平均池化來(lái)得到點(diǎn)云的全局特征。 (2)點(diǎn)云記憶庫(kù) (Point-Memory Bank) 在經(jīng)過(guò)非參數(shù)編碼器 (Non-Parametric Encoder) 的特征提取后,由于 Point-NN 不含任何可學(xué)習(xí)參數(shù),我們沒(méi)有使用傳統(tǒng)的可學(xué)習(xí)分類(lèi)頭,而是采用了無(wú)需訓(xùn)練的 point-memory bank。首先,我們使用非參數(shù)編碼器去構(gòu)造關(guān)于訓(xùn)練集的 bank,接著在推理過(guò)程通過(guò)相似度匹配輸出預(yù)測(cè),如下圖所示。

367f6eb2-2609-11ee-962d-dac502259ad0.png

a. 記憶構(gòu)建 (Memory Construction) Point memory 包括一個(gè) feature memory36d1ef0c-2609-11ee-962d-dac502259ad0.png和一個(gè) label memory36e92cf8-2609-11ee-962d-dac502259ad0.png。以點(diǎn)云分類(lèi)任務(wù)為例,假設(shè)給定的訓(xùn)練集包含 K 個(gè)類(lèi)別的 N 個(gè)點(diǎn)云

370e0032-2609-11ee-962d-dac502259ad0.png

。通過(guò) Non-Parametric Encoder 可以得到 N 個(gè)訓(xùn)練集點(diǎn)云的全局特征,同時(shí)將對(duì)應(yīng)的分類(lèi)標(biāo)簽

371fc628-2609-11ee-962d-dac502259ad0.png

轉(zhuǎn)換為 one-hot 編碼,接著將它們沿著樣本維度進(jìn)行拼接,緩存為兩個(gè)矩陣。

3737dda8-2609-11ee-962d-dac502259ad0.png

b. 基于相似度的預(yù)測(cè) (Similarity-based Prediction) 在推理階段,我們利用構(gòu)造好的 bank 進(jìn)行兩個(gè)矩陣乘法來(lái)完成分類(lèi)。首先,我們通過(guò) Non-Parametric Encoder 來(lái)計(jì)算測(cè)試點(diǎn)云的全局特征37782ef8-2609-11ee-962d-dac502259ad0.png,并計(jì)算與 feature memory 36d1ef0c-2609-11ee-962d-dac502259ad0.png之間的余弦相似度。 ?

37a1cf88-2609-11ee-962d-dac502259ad0.png

接下來(lái),將 label memory 36e92cf8-2609-11ee-962d-dac502259ad0.png中的 one-hot 標(biāo)簽與37de4738-2609-11ee-962d-dac502259ad0.png進(jìn)行加權(quán),越相似的 feature memory 對(duì)最終的分類(lèi) logits 貢獻(xiàn)越大,反之亦然。 ?

37f54852-2609-11ee-962d-dac502259ad0.png

通過(guò)這種基于相似性的計(jì)算,point-memory bank 可以在不經(jīng)過(guò)任何訓(xùn)練的情況下,學(xué)習(xí)到從訓(xùn)練集中提取的知識(shí),在推理過(guò)程自適應(yīng)地完成不同任務(wù)。 2.Point–NN 在其他 3D 任務(wù)的拓展 以上主要是對(duì) Point-NN 在分類(lèi)任務(wù)中的應(yīng)用的介紹,Point-NN 也可以被用于 3D 的部件分割和 3D 目標(biāo)檢測(cè)任務(wù)。 (1)部件分割 (3D Part Segmentation) 與分類(lèi)任務(wù)對(duì)全局特征進(jìn)行提取再進(jìn)行分類(lèi)不同的是,部件分割需要對(duì)每個(gè)點(diǎn)進(jìn)行分類(lèi)。因此,論文采用了一個(gè)接在 non-parametric encoder 后的對(duì)稱(chēng)的 non-parametric decoder,進(jìn)行點(diǎn)云特征的上采樣,恢復(fù)至輸入時(shí)的點(diǎn)數(shù)量。具體來(lái)說(shuō),在 decoder 的每個(gè)階段,我們將局部中心點(diǎn)的特征通過(guò)相對(duì)位置加權(quán),來(lái)擴(kuò)散到周?chē)念I(lǐng)域點(diǎn)。對(duì)于 point-memory bank,首先使用 encoder 和 decoder 得到訓(xùn)練集的每個(gè)點(diǎn)的特征,為了節(jié)省顯存消耗,對(duì)于每一個(gè)物體,我們將每個(gè)部件的特征取平均值,再作為 feature memory 存入到 bank 中。 (2)目標(biāo)檢測(cè) (3D Object Detection) 對(duì)于檢測(cè)任務(wù),我們將 Point-NN 作為一個(gè) 3D 檢測(cè)器的分類(lèi)頭使用。當(dāng)預(yù)訓(xùn)練好的檢測(cè)器產(chǎn)生 3D proposal 后,Point-NN 與分類(lèi)任務(wù)相似,使用 non-parametric encoder 來(lái)獲取被檢測(cè)物體的全局特征。在構(gòu)建 point-memory bank 時(shí),我們?cè)谟?xùn)練集中對(duì)在每個(gè) 3D 框標(biāo)簽內(nèi)的點(diǎn)云進(jìn)行采樣,將采樣后的每個(gè)物體的全局特征進(jìn)行編碼得到 feature memory。特別的是,我們沒(méi)有像其他任務(wù)一樣對(duì)每個(gè)物體的點(diǎn)云坐標(biāo)進(jìn)行歸一化,這是為了保留在原始空間中的 3D 位置信息,實(shí)現(xiàn)更好的檢測(cè)性能。 3. 從 Point–NN 延伸 (Starting from Point-NN) (1)作為結(jié)構(gòu)框架構(gòu)建 Point-PN (As Architectural Frameworks) 我們講 Point-NN 視為一個(gè)良好的非參數(shù)化框架,在其中插入簡(jiǎn)單的可學(xué)習(xí)線(xiàn)性層,來(lái)構(gòu)建參數(shù)化的 3D 網(wǎng)絡(luò),Point-PN。Point-PN 相比于現(xiàn)有的 3D 網(wǎng)絡(luò),不含有復(fù)雜的局部算子,以極少的可學(xué)習(xí)參數(shù)量實(shí)現(xiàn)了優(yōu)秀的 3D 性能。

381be19c-2609-11ee-962d-dac502259ad0.png

我們構(gòu)建 Point-PN 的步驟如下:首先,將 point-memory bank 替換為傳統(tǒng)的可學(xué)習(xí)的分類(lèi)頭,如上圖(A)所示;在 ModelNet40 的分類(lèi)任務(wù)上,這一步將分類(lèi)性能從 Point-NN 的 81.8% 提高到了 90.3%,且僅僅使用了 0.3M 的參數(shù)量。接著,我們將 raw-point embedding 替換為線(xiàn)性層(B),可以將分類(lèi)性能進(jìn)一步提高到 90.8%。為了更好地提取多尺度層次特征,我們接著將線(xiàn)性層插入到每一階段的 non-parametric encoder 中。具體來(lái)說(shuō),在每個(gè)階段,兩個(gè)線(xiàn)性層分別被插入到 Geometry Extraction 的前后來(lái)捕捉高層空間信息,如圖中(C、D、E)所示。這樣,最終的 Point-PN 可以?xún)H僅使用 0.8M 的參數(shù)量達(dá)到 93.8% 的性能,且只包括三角函數(shù)和簡(jiǎn)單的線(xiàn)性層。這說(shuō)明,與現(xiàn)有的高級(jí)的操作算子或者大參數(shù)兩相比,我們可以從非參數(shù)框架出發(fā),來(lái)獲取一個(gè)簡(jiǎn)單高效的 3D 模型。

385fcc40-2609-11ee-962d-dac502259ad0.png

(2)作為即插即用模塊 (As Plug-and-play Modules) Point-NN 可以在不進(jìn)行額外訓(xùn)練的情況下增強(qiáng)現(xiàn)有 3D 預(yù)訓(xùn)練模型的性能。以分類(lèi)任務(wù)為例,我們直接將 Point-NN 與預(yù)訓(xùn)練模型預(yù)測(cè)的分類(lèi) logits 進(jìn)行相加,來(lái)提供互補(bǔ)的 3D 知識(shí)提升性能。如下圖對(duì)特征的可視化所示,Point-NN 主要提取的是點(diǎn)云的低層次高頻特征,在尖銳的三維結(jié)構(gòu)周?chē)a(chǎn)生了較高的響應(yīng)值,例如飛機(jī)的翼尖、椅子的腿和燈桿;而經(jīng)過(guò)訓(xùn)練的 PointNet++ 更關(guān)注的是點(diǎn)云的高層次語(yǔ)義信息,通過(guò)對(duì)它們的 logits 相加可以得到互補(bǔ)的效果,例如,飛機(jī)的機(jī)身、椅子的主體和燈罩。

38a95400-2609-11ee-962d-dac502259ad0.png

三、實(shí)驗(yàn) 1.Point-NN 和 Point-PN (1)3D 物體分類(lèi) (Shape Classification)

38dfce18-2609-11ee-962d-dac502259ad0.png

對(duì)于 2 個(gè)代表性的 3D 物體分類(lèi)數(shù)據(jù)集,ModelNet40 和 ScanObjectNN,Point-NN 都獲得了良好的分類(lèi)效果,甚至能夠在 ScanObjectNN 上超過(guò)完全訓(xùn)練后的 3DmFV 模型。這充分說(shuō)明了 Point-NN 在沒(méi)有任何的參數(shù)或訓(xùn)練情況下的 3D 理解能力。 Point-PN 在 2 個(gè)數(shù)據(jù)集上也都取得了有競(jìng)爭(zhēng)力的結(jié)果。對(duì)于 ScanObjectNN,與 12.6M 的 PointMLP 相比,Point-PN 實(shí)現(xiàn)了參數(shù)量少 16 倍,推理速度快 6 倍,并且精度提升 1.9%。在 ModelNet40 數(shù)據(jù)集上,Point-PN 獲得了與 CurveNet 相當(dāng)?shù)慕Y(jié)果,但是少了 2.5X 的參數(shù)量,快了 6X 的推理速度。 (2)少樣本 3D 分類(lèi) (Few-shot Classification)

39212a02-2609-11ee-962d-dac502259ad0.png

與現(xiàn)有的經(jīng)過(guò)完全訓(xùn)練的 3D 模型相比,Point-NN 的 few shot 性能顯著超過(guò)了第二好的方法。這是因?yàn)橛?xùn)練樣本有限,具有可學(xué)習(xí)參數(shù)的傳統(tǒng)網(wǎng)絡(luò)會(huì)存在嚴(yán)重的過(guò)擬合問(wèn)題。 (2)3D 部件分割 (Part Segmentation)

3966a0dc-2609-11ee-962d-dac502259ad0.png

70.4% 的 mIoU 表明由 Point-NN 在分割任務(wù)中也可以產(chǎn)生執(zhí)行良好的單點(diǎn)級(jí)別的特征,并實(shí)現(xiàn)細(xì)粒度的 3D 空間理解。 Poinnt-PN 能夠取得 86.6% 的 mIoU。與 Curvenet 相比,Point-PN 可以節(jié)省 28 小時(shí)的訓(xùn)練時(shí)間,推理速度快 6X。 (3)3D 目標(biāo)檢測(cè) (3D Object Detection)

39cd1ad8-2609-11ee-962d-dac502259ad0.png

將 Point-NN 作為檢測(cè)器的分類(lèi)頭,我們采用了兩種流行的 3D 檢測(cè)器 VoteNet 和 3DETR-m 來(lái)提取類(lèi)別無(wú)關(guān)的 3D region proposals。由于我們沒(méi)有進(jìn)行點(diǎn)云坐標(biāo)的歸一化處理(w/o nor.),這樣可以保留原始場(chǎng)景中更多物體三維位置的信息,大大提升了 Point-NN 的 AP 分?jǐn)?shù)。 2.Point-NN 的即插即用 (Plug-and-play) (1)3D 物體分類(lèi) (Shape Classification)

3a16e55a-2609-11ee-962d-dac502259ad0.png

Point-NN 可以有效提高現(xiàn)有方法的分類(lèi)性能,在 ScanObjectNN 數(shù)據(jù)集上,Point-NN 可以對(duì) PointNet 和 PoitMLP 的分類(lèi)準(zhǔn)確率均提高 2%。 (2)3D 分割和檢測(cè) (Segmentation and Detection)

3a5f9890-2609-11ee-962d-dac502259ad0.png

對(duì)于分割任務(wù),由于 ShapeNetPart 數(shù)據(jù)集上的測(cè)評(píng)指標(biāo)已經(jīng)比較飽和,Point-NN 對(duì) CurveNet 提升的 0.1% 已經(jīng)是很好的效果。對(duì)于檢測(cè)任務(wù),Point-NN 對(duì) 3DETR-m 的增強(qiáng)達(dá)到了很好的 1.02%3a8fbbec-2609-11ee-962d-dac502259ad0.png和 11.05%

3aa99986-2609-11ee-962d-dac502259ad0.png

。

四、討論 1. 為什么 Point-NN 中的三角函數(shù)可以編碼 3D 信息? (1)捕獲高頻的 3D 結(jié)構(gòu)信息 通過(guò)下圖中 Point-NN 特征的可視化,以及我們分解出的點(diǎn)云低頻和高頻信息,可以觀(guān)察到 Point-NN 主要捕獲了點(diǎn)云的高頻空間特征,例如邊緣、拐角以及其它細(xì)粒度的細(xì)節(jié)。

3ac1736c-2609-11ee-962d-dac502259ad0.png

(2)編碼點(diǎn)之間的相對(duì)位置信息 三角函數(shù)本身可以提供點(diǎn)云的絕對(duì)位置信息。對(duì)于兩個(gè)點(diǎn)

3b3f00c0-2609-11ee-962d-dac502259ad0.png

3b6402ee-2609-11ee-962d-dac502259ad0.png

,首先獲取它們的 C 維的位置編碼,公式如下:

3b81e796-2609-11ee-962d-dac502259ad0.png

而它們之前的相對(duì)位置關(guān)系可以通過(guò)它們之間的點(diǎn)乘得到,公式如下:

3baf2b2a-2609-11ee-962d-dac502259ad0.png

以 x 軸為例,

3bd9873a-2609-11ee-962d-dac502259ad0.png

這個(gè)公式表示了 x 軸上兩個(gè)點(diǎn)之間的相對(duì)位置。因此,三角函數(shù)可以得到點(diǎn)云之間的絕對(duì)和相對(duì)位置信息,這更有利于 Point-NN 對(duì)局部化點(diǎn)云的結(jié)構(gòu)理解。 2.Point–NN 可以即插即用的提升 Point–PN 的性能嗎?

3c06371c-2609-11ee-962d-dac502259ad0.png

3c466b20-2609-11ee-962d-dac502259ad0.png

如上表所示,Point-NN 對(duì) Point-PN 的提升極其有限,從上圖可視化的結(jié)果來(lái)看,Point-NN 和 Point-PN 之間的互補(bǔ)性比 Point-NN 和 PointNet++ 之間的互補(bǔ)性更弱。這是因?yàn)?Point-PN 的基礎(chǔ)結(jié)構(gòu)是繼承自 Point-NN,因此也會(huì)通過(guò)三角函數(shù)獲取 3D 高頻信息,和 Point-PN 擁有相似的特征捕獲能力。 3. 和其他無(wú)需訓(xùn)練的 3D 模型的比較

3c825f68-2609-11ee-962d-dac502259ad0.png

現(xiàn)有的 3D 模型中,有一類(lèi)基于 CLIP 預(yù)訓(xùn)練模型的遷移學(xué)習(xí)方法,例如 PointCLIP 系列,它們也不需要進(jìn)行 3D 領(lǐng)域中的訓(xùn)練過(guò)程。從上表的比較可以看出,Point-NN 可以實(shí)現(xiàn)很優(yōu)越的無(wú)需訓(xùn)練的分類(lèi)性能。 4.Point–NN 與 PnP–3D 的增強(qiáng)效果比較

3cbb7b90-2609-11ee-962d-dac502259ad0.png

PnP-3D 提出了一種對(duì)于 3D 模型的即插即用的可學(xué)習(xí)增強(qiáng)模塊,但是它會(huì)引入額外的可學(xué)習(xí)參數(shù),并且需要重新訓(xùn)練而消耗更多的計(jì)算資源。如上表所示,相比之下,Point-NN 也能實(shí)現(xiàn)相似的增強(qiáng)性能,但是完全不需要額外參數(shù)或者訓(xùn)練。 五、總結(jié)與展望 本文首次在 3D 領(lǐng)域中,提出了一個(gè)無(wú)參數(shù)無(wú)需訓(xùn)練的網(wǎng)絡(luò),Point-NN,并且在各個(gè) 3D 任務(wù)上都取得了良好的性能。我們希望這篇工作可以啟發(fā)更多的研究,來(lái)關(guān)注非參數(shù)化相關(guān)的 3D 研究,而不是一味的增加復(fù)雜的 3D 算子或者堆疊大量的網(wǎng)絡(luò)參數(shù)。在未來(lái)的工作中,我們將探索更加先進(jìn)的非參數(shù) 3D 模型,并推廣到更廣泛的 3D 應(yīng)用場(chǎng)景中。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 模塊
    +關(guān)注

    關(guān)注

    7

    文章

    2788

    瀏覽量

    50379
  • 編碼器
    +關(guān)注

    關(guān)注

    45

    文章

    3799

    瀏覽量

    138040
  • 點(diǎn)云
    +關(guān)注

    關(guān)注

    0

    文章

    58

    瀏覽量

    3960

原文標(biāo)題:0參數(shù)量 + 0訓(xùn)練,3D點(diǎn)云分析方法Point-NN刷新多項(xiàng)SOTA

文章出處:【微信號(hào):CVSCHOOL,微信公眾號(hào):OpenCV學(xué)堂】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    基于3D點(diǎn)的多任務(wù)模型在板端實(shí)現(xiàn)高效部署

    對(duì)于自動(dòng)駕駛應(yīng)用來(lái)說(shuō),3D 場(chǎng)景感知至關(guān)重要。3D點(diǎn)數(shù)據(jù)就是具有3D特征的數(shù)據(jù)。一方面,3D
    的頭像 發(fā)表于 12-28 16:35 ?2118次閱讀
    基于<b class='flag-5'>3D</b><b class='flag-5'>點(diǎn)</b><b class='flag-5'>云</b>的多任務(wù)模型在板端實(shí)現(xiàn)高效部署

    基于深度學(xué)習(xí)的方法在處理3D點(diǎn)進(jìn)行缺陷分類(lèi)應(yīng)用

    背景部分介紹了3D點(diǎn)應(yīng)用領(lǐng)域中公開(kāi)可訪(fǎng)問(wèn)的數(shù)據(jù)集的重要性,這些數(shù)據(jù)集對(duì)于分析和比較各種模型至關(guān)重要。研究人員專(zhuān)門(mén)設(shè)計(jì)了各種數(shù)據(jù)集,包括用于3D
    的頭像 發(fā)表于 02-22 16:16 ?1913次閱讀
    基于深度學(xué)習(xí)的<b class='flag-5'>方法</b>在處理<b class='flag-5'>3D</b><b class='flag-5'>點(diǎn)</b><b class='flag-5'>云</b>進(jìn)行缺陷分類(lèi)應(yīng)用

    如何同時(shí)獲取2d圖像序列和相應(yīng)的3d點(diǎn)?

    如何同時(shí)獲取2d圖像序列和相應(yīng)的3d點(diǎn)?以上來(lái)自于谷歌翻譯以下為原文How to obtain the sequence of 2d im
    發(fā)表于 11-13 11:25

    3D點(diǎn)技術(shù)介紹及其與VR體驗(yàn)的關(guān)系

    ;x>nkedIn上發(fā)表了一篇跟澳大利亞科技公司優(yōu)立(Euclideon)所使用的點(diǎn)數(shù)據(jù)有關(guān)的文章,并在業(yè)內(nèi)引起了一番討論。 1. 點(diǎn)的問(wèn)題 點(diǎn)
    發(fā)表于 09-15 09:28 ?20次下載

    點(diǎn)問(wèn)題的介紹及3D點(diǎn)技術(shù)在VR中的應(yīng)用

    1. 點(diǎn)的問(wèn)題 點(diǎn)是由3D掃描硬件收集的數(shù)據(jù),如FARO的Focus 3D激光掃描儀和Shi
    發(fā)表于 09-27 15:27 ?17次下載

    基于圖卷積的層級(jí)圖網(wǎng)絡(luò)用于基于點(diǎn)3D目標(biāo)檢測(cè)

    論文:A Hierarchical Graph Network for 3D Object Detection on Point Clouds 由于大多數(shù)現(xiàn)有的點(diǎn)對(duì)象檢測(cè)
    的頭像 發(fā)表于 06-21 12:15 ?6521次閱讀
    基于圖卷積的層級(jí)圖網(wǎng)絡(luò)用于基于<b class='flag-5'>點(diǎn)</b><b class='flag-5'>云</b>的<b class='flag-5'>3D</b>目標(biāo)檢測(cè)

    3D 點(diǎn)的無(wú)監(jiān)督膠囊網(wǎng)絡(luò) 多任務(wù)上實(shí)現(xiàn)SOTA

    這是一種為 3D 點(diǎn)提出的無(wú)監(jiān)督膠囊架構(gòu),并且在 3D 點(diǎn)重構(gòu)、配準(zhǔn)和無(wú)監(jiān)督分類(lèi)方面優(yōu)于
    的頭像 發(fā)表于 01-02 09:39 ?2413次閱讀

    何為3D點(diǎn)語(yǔ)義分割

    融合標(biāo)注使用的3D標(biāo)注工具仍以3D立體框?yàn)橹?,但?b class='flag-5'>3D點(diǎn)數(shù)據(jù)以外,還需要使用2D標(biāo)注工具在
    的頭像 發(fā)表于 07-21 15:52 ?9595次閱讀

    一種有效將3D點(diǎn)分割成平面組件的多分辨率方法

    在實(shí)驗(yàn)中,將改方法與使用 SegComp 數(shù)據(jù)庫(kù)的最先進(jìn)方法進(jìn)行了比較。實(shí)驗(yàn)結(jié)果表明,我們以高幀率和高質(zhì)量處理 3D 激光和深度傳感器(例如 Kinect)的 3D
    的頭像 發(fā)表于 01-09 11:28 ?1436次閱讀

    Point-NN: 即插即用,無(wú)需訓(xùn)練的非參數(shù)點(diǎn)分析網(wǎng)絡(luò)!

    從PointNet++起,包括最遠(yuǎn)點(diǎn)采樣(FPS)、k近鄰(k-NN)和池化操作在內(nèi),所有可學(xué)習(xí)模塊背后的非參數(shù)框架幾乎保持相同。很少有研究去探索它們的療效,論文提出了一個(gè)問(wèn)題
    的頭像 發(fā)表于 03-28 11:22 ?3226次閱讀

    3D點(diǎn)數(shù)據(jù)集在3D數(shù)字化技術(shù)中的應(yīng)用

    隨著計(jì)算機(jī)視覺(jué)技術(shù)的不斷發(fā)展,3D 數(shù)字化技術(shù)已經(jīng)成為了當(dāng)今工業(yè)制造領(lǐng)域和三維醫(yī)學(xué)影像領(lǐng)域的關(guān)鍵技術(shù)。然而,構(gòu)建高精度、高分辨率的 3D 點(diǎn)數(shù)據(jù)集對(duì)于實(shí)現(xiàn)這一技術(shù)至關(guān)重要。在這篇文章
    的頭像 發(fā)表于 05-06 16:46 ?1853次閱讀

    3D相機(jī)點(diǎn)數(shù)據(jù)“如何讀取”

    Halcon|讀取3D相機(jī)點(diǎn)數(shù)據(jù) 最近發(fā)現(xiàn)很多小伙伴在使用Halcon處理3D工業(yè)相機(jī)掃描結(jié)果的時(shí)候遇到了“如何讀取”的問(wèn)題。一般的3D
    的頭像 發(fā)表于 07-12 10:28 ?2671次閱讀
    <b class='flag-5'>3D</b>相機(jī)<b class='flag-5'>點(diǎn)</b><b class='flag-5'>云</b>數(shù)據(jù)“如何讀取”

    預(yù)訓(xùn)練擴(kuò)散大模型取得點(diǎn)-圖像配準(zhǔn)SoTA!

    現(xiàn)有方法往往是:用一個(gè)2D特征提取網(wǎng)絡(luò)提取圖像特征;用一個(gè)3D特征提取網(wǎng)絡(luò)提取點(diǎn)特征;然后根據(jù)pixel-to-
    的頭像 發(fā)表于 10-29 17:14 ?1456次閱讀
    預(yù)<b class='flag-5'>訓(xùn)練</b>擴(kuò)散大模型取得點(diǎn)<b class='flag-5'>云</b>-圖像配準(zhǔn)<b class='flag-5'>SoTA</b>!

    基于深度學(xué)習(xí)的3D點(diǎn)實(shí)例分割方法

    3D實(shí)例分割(3DIS)是3D領(lǐng)域深度學(xué)習(xí)的核心問(wèn)題。給定由點(diǎn)云表示的 3D 場(chǎng)景,我們尋求為每個(gè)點(diǎn)
    發(fā)表于 11-13 10:34 ?3261次閱讀
    基于深度學(xué)習(xí)的<b class='flag-5'>3D</b><b class='flag-5'>點(diǎn)</b><b class='flag-5'>云</b>實(shí)例分割<b class='flag-5'>方法</b>

    高分工作!Uni3D3D基礎(chǔ)大模型,刷新多個(gè)SOTA

    我們主要探索了3D視覺(jué)中scale up模型參數(shù)量和統(tǒng)一模型架構(gòu)的可能性。在NLP / 2D vision領(lǐng)域,scale up大模型(GPT-4,SAM,EVA等)已經(jīng)取得了很impressive
    的頭像 發(fā)表于 01-30 15:56 ?1371次閱讀
    高分工作!Uni<b class='flag-5'>3D</b>:<b class='flag-5'>3D</b>基礎(chǔ)大模型,<b class='flag-5'>刷新</b>多個(gè)<b class='flag-5'>SOTA</b>!