?

基于雙路徑特征提取網絡的三維點云分割算法

2023-12-08 08:41李鵬江溫淑煥
燕山大學學報 2023年6期
關鍵詞:算子注意力卷積

李鵬江,溫淑煥,?

(1.燕山大學 智能控制系統與智能裝備教育部工程研究中心,河北 秦皇島 066004;2.燕山大學 工業計算機控制工程河北省重點實驗室,河北 秦皇島 066004)

0 引言

伴隨3D 采集技術的迅猛發展,3D 傳感器獲取點云數據變得越來越容易[1]。三維點云數據擁有充足的形狀、幾何及比例信息。點云數據結合2D 圖像,能夠幫助機器更好地理解周圍的環境。點云語義分割是點云處理中的一個典型而又關鍵的任務,如今已被極為廣泛地應用于機器人、自動駕駛和遙感等領域。相應的分割方法可以分為傳統方法和基于深度學習的方法[2]。本文旨在使用深度學習進一步提高分割算法的精度,因此將展開介紹基于深度學習的方法。

大多數現有的使用深度學習處理點云[2]的方法,根據點云表示形式大致分為以下四類:

①基于點的方法:PointNet[3],通過幾個獨立多層感知機(Multi-Layer Perceptron,MLP)獲取逐點特征而后使用最大池化層獲取全局的特征。PointNet++[4]為克服點云的不均勻性和變密度等帶來的問題,按層次對點進行分組,并不斷學習逐漸擴大的局部區域。類似的逐點MLP 的方法還有PointWeb[5]等。此外,本文將重點借鑒對點進行卷積的方法,如經過χ-conv 變換,PointCNN[6]使用MLP 可將輸入點轉變成標準數據形式,從而可以使用一些常規的卷積算子進行處理。還有使用現有方法執行卷積的某些算法,如三維點云卷積網絡PCNN[7]使用了徑向基函數。

②基于投影的方法:此類方法往往把三維數據投影到二維,之后用類似處理二維圖像的神經網絡方法進行處理,如Wu 等人[8]提出了一種端到端的基于條件隨機場和SqueezeNet 的網絡以快速準確地分割3D 點云。隨后SqueezeSegV2[9]為解決域移位問題,使用無監督的域適配管道,可以取得更加精確的分割精度。

③基于體素的方法:為了應用常規3D 卷積,點云需體素化預處理變為密集網格,如Tchapmi L等人[10]提出的SEGCloud,使用三線性插值將粗體素映射回點云,隨后加強逐點標簽的空間一致性。

④基于圖的方法:如SPG[11]使用一些彼此聯系的超點和簡略形狀來表示點云,同時利用超點圖或屬性有向圖捕獲上下文和結構信息。

綜上所述,基于投影方法的性能非常受視點選擇及遮擋情況的影響,且因為投影過程中通常會導致信息損失,從而不能很好地利用潛在的結構和幾何信息;盡管體素形式可以保留三維點云的鄰域構造,且標準的3D 卷積也可以直接應用在這種數據格式上,但體素化過程天然地會導致信息缺失同時引入了離散偽影,并且通常在實際中很難找到適合的分辨率體素網格;基于圖的方法目前研究相對較少。

因此,為了設計一種可以更加精準、高效地獲取場景中的語義信息的點云分割算法,本文使用基于點的方法,直接對點進行卷積處理,沒有任何中間表示,可以保留更多信息。具體來說,本文分別借鑒核點卷積算子[12](Kernel Point Convolution,KPConv)和點云展平卷積算子[13](Flattening Point Convolution,FPC)構造了雙路徑特征提取網絡,將它們的優勢互補,可獲得更加豐富的點云融合特征,從而實現點云分類和分割兩種任務。同時加入預處理、相互增強、特征融合及空間、通道注意力等幾個模塊可以更加有效地提取全局上下文信息,在多個點云數據集上展現了優秀的處理性能。

1 點云分割算法結構和原理

如圖1 所示,本文設計了一種可用于點云分類和點云分割兩種任務的雙路徑增強網絡(Dual Path Augmentation Network,DPA-Net)。采用類似U-Net[16]網絡的模式,使用編碼器-解碼器形式的架構。以下將對整體網絡中的特征預處理模塊、雙路徑相互學習模塊、殘差式特征融合模塊、注意力模塊及解碼器進行介紹。

圖1 點云分類分割網絡整體架構圖Fig.1 Overall architecture of point cloudclassification and segmentation network

1.1 特征預處理模塊

如圖1 所示,輸入點云由兩個元素組成:點坐標P∈RN×3,特征F∈RN×D。通常的網絡都會輸入點云的三維坐標,但有些數據集還包含很豐富的顏色RGB 信息、法線信息、光強度信息等多種特征,這些特征可以在一定程度上反映語義信息。原KPConv[12]、FPC[13]兩種點云卷積算子的輸入除了三維坐標的幾何信息外,其他的特征結合很少。本文提出一種特征預處理模塊,可以充分利用數據集中的特征信息,使得一開始輸入到卷積層中的數據具有較為豐富的點云特征信息,從而在之后的網絡中可以學習到更加充分、豐富的上下文信息,進而提升網絡性能。具體,本文使用MLP,類似1×1 的卷積,可以靈活地對輸入數據進行維度操作;隨后引入批量歸一化和激活函數,可使得獲取的特征信息更加緊湊;最后將三維坐標信息和高維度的點云特征輸入到雙路徑的卷積模塊。

1.2 雙路徑相互學習模塊

在此模塊中,以前邊預處理模塊獲取的特征作為輸入,分別通過據KPConv、FPC 兩種點云卷積算子原理設計的雙路徑卷積通道進行特征提取。具體,本文將借鑒ResNet[17]網絡根據兩種算子各自的特點架構每個獨立的卷積塊,這些卷積塊相互連接構成多層的卷積層。同時,本文設計了一種雙路徑增強機制,使得兩條路徑的卷積網絡在各自學習、訓練的時候,可以借鑒另一條路徑上的特征,從而獲得相互增強的點云特征,優化網絡的訓練。

1.2.1 兩種算子的ResNet 架構

KPConv 可以使用任意數量的核點對點云進行卷積操作,并且據具體情況可以對卷積進行變形以適應當前的結構、幾何狀態,該算子可以很好地克服點云密度變化帶來的挑戰,同時參數量小,計算成本低。

然而KPConv 這種對整體的點云進行操作的方法無法捕捉點云分布更為均勻的區域,基于此,本文借鑒FPC 點云卷積算子來克服這方面的困擾,以提升網絡精度和性能。FPC 的思想為將局部鄰域點展平為二維網格平面,然后利用二維卷積進行特征提取。它對各種輸入數據非常穩健,且作為一種局部特征學習模塊,它參數量較小,非常適合跟其他點云處理框架進行結合。

兩種算子網絡分別提取點云特征最后進行融合,優勢互補,可以得到更加豐富的上下文信息。兩種算子都屬于輕量級網絡結構,參數量很小,因此不會增加太多的計算成本。

首先,考慮到KPConv 的兩種形態,Rigid KPConv 和Deformable KPConv,本文設計了兩種架構,如圖2、3 所示。圖中的1×1 即常規卷積操作,BN、ReLu 分別為神經網絡中的常見的用在卷積操作后的批量歸一化和激活函數操作。

圖2 應用Rigid KPConv 的ResNet 架構Fig.2 ResNet architecture using Rigid KPConv

圖3 應用Deformable KPConv 的ResNet 架構Fig.3 ResNet architecture using Deformable KPConv

對于FPC,由于其對點云的采樣方式不同于KPConv,且其算子模塊中會用到PointNet 網絡進行特征提取,在圖4 中,本文使用共享參數的Shared MLP 以實現維度參數變換的作用。此外,圖2~4 中的當前維度參數D不是一個固定的數值,其值對應圖1 中網絡下采樣過程,在64,128,256,512,1 024 之間依次變化。

圖4 應用FPC 的ResNet 架構Fig.4 ResNet architecture using FPC

1.2.2 雙路徑增強機制

架構好兩種卷積算子的ResNet 卷積塊之后,便可分別堆疊多個卷積塊形成雙路徑的多層卷積網絡。常規做法是將前一層卷積層的輸出作為下一層的輸入,最后將兩條路徑輸出的點云特征進行融合。

本文提出一種雙路徑增強機制(Dual Path Augmentation,DPA),如圖5。該機制使得雙路徑卷積層中的中間層的輸入不只來自于本路徑前一層的輸出,同時還包含了由另一路徑學習到的加權特征,這樣可以使網絡學習到更加豐富的局部信息,及早關注到更充分的上下文信息,從而提升網絡效率并且提升最終的網絡精度。具體原理如下:

圖5 DPA 機制Fig.5 DPA mechanism

其中:i=1,2,3,4,5,表示兩條路徑中當前卷積層屬于第幾層,本文模型中兩條路徑卷積層數都設置為了5 層;和分別表示KPConv 卷積路徑和FPC 卷積路徑第i層的輸出特征;由于這兩組特征對于兩條路徑卷積層的貢獻是不一樣的,因此將這兩組特征分別習得兩個權值α和β,進而在維度層面進行拼接C操作,以獲得當前層的融合輸出特征;隨后通過MLP 進行維度參數變換以滿足之后卷積層的維度輸入要求,即公式中的M,由此便得到了下一卷積層的融合輸入特征;需要注意兩條路徑中,下一卷積層的融合輸入特征是不同的,特別的,經訓練發現,保持本路徑更多特征有利于最終精度的提升,因此對于KPConv 卷積路徑,α的值設置為1,β的值則由訓練習得,相反地,FPC 卷積路徑中將β的值設為1,α的值由訓練習得。

1.3 殘差式特征融合模塊

得到兩條卷積路徑上最終的輸出特征之后,本文提出了一種殘差式的特征融合模塊,可以更好地結合兩條路徑上的輸出特征,提升網絡效率及精度。

如圖6 所示,據KPConv 和FPC 兩種算子的結構原理,并且通過實驗驗證發現,保留KPConv路徑最后輸出的所有特征FKPConv;然后將兩路的特征先在維度上進行拼接,得到初步融合特征Ffuse:

圖6 特征融合模塊Fig.6 Feature fusion module

然后將這個融合特征經由一個殘差式的網絡結構后再與KPConv 路徑特征FKPConv相加,由此得到最終的融合特征:

其中函數f1(·)表示殘差網絡主路上的卷積Conv1 及ReLu 激活函數操作;函數f2(f1(·))表示殘差網絡中經過主路操作后又經過由Conv2、ReLu、Conv3 操作組成的shortcut 路;σ表示Sigmoid 激活函數;☉表示殘差結構中主路輸出和shortcut 路輸出進行的逐點矩陣乘法。

1.4 Transformer 的自注意力機制

受Transformer[14]中自注意力機制的啟發,本文算法在雙路徑卷積最終輸出的融合特征之后上附加了兩個平行的注意力模塊[15],空間注意力模塊和通道注意力模塊。以下將具體介紹兩個注意力模塊的原理。

1.4.1 空間注意力模塊

如圖7,從主干網獲取N×C的輸出特征A后,類似Transformer 中的查詢向量、鍵向量和值向量的獲取方式[15],分三路同時經過一個1×1 卷積,將其維度從C降為C1,得到Q,K,V三個向量,之后將K轉置后與Q進行矩陣乘法,得到N×N的矩陣,將該矩陣執行softmax 函數,即可得到空間注意力矩陣S,相應注意力值的描述如下:

圖7 空間注意力模塊Fig.7 Spatial attention module

其中,snsms表示第ms個點對第ns個點的影響,然后將N×N的注意力矩陣與N×C1的V進行矩陣乘法,從而得到一個N×C1的聚集的特征映射矩陣E,再通過一個1×1 卷積,將其升維恢復為同A一樣的尺寸大小,再之后,使用比例參數λ來加權求和期間的聚合特征。由此,對于第ns個點來說,經過空間注意力模塊后的輸出可以表示為

其中,λ會逐步學會分配更多權重,其初始值設為0[15]。從上式可以推斷,所有位置特征和原始特征進行加權求和后才得到每個位置的結果特征。從而通過空間注意力矩陣選擇性地聚合上下文信息后,它可以獲得全局的上下文感受野。同時通過類似的語義特征信息之間的彼此增益,可以使得語義更具一致性,且類內更加緊湊。

1.4.2 通道注意力模塊

在本模塊中[15],將探討通道之間的互相依賴關系,因為每個通道都可以表示為專注于類的響應。利用通道信息進行分類,可以挖掘更多有用的特征來生成目標區域建議。如圖8,通道注意模塊的整體結構與空間注意模塊相似。然而,在這個模塊中開始不用通過1×1 卷積對A進行降維,Q,K,V直接使用A的值,K轉置后與Q進行矩陣乘法,得到C×C的空間注意力矩陣S,空間注意力矩陣S,在將該矩陣執行softmax 函數后即可得到,可以表示為

其中,sncmc表示第mc通道對第nc通道的影響,然后將原始特征A跟注意力矩陣S進行矩陣乘法,即可選擇性地傳播通道信息。同樣,可以使用另一個初始化為0 的可學習比例參數μ來加權聚合特征和原始特征:

上式表明,為得到特征映射之間的長期語義依賴關系,將所有通道的特征和原始特征進行加權求以獲得每個通道的輸出特征,從而得到更加容易辨別的特征。

1.5 解碼器及損失函數

對于點云分割任務,解碼器部分使用最近鄰點上采樣方法,如圖1,通過4 層的上采樣后,獲得最終的點級特征;期間,編、解碼器的特征圖使用跳躍連接,將相同分辨率的編碼器部分的特征圖串接到解碼器每層上采樣的輸出特征中,需要注意的是,本文編碼器雙路徑網絡中都是5 層卷積層,并且對應層的特征維度參數相同,因此可以將兩條路徑中的特征圖都跳躍連接到解碼器,以便獲得更加豐富的上采樣信息;然后使用類似圖像中的卷積或MLP 的一元卷積處理,即可得到逐點分類結果,即實現了點云分割。

點云分類任務相對于點云分割框架稍微簡單一些,在編碼器部分最后經過注意力層之后,最終得到的融合特征通過全局平均池化層聚合特征,然后通過全連接層和softmax 層處理,輸出最后的類別信息。

對于分類和分割任務,本算法都采用的是交叉熵損失LCE,可以很方便地進行反向傳播計算,同時針對本文提出的雙路徑相互學習模塊,據兩條路徑中的5 層卷積層設置一組損失函數,因此網絡的總體損失函數為

2 實驗與結果分析

本文的算法采用Python 3.7 編寫,使用Pytorch 1.7.1 神經網絡框架,在Ubuntu 16.04 的系統環境下運行。計算機配置為Intel Core i9-10940X 型號的CPU,NVIDIA RTX A6000,48GB內存的顯卡。在3 個公共數據集上測試、評估所提出的網絡,證明本文所提出模型性能的優越性。使用ModelNet40[18]數據集進行分類任務測試,S3DIS[19]和SemanticKITTI[26]數據集進行點云分割任務測試,并分別與當前分類、分割領域最新的主流算法的精度進行對比。最后設置一組對比消融實驗,設計幾種不同的模型變體來突出引入Transformer 自注意力機制后,給模型性能帶來的提升。另外還給出了本文算法的效率分析,證明所提算法的合理性和有效性。

2.1 M odelNet40 數據集上的分類實驗

ModelNet40[18]數據集總共包含12 311 個CAD模型,涵蓋40 個對象類別,它被廣泛應用于點云形狀分類測試。為了進行公平比較,使用官方設置方式,9 843 個對象用于訓練,2 468 個對象用于測試評估。具體在網絡的訓練過程中,進行了數據縮放、翻轉和增加擾動來擴充輸入數據,使用結合動量的梯度下降法來最小化交叉熵損失,批處理大小設置為16,動量設置為0.98,初始學習率為10-3,并按照每100 個訓練批次除以10 的方式對學習率進行指數衰減策略,在最后的全連接層使用概率為0.5 的dropout 層,設置300 個訓練批次進行訓練,網絡最終收斂在250 個訓練批次左右。

如表1 所示,使用總體精度作為評價指標,將本文的模型算法與當前最新的算法PointNet[3]、PointNet + +[4]、SO-Net[21]、ConvPoint[22]、PointCNN[6]、PCNN[7]、PointWeb[5]、PointConv[23]、A-CNN[24]、PointASNL[25]、KPConv[12]就ModelNet40的分類精度結果進行對比。值得注意的是,本文特別加入了使用核點卷積的兩種原模型Rigid KPConv、Deform KPConv 和FPC 原模型來進行比較,可以看出本文的算法達到了93.2%的最佳精度,體現了本文的模型在實現分類任務上的優越性。

2.2 S3DIS 數據集上的分割實驗

S3DIS[19]是用于點云語義分割的大型室內場景數據集,共有2.73 億個點,標注有13 個類別,覆蓋了3 個不同建筑的6 個大型室內區域。圖9為該數據集在區域1 的示例圖,圖中右邊部分是對局部場景加了語義標簽后的放大圖。

圖9 S3DIS 數據集部分示例Fig.9 Part example of S3DIS dataset

在訓練過程中,同樣使用結合動量的梯度下降法來對逐點的交叉熵損失進行優化,批處理大小大小設置為8,動量設置為0.98,初始學習率為10-2,同樣按照每100 個訓練批次除以10 的方式對學習率進行指數衰減策略,但最后不再使用dropout 層,設置500 個訓練批次進行訓練,網絡最終收斂在450 個訓練批次左右。與大多數方法一樣,使用區域5 作為測試場景,以更好的衡量模型的泛化能力,表2 中,與當前最新的主流算法PointNet[3]、SEGCloud[10]、PointCNN[6]、SPG[11]、PCNN[7]、PointWeb[5]、PCT[20]、RandLA-Net[28]、PAConv[32]、KPConv[12]在區域5 進行測試精度對比,如表2 所示。使用語義分割領域最常用的交并比(Intersection over Union,IoU)作為評價指標:

AIoUi表示當前第i個類別的交并比精度,Pi和Gi分別表示當前類別下的預測值(Prediction)和真值(Ground Truth),AmIoU為13 個類別的平均交并比。表2 給出了當前各個算法在包括天花板、地板、桌子等13 個類別上的分類別AIoU結果對比。AmIoU可以更直觀地展現當前算法的精度情況,見表2的第二列。

可以看出本文的模型相對其他算法優越性,在AmIoU指標下取得了69.3%的高性能,跟核點卷積的兩種原模型Rigid KPConv、Deform KPConv 以及FPC 原算法比較也可以看出本文模型的性能有很大提升。同時具體在13 類具體類別AIoU精度上,本文的模型在7 種類別上取得了最高分割精度。

為了更加直觀地展示本文所提算法的效果,將S3DIS 數據集場景中的分割結果進行了可視化。如圖10 所示,圖(a)為該場景下地面真實語義標簽圖,圖(b)為使用本文算法模型在同樣場景的語義預測結果,圖(c)為所提算法的預測結果相對于地面真實標簽的誤差對比。對應表2 可以看出,跟當前大部分先進算法一樣,除了在一些像梁、柱這樣結構特征信息較少的物體以及像多個桌子、椅子密集分布情況下的誤差較大外,本文算法在場景中大部分類別上都能實現較準確的分割效果。

圖10 S3DIS 數據集場景分割可視化結果Fig.10 Visualization results of S3DIS dataset scene segmentation

2.3 SemanticKITTI 數據集上的分割實驗

SemanticKITTI[26]數據集是一種大型室外自動駕駛場景數據集,它是點云語義分割算法最常使用的一種激光雷達數據集,非常具有代表性??偣灿?3 000 多個密集注釋的激光雷達掃描組成,包含汽車、行人、道路等19 個語義標簽。按照數據集官方文件定義的序列劃分,分為22 個序列,其中00-10 序列包含真實標簽,使用08 序列作為驗證集,00-07 以及09-10 序列作為訓練集,剩余的11-21 序列沒有真實標簽,因此作為測試集。

訓練時令批處理大小為4,設置動量為0.98,初始學習率為10-2,同樣按照每100 個訓練批次除以10 的方式對學習率進行指數衰減策略,最后不使用dropout 層,設置150 個訓練批次進行訓練,網絡最終收斂在120 個訓練批次左右。

同樣使用AIoU作為評價指標,將本文算法與應用SemanticKITTI 數據集的代表性先進算法進行比。如表3 所示,給出了本文算法與其他算法PointNet[3]、PointNet + +[4]、LatticeNet[27]、RandLANet[28]、SqueezeSegV3[29]、CNN-LSTM[30]、KPConv[12]、FusionNet[31]針對所有類別的平均交并比AmIoU以及每個類別各自的AIoU的精度對比。

表3 SemanticKITTI 數據集上各算法的平均分割精度(AmIoU)及逐類別精度(AmIoU)對比Tab.3 Comparison of average segmentation accuracy (AmIoU)and each category accuracy(AmIoU) of algorithms on SemanticKITTI dataset

可以看出本文算法取得了當前先進精度。相對于其他算法,第二行AmIoU指標取得了63.2%的最高性能。由于原 FPC 算法沒有在SemanticKITTI 上進行實驗,因此只能跟原KPConv算法比較,可以看出本算法的AmIoU有將近5%的提升,有效證明了本算法對于性能提升的作用;同時在19 種語義類別的逐類別AmIoU指標上,本算法在10 個類別上取得了最高精度的效果。

同樣,為直觀展現本算法的有效性,將SemanticKITTI 數據集08 序列(驗證集)上的分割結果進行可視化展示,如圖11。圖分為兩行,每一行表示一次雷達掃描幀,在此選取了兩幀來進行結果展示,圖(a)為原始雷達輸入,圖(b)為本文算法的預測結果,圖(c)為真實標簽圖,可以較為明顯地看出本算法在道路、植被、建筑、汽車等相對占地面積較大的語義類別中取得了出色的的分割精度,只有在較遠處或相對細微處的預測標簽出現一些錯誤,如移動著的行人、較小的交通標識。

圖11 SemanticKITTI 數據集場景分割可視化結果Fig.11 Visualization results of SemanticKITTIdataset scene segmentation

2.4 消融實驗

為了能夠更加直觀準確地體現本文加入注意力模塊的原因,專門設計了一組對比消融實驗。將圖1 中的空間注意力模塊以及通道注意力模塊去掉,保留其他結構作為基線(Baseline,BL)模型;在BL 的基礎上分別加入空間注意力模塊(Spatial Attention,SA) 和通道注意力模塊(Channel Attention,CA);以及如圖1 一樣,同時使用SA 和CA,由此得到4 組模型變體在S3DIS 分割數據集上進行對比實驗。如表4 第2 列,在只有BL 時的AmIoU精度為67.9%,精度已經高于KPConv 和FPC 原算法;在加入了SA 后精度提升了將近1%;加入CA 后相對遜色一些,精度提升了0.5%;同時加入兩個模塊精度提升了1.4%,充分驗證了雙注意力模塊引入的有效性和可實施性。

表4 不同的模型變體在S3DIS 數據集上的分割精度對比Tab.4 Comparison of segmentation accuracy of different model variants on S3DIS dataset

同時,本文最終采用的模型在13 類分類別精度中的大部分類別中都取得了最高精度,見表4。這有效證明了本文所提出DPA-Net 網絡在加入雙注意力模塊后能提取更多的上下文信息,提升最終的精度。

2.5 算法效率分析

如表5 所示,系統地評估本文算法網絡在真實大規模場景下進行3D 點云語義分割的效率。使用相同的評價標準,在SemanticKITTI 數據集上將本文訓練的模型與其他代表性算法網絡進行比較。使用08 序列驗證集,共有4071 個點云掃描幀。將每種網絡的總參數量、網絡單次運行可以處理的最大3D 點云數量以及跑完一次08 序列消耗的時間進行對比??梢钥闯?綜合內存、時間等方面的消耗,RandLA-Net[28]單次推斷的效率最高,但其后續需要多重評估來最小化隨機采樣帶來的影響,勢必會增加消耗。本文算法融合KPConv、FPC 兩種卷積算子,但搭建的卷積層數遠小于兩種原算法網絡;注意力層的引入只會增加有限的參數量;網絡中的其他結構更多的是1×1 卷積或者共享參數的MLP,其參數量很小。因此結合AmIoU精度來看,本文算法在沒有過多地增加消耗的情況下,精度有了巨大提升。

表5 SemanticKITTI 數據集上分割的效率對比Tab.5 Comparison of efficiency of segmentation on SemanticKITTI dataset

3 結論

本文提出了一種雙路徑卷積的三維點云分割算法DPA-Net,用以進行點云分類和分割兩種任務。在點云分類數據集ModelNet40 上的總體精度相對于主要參考算法有了較大的提升,達到了93.2%;在點云分割數據集S3DIS 上的分割交并比精度達到了69.3%,相對于KPConv、FPC 分別提升了3.9%、6.5%,改進效果明顯,此外,在本數據集上進行的消融實驗充分證明了引入注意力模塊的有效性;在SemanticKITTI 分割數據集上的交并比精度達到了63.2%,相對于KPConv 提升了4.4%,相對于其他先進算法,同樣具有明顯優勢,同時,就網絡總參數量、運行消耗時間進行的算法效率評估表明,本算法在沒有過多增加消耗的情況下,精度有了巨大的提升。

猜你喜歡
算子注意力卷積
讓注意力“飛”回來
基于3D-Winograd的快速卷積算法設計及FPGA實現
擬微分算子在Hp(ω)上的有界性
各向異性次Laplace算子和擬p-次Laplace算子的Picone恒等式及其應用
從濾波器理解卷積
一類Markov模算子半群與相應的算子值Dirichlet型刻畫
基于傅里葉域卷積表示的目標跟蹤算法
“揚眼”APP:讓注意力“變現”
Roper-Suffridge延拓算子與Loewner鏈
A Beautiful Way Of Looking At Things
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合