訂閱
糾錯
加入自媒體

德國亞琛工業(yè)大學提出DualConvMesh-Net更好處理3D網(wǎng)格數(shù)據(jù)

對于網(wǎng)格形式的3D數(shù)據(jù)學習一直以來是三維深度學習研究的重點,網(wǎng)格的復雜性和不規(guī)則性使得通常的卷積網(wǎng)絡(luò)無法有效的應(yīng)用。為此來自德國亞琛工業(yè)大學的研究人員們提出了一種集成測地線卷積和歐幾里得卷積的層級卷積模型DualConvMesh-Net,用于處理三維幾何數(shù)據(jù),其中定義在網(wǎng)格表面的測地線卷積可以將作用于給定網(wǎng)格的局域表面,更加注重對于不同目標的編碼與分離;而定義在鄰域的歐幾里得卷積則獨立于表面結(jié)構(gòu),著重于分析區(qū)域內(nèi)點之間的相互關(guān)系、編碼鄰近目標間的相關(guān)性,而不注重目標的獨立性。

通過有效結(jié)合歐幾里得卷積和測地線卷積,基于層級結(jié)構(gòu)實現(xiàn)多尺度多分辨率的網(wǎng)格分析,最終大幅度提升了三維語義分割任務(wù)的性能,并在多個數(shù)據(jù)集上取得了優(yōu)異的結(jié)果。

向三維幾何進軍的深度學習

隨著深度學習在圖像領(lǐng)域取得了令人矚目的成就,研究人員們也逐漸開始將深度學習方法特別是卷積神經(jīng)網(wǎng)絡(luò)從規(guī)則、離散的音頻、圖像和體素領(lǐng)域,向非規(guī)則的幾何數(shù)據(jù)上進行應(yīng)用。典型的幾何數(shù)據(jù)包括圖結(jié)構(gòu)、點云和3D網(wǎng)格等,目前針對這一領(lǐng)域的研究基于數(shù)據(jù)表示的不同主要分為兩大方向:3D場景理解和3D形狀分析。

其中3D場景理解的主要任務(wù)包括語義分割、實例分割、部件分割等等,所面對的通常是點云數(shù)據(jù)。人們常常將原始點云轉(zhuǎn)換到規(guī)則的離散三維柵格中,以便標準的3D卷積處理。而直接處理點云顯然是一種更為便捷的方法,但最大的挑戰(zhàn)則來自于如何將卷積作用于非規(guī)則的點集上。這種方式通常將卷積核作用于利用球或者K最鄰近等歐幾里得方法得到的鄰域點集中。這種基于歐式距離的歐式卷積關(guān)注與點與點之間的相互關(guān)系,還對表面形變非常敏感。

與三維場景理解不同的是,三維形狀分析主要集中于形狀關(guān)系、形狀描述和檢索方面,主要關(guān)注以網(wǎng)格或者圖形式所編碼的表面信息。這種情況下,卷積核通常定義在網(wǎng)格或者圖的局域片層上,通過測地線距離來進行定位和聯(lián)系(可以理解為沿著物體表面連接兩個節(jié)點見最短的邊)。這種方式的卷積被稱為測地線卷積,其最主要的特性是對于曲面形變具有不變形的特點,因此非常適合與獨立個體的描述與辨別。

上圖彩色梯度顯示了兩種不同卷積的特點,可以看到測地線距離可以有效分離出獨立的個體,它專注于沿著表面進行學習;而歐式距離則更多地專注于空間相關(guān)性,可以銜接起小部分的缺失,以便學習到更多的上下文信息,補全缺失部分。

在這篇文章中,研究人員探索了上述的兩種卷積在三維網(wǎng)格語義分割任務(wù)中的應(yīng)用。目前絕大多數(shù)方法都基于歐式卷積,很少有利用測地線方法來進行的研究。歐式卷積主要專注于上下文和鄰域信息的學習,而測地線距離則主要針對特定目標,沿著其表面進行形狀學習。這兩種方法各有優(yōu)劣,那么如何將他們的優(yōu)勢結(jié)合起來提升模型性能呢?

為了解決這一問題,建立結(jié)合兩種卷積的綜合架構(gòu),研究人員提出了DualConvMesh-Net,在網(wǎng)格數(shù)據(jù)下利用兩種卷積對幾何結(jié)構(gòu)進行綜合學習與處理。為了在不同尺度上對歐式特征和測地線特征進行學習,不僅構(gòu)建了層級網(wǎng)絡(luò)架構(gòu),同時提出網(wǎng)格池化算法來在各個層級上簡化并保留重要的網(wǎng)格結(jié)構(gòu)。下面就詳細地了解模型如何融合不同卷積方法并對網(wǎng)格進行簡化和學習的。

DualConvMesh-Net

本文提出的DualConvMesh-Net(DCM-Nets)是一類層級深度網(wǎng)絡(luò)架構(gòu),它結(jié)合了測地線圖卷積在3D表面網(wǎng)格上的優(yōu)勢和歐幾里得圖卷積在空間域中3D頂點上的優(yōu)勢。網(wǎng)絡(luò)的輸入是包含了頂點信息的網(wǎng)格、輸入則是包含頂點特征的網(wǎng)格,可以有效用于稠密預測任務(wù)。網(wǎng)絡(luò)通過模塊化的形式構(gòu)建,具有容易集成與測評的優(yōu)勢。

本文提出的主體網(wǎng)絡(luò)架構(gòu)如下圖所示,在編碼器解碼器架構(gòu)的基礎(chǔ)上添加了銜接的殘差結(jié)構(gòu),便于訓練收斂?梢钥吹骄W(wǎng)絡(luò)由多個層級組成,每個層級中包含了多個疊加的DualConv結(jié)構(gòu)。在DualConv結(jié)構(gòu)中,測地線卷積和歐式卷積并行作用,并將得到的特征圖進行銜接輸出。而針對不同尺度的網(wǎng)格,則需要利用池化算法來對網(wǎng)格進行簡化。

針對歐幾里得圖卷積和測地線圖卷積,針對某個尺度的網(wǎng)格來說其頂點(Vertex)為歐式空間中的點集,而其邊則分為了基于knn或者一定鄰域半徑內(nèi)得到的歐幾里得形式的邊,以及基于網(wǎng)格上的面而得到的測地線邊(Edge).而最終卷積作用于與頂點對應(yīng)的特征xi上,輸出yi為頂點vi的對應(yīng)特征:

其中N表示頂點附近的鄰域,φ為訓練的非線性映射函數(shù)。值得注意的是,卷積核參數(shù)θ的數(shù)量與核的大小無關(guān),同時歸一化的分母提高了卷積對于不同鄰域數(shù)量的魯棒性。針對網(wǎng)絡(luò)最開始的卷積層,定義了僅僅依賴邊緣信息具有不變形的卷積操作,僅僅輸入xj-xi,而去除了包含絕對位置的初始特征xi。這樣的改變是的模型可以在場景的片層上訓練,但同時可以在完整的結(jié)構(gòu)上進行測評,不僅為每個頂點帶來更廣的上下文區(qū)域,同時也減少了運行時間。此外對于初始歐幾里得與側(cè)地線空間鄰域的復用則使得更深的圖卷積成為可能,同時也減少了運行的內(nèi)存需求提高的計算速度。

1  2  3  下一頁>  
聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號