訂閱
糾錯(cuò)
加入自媒體

商湯科技CVPR 2022再創(chuàng)佳績(jī) 用技術(shù)創(chuàng)新直擊行業(yè)痛點(diǎn)

2022-06-22 17:40
來(lái)源: 粵訊

6月19日-23日,全球人工智能計(jì)算機(jī)視覺(jué)領(lǐng)域頂級(jí)國(guó)際會(huì)議CVPR 2022(Computer Vision and Pattern Recognition,即國(guó)際計(jì)算機(jī)視覺(jué)與模式識(shí)別)在美國(guó)新奧爾良舉行,并同步進(jìn)行線上會(huì)議。商湯科技及聯(lián)合實(shí)驗(yàn)室共71篇論文入選本屆CVPR,再創(chuàng)新高,其中有接近四分之一被錄用為Oral(口頭報(bào)告),涵蓋三維視覺(jué)、自動(dòng)駕駛等多個(gè)備受關(guān)注的前沿研究領(lǐng)域和方向,繼續(xù)鞏固在全球計(jì)算機(jī)視覺(jué)研究領(lǐng)域的領(lǐng)跑勢(shì)頭。

自成立以來(lái),商湯及聯(lián)合實(shí)驗(yàn)室已在各學(xué)術(shù)頂會(huì)發(fā)表論文超過(guò)700篇,在各項(xiàng)競(jìng)賽中贏得超過(guò)70個(gè)世界冠軍。與此同時(shí),一直以來(lái)商湯沒(méi)有把論文數(shù)量作為衡量公司技術(shù)發(fā)展的標(biāo)準(zhǔn)。商湯科技聯(lián)合創(chuàng)始人、研究院院長(zhǎng)王曉剛博士表示:“我們希望通過(guò)為科研工作者提供高效科研的良好環(huán)境,鼓勵(lì)和引導(dǎo)年輕的研究者從解決業(yè)界實(shí)際問(wèn)題角度出發(fā),做高水平、高質(zhì)量的研究!

在本屆CVPR上,商湯科技還參與了多項(xiàng)學(xué)術(shù)競(jìng)賽,同樣取得了令人矚目的成績(jī)。例如,商湯科技與中科院自動(dòng)化所、上海人工智能實(shí)驗(yàn)室聯(lián)合參加Embodied AI 2022 (2022具身智能挑戰(zhàn)賽),在RxR-Habitat賽道斬獲冠軍。作為全球embodied AI研究領(lǐng)域權(quán)威性競(jìng)賽,比賽要求用自然語(yǔ)言控制解決室內(nèi)機(jī)器人的導(dǎo)航問(wèn)題。商湯的方法達(dá)到90%以上效果提升,導(dǎo)航準(zhǔn)確率從24.08%提升至45.82%,導(dǎo)航保真度從37.39%提升到55.43%。同時(shí),在為推動(dòng)基于深度學(xué)習(xí)的視覺(jué)編碼技術(shù)而舉辦的CLIC(Challenge on Learned Image Compression)競(jìng)賽中,商湯科技團(tuán)隊(duì)提供的方案成功獲得圖像編碼賽道冠軍,不僅在全部三個(gè)測(cè)試碼點(diǎn)上取得了最優(yōu)主觀評(píng)測(cè)分?jǐn)?shù),還擁有所有深度學(xué)習(xí)方案中最快的解碼速度。

推動(dòng)技術(shù)賦能產(chǎn)業(yè),以創(chuàng)新引領(lǐng)行業(yè)突破

商湯科技一直以來(lái)鼓勵(lì)研究團(tuán)隊(duì),關(guān)注產(chǎn)業(yè)需求和痛點(diǎn),將研究工作與實(shí)際業(yè)務(wù)場(chǎng)景相結(jié)合。近年來(lái),依托SenseCore商湯AI大裝置等AI基礎(chǔ)設(shè)施的構(gòu)建,商湯在前沿研究領(lǐng)域擁有更強(qiáng)大的支撐,進(jìn)一步推動(dòng)了與產(chǎn)業(yè)協(xié)同的深化,以AI技術(shù)創(chuàng)新引領(lǐng)行業(yè)發(fā)展。

例如在《Bailando: 3D Dance Generation via Actor-Critic GPT with Choreographic Memory》這篇論文中,研究人員提出了一種新的音樂(lè)到舞蹈框架Bailando,它可以驅(qū)動(dòng)3D角色跟隨音樂(lè)做出舞蹈動(dòng)作,而且不僅能保證動(dòng)作的標(biāo)準(zhǔn)與美感,還能在時(shí)間上保持與不同音樂(lè)節(jié)奏的一致性。當(dāng)前,在AI、云計(jì)算等技術(shù)能力提升的背景下,數(shù)字人的應(yīng)用范圍日漸豐富,在社交、游戲、直播、虛擬偶像等領(lǐng)域逐漸融入我們的生活。這一研究無(wú)疑為未來(lái)數(shù)字人產(chǎn)業(yè)進(jìn)行更加智能、個(gè)性的人物塑造,滿足多樣化需求提供了潛在方向。

商湯科技71篇論文入選CVPR 2022創(chuàng)新高 引領(lǐng)AI技術(shù)與產(chǎn)業(yè)創(chuàng)新發(fā)展

點(diǎn)云跟蹤框架PTTR示意圖

近年來(lái),隨著自動(dòng)駕駛和激光雷達(dá)技術(shù)的發(fā)展,基于點(diǎn)云的目標(biāo)跟蹤也獲得了更多的關(guān)注。針對(duì)點(diǎn)云數(shù)據(jù)特有的挑戰(zhàn)和現(xiàn)有算法的缺陷,在論文《PTTR: Relational 3D Point Cloud Object Tracking with Transformer》中,商湯研究團(tuán)隊(duì)提出了一個(gè)新穎的點(diǎn)云跟蹤框架PTTR,在多個(gè)數(shù)據(jù)集上顯著提升了目標(biāo)跟蹤的準(zhǔn)確性,為自動(dòng)駕駛的安全運(yùn)行打下了基礎(chǔ)。

商湯科技還聯(lián)合北京航空航天大學(xué)劉祥龍教授團(tuán)隊(duì),共同舉辦了面向復(fù)雜場(chǎng)景的魯棒機(jī)器學(xué)習(xí)大賽——Robust Models towards Open-world Classification。比賽以推動(dòng)安全可靠AI模型研究為目標(biāo),鼓勵(lì)打造更安全、更可靠的AI,支持人工智能技術(shù)更可持續(xù)地發(fā)展。大賽共吸引286只隊(duì)伍、416位參賽者參加。6月19日,大賽在CVPR2022 Art of Robustness Workshop上正式公布獲獎(jiǎng)名單。

加強(qiáng)基礎(chǔ)設(shè)施與生態(tài)建設(shè),助力成果生成

商湯科技在學(xué)術(shù)研究及技術(shù)創(chuàng)新方面取得的突出成績(jī),離不開(kāi)領(lǐng)先的軟硬件基礎(chǔ)設(shè)施整合的強(qiáng)大算力基礎(chǔ)和領(lǐng)先的算法能力,以及商湯在學(xué)術(shù)生態(tài)和開(kāi)源生態(tài)建設(shè)方面的長(zhǎng)期積累。商湯通過(guò)建設(shè)并不斷完善以SenseCore商湯AI大裝置為核心的基礎(chǔ)設(shè)施,為技術(shù)研發(fā)和落地提供重要基礎(chǔ)支撐。研究人員能夠高效地進(jìn)行科研,快速實(shí)驗(yàn)并驗(yàn)證新的想法,加速創(chuàng)新與迭代,促進(jìn)高水平論文的產(chǎn)生,同時(shí)解決產(chǎn)業(yè)落地中的問(wèn)題。

商湯十分重視學(xué)術(shù)生態(tài)建設(shè)。2017年以來(lái),商湯科技陸續(xù)與上海交通大學(xué)、南洋理工大學(xué)、浙江大學(xué)分別成立聯(lián)合研究院或?qū)嶒?yàn)室,與清華大學(xué)建立“感知計(jì)算”產(chǎn)學(xué)研深度融合專項(xiàng)計(jì)劃,并推動(dòng)成立全球人工智能高校學(xué)術(shù)聯(lián)盟,通過(guò)與學(xué)術(shù)界的緊密聯(lián)系,促進(jìn)各種學(xué)術(shù)成果的產(chǎn)生以及國(guó)際間的學(xué)術(shù)交流與合作。今年6月11日,商湯科技聯(lián)合全球高校人工智能學(xué)術(shù)聯(lián)盟成功舉辦“研無(wú)止境:商湯論文分享會(huì)”活動(dòng),匯聚來(lái)自商湯科技以及香港中文大學(xué)、浙江大學(xué)、南洋理工大學(xué)、北京大學(xué)等高校的研究學(xué)者嘉賓,在線解讀在3D視覺(jué)、姿態(tài)估計(jì)、底層視覺(jué)、表征學(xué)習(xí)、場(chǎng)景理解等領(lǐng)域的CVPR 2022 Oral 論文,分享寶貴學(xué)術(shù)經(jīng)驗(yàn)。

此外,商湯持續(xù)鞏固開(kāi)源生態(tài)建設(shè);谝曈X(jué)算法的開(kāi)源項(xiàng)目OpenMMLab目前在GitHub已經(jīng)擁有超過(guò)5萬(wàn)顆星,并成功向研究者和業(yè)界開(kāi)源上千個(gè)模型。基于決策智能的OpenDILab去年在WAIC大會(huì)發(fā)布并向?qū)W術(shù)和工業(yè)界開(kāi)源。在大模型方向,商湯與上海人工智能實(shí)驗(yàn)室及高校聯(lián)合發(fā)布了通用視覺(jué)技術(shù)體系書生INTERN,并開(kāi)源了OpenGVLab,助力通用人工智能基礎(chǔ)研究和生態(tài)構(gòu)建。OpenMMLab還在CVPR期間舉辦了主題為《OpenMMLab:計(jì)算機(jī)視覺(jué)研究和生產(chǎn)基礎(chǔ)平臺(tái)》的研討會(huì),邀請(qǐng)學(xué)術(shù)大咖參與分享討論,共建開(kāi)源生態(tài)。

隨著基礎(chǔ)設(shè)施的構(gòu)建完善,學(xué)術(shù)與開(kāi)源生態(tài)的培育,人工智能技術(shù)研究的基礎(chǔ)將能夠更加的穩(wěn)固、更加寬廣。商湯將以此為支撐持續(xù)引領(lǐng)人工智能技術(shù)創(chuàng)新,加強(qiáng)AI產(chǎn)業(yè)落地的深化,加快規(guī);瘧(yīng)用,推動(dòng)人工智能技術(shù)與產(chǎn)業(yè)發(fā)展不斷取得突破。

聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問(wèn)題的,請(qǐng)聯(lián)系我們。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)