缺乏訓(xùn)練樣本醫(yī)療AI“喂不飽”?騰訊優(yōu)圖實(shí)驗(yàn)室想了這兩個(gè)辦法
“醫(yī)學(xué)影像本質(zhì)上是一個(gè)圖像識(shí)別問題,面臨的最大挑戰(zhàn)是小樣本學(xué)習(xí)的問題。”
5月30日-6月2日,由中國醫(yī)師協(xié)會(huì)、中國醫(yī)師協(xié)會(huì)放射醫(yī)師分會(huì)主辦,廣東省人民醫(yī)院及廣東省醫(yī)師協(xié)會(huì)放射醫(yī)師分會(huì)承辦的“中國醫(yī)師協(xié)會(huì)第十三次放射醫(yī)師年會(huì)”在廣州召開,這也是中國放射學(xué)界最高級(jí)別的會(huì)議之一,影像組學(xué)與醫(yī)學(xué)影像人工智能領(lǐng)域的跨界融合是這次會(huì)議的重要議題之一。
騰訊優(yōu)圖實(shí)驗(yàn)室醫(yī)療AI總監(jiān)鄭冶楓博士受邀出席,并進(jìn)行題為“深度學(xué)習(xí)在醫(yī)學(xué)影像分析上的應(yīng)用”的主題分享,分享優(yōu)圖實(shí)驗(yàn)室通過遷移學(xué)習(xí)和計(jì)算機(jī)合成圖像兩大方法,突破醫(yī)療AI數(shù)據(jù)量不足,沒有辦法像傳統(tǒng)機(jī)器學(xué)習(xí)那樣用大數(shù)據(jù)進(jìn)行喂哺的問題。
鄭冶楓博士在中國醫(yī)師協(xié)會(huì)第十三次放射醫(yī)師年會(huì)上做主題演講
騰訊優(yōu)圖實(shí)驗(yàn)室是騰訊頂級(jí)人工智能實(shí)驗(yàn)室之一,專注于在人臉、圖像、視頻、醫(yī)療影像等領(lǐng)域開展技術(shù)研究。騰訊首款將人工智能技術(shù)運(yùn)用在醫(yī)學(xué)領(lǐng)域的產(chǎn)品“騰訊覓影”,即是由騰訊醫(yī)療健康事業(yè)部牽頭,優(yōu)圖實(shí)驗(yàn)室提供的算法支持。
醫(yī)療AI面臨“雙重挑戰(zhàn)”
當(dāng)前人工智能技術(shù)的迅猛發(fā)展,與強(qiáng)大的計(jì)算能力、合理的優(yōu)化算法和高質(zhì)量的大數(shù)據(jù)密切相關(guān)。要讓機(jī)器像人類那樣思考,成為醫(yī)生的得力助手,就必須“喂”給它大量的數(shù)據(jù),幫助它從中找出規(guī)律。但是,在醫(yī)療人工智能領(lǐng)域,這一切卻沒有這么簡單。鄭冶楓博士提到,近年來,深度學(xué)習(xí)在包括圖像識(shí)別、游戲、語音識(shí)別、自然語言處理等方面取得了重大發(fā)展。但是,醫(yī)療AI的發(fā)展卻面臨“雙重挑戰(zhàn)”。
一是缺乏訓(xùn)練樣本。鄭冶楓博士表示,“深度學(xué)習(xí)的目標(biāo)是盡量端對(duì)端,圖像進(jìn)去、結(jié)果出來,因而網(wǎng)絡(luò)越來越大,越來越多層,需要的訓(xùn)練樣本也越來越多!钡c自然場景下自然圖像獲取不同,醫(yī)學(xué)影像的獲取十分艱難。一方面,患者對(duì)于個(gè)人的就醫(yī)隱私要更為重視,醫(yī)學(xué)圖像幾乎不會(huì)上網(wǎng)和共享;另一方面,圖像采集的“高門檻性”也制約著訓(xùn)練樣本的獲取!搬t(yī)學(xué)影像采集需要專門的設(shè)備,有一些設(shè)備非常昂貴,比如CT和核磁。”同時(shí),疾病本身的特殊性也對(duì)算法工程師獲取樣本造成阻礙,鄭冶楓博士表示,“對(duì)于一些罕見病種,能夠找到的圖像就只有幾百張或者一千來張,因?yàn)槊磕甑陌l(fā)病量就那么多!
二是缺乏標(biāo)注。鄭冶楓博士介紹道,對(duì)于自然圖像來講,其標(biāo)定相對(duì)容易,即便是普通人也能夠直接標(biāo)注。但醫(yī)學(xué)影像不同,其標(biāo)注需要行業(yè)頂尖的專業(yè)醫(yī)生參與!艾F(xiàn)實(shí)是,培養(yǎng)一個(gè)醫(yī)生需要十年時(shí)間甚至很長,加上臨床、科研任務(wù)重,做數(shù)據(jù)標(biāo)注對(duì)于醫(yī)生來說也是‘有心無力’!
兩大方法突破醫(yī)療AI小樣本學(xué)習(xí)問題
缺乏訓(xùn)練樣本、缺乏標(biāo)注這兩大挑戰(zhàn)讓深度學(xué)習(xí)“彈藥不足”,由此衍生出的“小樣本學(xué)習(xí)”問題一定程度上阻礙了AI醫(yī)學(xué)影像的發(fā)展。鄭冶楓博士提出,有兩種方法有助于解決這一問題:一是遷移學(xué)習(xí);二是計(jì)算機(jī)合成圖像,比如生成對(duì)抗網(wǎng)絡(luò)。
在介紹遷移學(xué)習(xí)的概念時(shí),鄭冶楓博士用了一個(gè)生動(dòng)的比喻:“比如說一個(gè)人去森林里找老虎,但從來沒有見過老虎,不知道老虎長什么樣。但假如他可以把貓和狗、狐貍等其他動(dòng)物區(qū)分開來,就可以先訓(xùn)練他去找貓,這就是預(yù)訓(xùn)練的過程。接下去,我們告訴對(duì)方:老虎就是黃色的貓放大100倍,從而達(dá)到‘找老虎’這個(gè)目的!彼麖(qiáng)調(diào),遷移學(xué)習(xí)非常適用于解決小樣本的訓(xùn)練問題。
另一個(gè)方法則是計(jì)算機(jī)合成圖像。鄭冶楓博士表示,通過影像跨模態(tài)轉(zhuǎn)換,計(jì)算機(jī)合成圖像能夠有效補(bǔ)充訓(xùn)練樣本,而生成對(duì)抗網(wǎng)絡(luò)則讓訓(xùn)練如虎添翼:一個(gè)網(wǎng)絡(luò)生成圖像,一個(gè)網(wǎng)絡(luò)鑒別目標(biāo)的真?zhèn),把兩個(gè)網(wǎng)絡(luò)做一些聯(lián)合訓(xùn)練。訓(xùn)練結(jié)束時(shí),生成網(wǎng)絡(luò)可以產(chǎn)生非常逼真的圖像。鄭冶楓博士以肝癌為例,“有時(shí)候跨模態(tài)生成的圖像會(huì)扭曲,會(huì)生成一些新的病灶,也可能遺漏一些病灶,為此,我們?cè)谘芯窟^程中會(huì)加上各類限制,減少生成圖像的失真。我們的算法很完美地保留了器官和病灶的形狀,是在用非常真實(shí)的圖像作為訓(xùn)練任務(wù),通過這種方法,能夠讓準(zhǔn)確率得到明顯的提升!
“騰訊覓影”能精確定位3mm以上的微小肺結(jié)節(jié),檢出率≥95%
醫(yī)療AI逐步落地 提升診斷準(zhǔn)確率和效率
通過遷移學(xué)習(xí)、計(jì)算機(jī)合成圖像等方法,影像診斷領(lǐng)域的深度學(xué)習(xí)取得了顯著進(jìn)展。以肺結(jié)節(jié)檢測(cè)為例,鄭冶楓博士介紹道,目前肺結(jié)節(jié)檢查方式主要是肺部CT,隨著薄層低劑量CT的應(yīng)用,圖像數(shù)量的倍增、小結(jié)節(jié)顯示率的提高及結(jié)節(jié)的定量測(cè)量等使得讀片的難度顯著增加,同時(shí),繁重、枯燥的閱片工作使影像科醫(yī)師的疲勞度增加,漏診、誤診的風(fēng)險(xiǎn)也在增加。
人工智能的運(yùn)用,使得這些問題逐步得到解決。經(jīng)過不斷地迭代和更新,“騰訊覓影”早期肺癌篩查AI系統(tǒng)采用了騰訊優(yōu)圖實(shí)驗(yàn)室的“端到端肺癌輔助診斷技術(shù)”,能夠精準(zhǔn)定位微小結(jié)節(jié)位置和輔助醫(yī)生準(zhǔn)確判斷患者患有肺癌的風(fēng)險(xiǎn)。預(yù)處理模塊、檢測(cè)與識(shí)別模塊是這一系統(tǒng)的核心算法。前者利用肺部的三維分割和重建算法,可以處理不同CT成像設(shè)備在不同成像參數(shù)條件下產(chǎn)生的不同源數(shù)據(jù)。而后者采用了“深度學(xué)習(xí)領(lǐng)域最好的分割算法”——全卷積神經(jīng)網(wǎng)絡(luò),可以實(shí)現(xiàn)早期肺結(jié)節(jié)檢測(cè)和分割。鄭冶楓博士表示,全卷積神經(jīng)網(wǎng)絡(luò)有兩部分,一部分是編碼器,把圖像不斷卷積和下采樣,最后壓縮到低維空間,這是不同任務(wù)可以共享的。一部分是解碼器,不斷卷積和上采樣,最后輸出一個(gè)輸入圖像大小一樣的分割結(jié)果,這部分是每個(gè)任務(wù)獨(dú)有的。我們預(yù)訓(xùn)練的編碼器會(huì)把所有任務(wù)的圖像都看一遍,因此訓(xùn)練得非常好!
“把編碼器訓(xùn)練好之后,就將其遷移到其它任務(wù),如肺部分割和肺結(jié)節(jié)良惡性判斷上。采用公開數(shù)據(jù)集,發(fā)現(xiàn)不僅僅分割可以做得很好,分類也可以做得很好!编嵰睏鞑┦繌(qiáng)調(diào),“在醫(yī)療AI上,技術(shù)方面大部分工作都差不多,最后的競爭還是在細(xì)節(jié)方面。比如在良惡性的判斷上,騰訊提出了Med3D預(yù)訓(xùn)練模型,該模型采用多個(gè)公開競賽數(shù)據(jù)集進(jìn)行訓(xùn)練。通過選取三維醫(yī)學(xué)影像進(jìn)行圖像分割任務(wù),并對(duì)這些數(shù)據(jù)進(jìn)行抓取、收集,預(yù)訓(xùn)練一個(gè)模型,能夠大幅提高分割和分類的準(zhǔn)確率,解決了大部分結(jié)節(jié)不活檢,不知道良惡性的問題!
據(jù)了解,目前,“騰訊覓影” 通過人工智能醫(yī)學(xué)圖像分析能力輔助醫(yī)生閱片,已經(jīng)能精確定位3mm以上的微小肺結(jié)節(jié),檢出率≥95%。同時(shí),除早期肺癌外,“騰訊覓影”還能利用AI醫(yī)學(xué)影像分析輔助臨床醫(yī)生篩查早期食管癌、眼底疾病、結(jié)直腸腫瘤、宮頸癌、乳腺腫瘤等疾病。
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字
圖片新聞
最新活動(dòng)更多
-
11月19日立即報(bào)名>> 【線下論壇】華邦電子與恩智浦聯(lián)合技術(shù)論壇
-
11月25日立即預(yù)約>> 【上海線下】設(shè)計(jì),易如反掌—Creo 11發(fā)布巡展
-
即日-12.26火熱報(bào)名中>> OFweek2024中國智造CIO在線峰會(huì)
-
精彩回顧立即查看>> 2024(第五屆)全球數(shù)字經(jīng)濟(jì)產(chǎn)業(yè)大會(huì)暨展覽會(huì)
-
精彩回顧立即查看>> 全數(shù)會(huì)2024中國人形機(jī)器人技術(shù)創(chuàng)新發(fā)展大會(huì)
-
精彩回顧立即查看>> OFweek 2024中國激光產(chǎn)業(yè)高質(zhì)量發(fā)展峰會(huì)
-
10 科源制藥并購“大戲”深解
- 1 南京殺出超級(jí)IPO:年入27億,華東第一
- 2 3 從巨額回購 看石藥集團(tuán)的“三張”價(jià)值底牌
- 4 我國發(fā)現(xiàn)能強(qiáng)效抑制艾滋病病毒的納米抗體!
- 5 星形膠質(zhì)細(xì)胞為阿爾茨海默病治療帶來可能
- 6 決戰(zhàn)大模型,百度健康背水一戰(zhàn)
- 7 聯(lián)影醫(yī)療:貢獻(xiàn)超億元收入上演控制權(quán)迷局
- 8 從神州細(xì)胞崛起,看藥企的第一性原理
- 9 2024年8月全球醫(yī)療器械創(chuàng)新成果進(jìn)展報(bào)告
- 10 2024年中國醫(yī)療設(shè)備行業(yè)研究報(bào)告
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市