侵權(quán)投訴
訂閱
糾錯
加入自媒體

AI制藥領(lǐng)域?qū)⒂瓉硇袠I(yè)大爆發(fā)?看看專家怎么說

AI技術(shù)到底能在多大程度上影響一顆新藥的誕生?未來十年,AI技術(shù)又將如何實質(zhì)性地顛覆生命科學(xué)領(lǐng)域?

5月10日,“首屆中國生物計算大會” 在蘇州金雞湖畔拉開帷幕,產(chǎn)、學(xué)、研、資界專家圍繞 “BT&IT” 主題,從各自領(lǐng)域出發(fā),從不同角度探討生物計算的定義、邊界以及 AI 對于生物數(shù)據(jù)的意義。此次大會由中國首家生物計算技術(shù)驅(qū)動的生命科學(xué)公司百圖生科,與致力于 IT 和 BT 交叉融合的創(chuàng)新孵化中心播禾創(chuàng)新共同主辦。

在國際視角下的生物計算新孵化專場,進行了兩場極具深度且充滿干貨的圓桌討論,其中一場是由百圖生科聯(lián)合創(chuàng)始人&CEO劉維、恒瑞醫(yī)藥高級副總經(jīng)理兼全球研發(fā)負責(zé)人張連山、藥明康德聯(lián)席CEO楊青、佐治亞理工學(xué)院機器學(xué)習(xí)中心副主任宋樂、清華大學(xué)智慧產(chǎn)業(yè)研究院首席科學(xué)家馬維英五位嘉賓共同參與的圓桌對話,動脈網(wǎng)對場上嘉賓的精彩觀點進行了不改變原意的整理,以饗讀者:

劉維:首先請各位結(jié)合各自在生物計算領(lǐng)域所做的探索,進行一個簡單的自我介紹。

張連山:我來自江蘇恒瑞,主要負責(zé)公司研發(fā)。我們公司在設(shè)計領(lǐng)域開始地比較早,至少五年之前已經(jīng)跟很多公司做過接觸。過去,我們是從“猜”做藥,那時能做的靶點非常多,給社會和患者帶來了很大的紅利。但到今天形勢已經(jīng)變得復(fù)雜,很難再找到一個新的靶點。所以我們需要AI幫助,利用計算機輔助制藥的發(fā)現(xiàn)。

很多患者認為一款新藥太貴,這是因為新藥研發(fā)的成本極高,一款新藥的落地需要10億美金甚至更貴。事實上,研發(fā)成本還在不斷上升。今天我想通過與同行和跨領(lǐng)域的科學(xué)技術(shù)研究者來探討一種新的模式,努力把做藥的成本降下來。

馬維英:我在這個領(lǐng)域是最新進入的研究人員,過去20年一直在互聯(lián)網(wǎng)做搜索、做推薦,做內(nèi)容生成,都是比較傳統(tǒng)的AI領(lǐng)域,例如計算機視覺、自然語義處理、語音、機器翻譯、個性化推薦算法方面。

為什么開始對這個AI新藥這個領(lǐng)域感興趣呢?2019年,我開始注意到做自然語言處理的與新藥發(fā)現(xiàn)這兩個領(lǐng)域產(chǎn)生交叉,也就從那個時候進入這個領(lǐng)域。我相信隨著生命科學(xué)數(shù)據(jù)的累計到了一定階段,接下來十年,AI在生命科學(xué)、生物計算領(lǐng)域會有一個非常大的爆發(fā)和蓬勃的發(fā)展態(tài)勢,就相當(dāng)于過去20年互聯(lián)網(wǎng)時代的發(fā)展。

所以我最近常常跟AI領(lǐng)域的同事說,你們不要在紅海里面“擰毛巾”了,不管是視覺、自然語言理解都有非常多的事情可以做。今天在生命科學(xué)領(lǐng)域,我們把已有的工具借鑒過來,就會產(chǎn)生非常大的突破。AI新藥市場還是一片藍海,擁有巨大的機會。

隨著個體化精準(zhǔn)醫(yī)療時代的到來,越來越多的個性化治療方案被推出,比如一些免疫療法。但目前這些療法對于患者來說還是太貴,精度也還不夠高。如果AI介入提升新藥研發(fā)效率,把這些個性化療法的價格降下來,把基因測序價格降下來,縮短新藥研發(fā)時間,把精度提升上去,無疑會顛覆現(xiàn)有的醫(yī)療行業(yè)。

宋樂:我是百圖生科的顧問宋樂,我的背景和馬老師有很多重疊的地方,在過去大部分時間在AI和互聯(lián)網(wǎng)領(lǐng)域,研究AI對模態(tài)的數(shù)據(jù)分析,圖像、文本和復(fù)雜網(wǎng)絡(luò)的數(shù)據(jù)分析。我在學(xué)術(shù)界也做了很多關(guān)于生物數(shù)據(jù)的分析,包括多組學(xué)數(shù)據(jù)、小分子數(shù)據(jù)分析等。

目前在互聯(lián)網(wǎng)上有很多公開的數(shù)據(jù)集,有各種各樣的手段能夠測量生物很多不同的指標(biāo),似乎是已經(jīng)到了一個點。通過AI的方法,通過把公開的數(shù)據(jù)集合在一起,為新藥的發(fā)現(xiàn)起到助力作用。

劉維:場上嘉賓有來自大藥企生態(tài)鏈的高管都對生物計算持擁抱態(tài)度,邀請你們此次前來參會也正是因為我們看到了這一點。你們各自公司自身內(nèi)部都有很大的團隊在做這方面的研發(fā),在對外合作層面也有非常多的嘗試。作為傳統(tǒng)藥物研發(fā)企業(yè),你們認為還有什么機會是留給外面的AI藥物發(fā)現(xiàn)?有哪些事是你們傳統(tǒng)企業(yè)做不了,希望他們來做的?

張連山:在做藥方面,我們對AI非常有興趣。政府和國家層面都希望藥企做一個First-in-Class的東西,但目前我們很難找到全新的靶點。能不能通過應(yīng)用AI來解決這類問題,提高藥物研發(fā)效率、降低研發(fā)成本,目前的探索還處于初期。

此外,現(xiàn)在我們倡導(dǎo)精準(zhǔn)診斷、精準(zhǔn)治療。由于每一個藥對不同的患者不一定都有效,如果沒效的話對于患者來講帶來的就剩下藥物的副作用。如果AI技術(shù)能夠幫助我們提高進行精準(zhǔn)診斷、精準(zhǔn)治療的效率,降低成本,我們就可以騰出更多的資源去做更重要的事情。

劉維:大家是否愿意把數(shù)據(jù)開放給AI領(lǐng)域的伙伴?這是一個通用的問題。同時我們也請兩位AI方面的專家來談一談,如果他們回答是“yes”,你們最想要什么數(shù)據(jù)來加速模型的構(gòu)建?

張連山:我們研發(fā)新藥是從一個靶點開始,這個信息完全可以跟大家共同享受。我要的是分子,至于里面的知識也是可以跟大家共同享受的。

馬維英:最近我注意到美國有幾個大學(xué)在做一件事情叫TDC(Therapeutics Data Commons),這是一個機器學(xué)習(xí)在生物醫(yī)藥的大規(guī)模公開數(shù)據(jù)集。TDC包含了20+有意義的任務(wù)和70多個高質(zhì)量數(shù)據(jù)集,從靶蛋白的發(fā)現(xiàn),藥物動力學(xué),安全性,藥物生產(chǎn)都有包含。20幾個任務(wù)由專門的生命科學(xué)專家定出,又有標(biāo)準(zhǔn)化的表達。在這個公開數(shù)據(jù)集出來以后,就會有很多聰明的人進行競賽,想辦法提高數(shù)據(jù)精度。這個發(fā)展模式蠻值得我們參考。如果生命科學(xué)領(lǐng)域聯(lián)合AI人才共同推進該領(lǐng)域的發(fā)展,我個人覺得是一個非常好的方式。

另外一個維度——個人健康管理也值得思考。目前,我們有越來越多的個人健康管理工具,包含可穿戴設(shè)備。AI賦能個人健康,讓個人積極主動參與健康管理,貢獻數(shù)據(jù)。用一個開放的模式驅(qū)動數(shù)據(jù)AI在醫(yī)療、生命健康領(lǐng)域發(fā)展,這是蠻值得參考的方式。總的來講,AI還是靠數(shù)據(jù)。我個人覺得隨著時間的積累,數(shù)據(jù)的問題會被解決。

宋樂:我很贊同馬老師說的一些觀點,包括在醫(yī)藥行業(yè)如果能夠設(shè)計一些數(shù)據(jù)集和問題,就會發(fā)動更多的人參與,用AI來挖掘、探索新藥的靶點或者藥物設(shè)計的問題。這里非常重要的一個點就是在數(shù)據(jù)和AI模型之間產(chǎn)生閉環(huán)系統(tǒng),讓更多人嘗試用系統(tǒng)發(fā)現(xiàn)新的藥物靶點或者成藥的可能性。

用AI去賦能升級實驗平臺其實和互聯(lián)網(wǎng)的發(fā)展有很多相似之處,比如用戶搜索平臺和平臺智能推薦搜索可以相輔相成。當(dāng)AI的數(shù)據(jù)庫平臺建立起來后,用戶通過使用平臺會更新AI的模型,AI的模型會對用戶產(chǎn)生一些新的推薦,用戶根據(jù)推薦做一些相應(yīng)的操作,就會有越來越多的數(shù)據(jù)在平臺上積累。但如果沒有數(shù)據(jù)和AI模型閉環(huán)的操作,就很難看到AI的模型進行不斷迭代和提高。

劉維:我挺同意馬老師和宋老師的觀點,我們百圖生科也很想做宋老師說的閉環(huán)系統(tǒng),我們將自己定位為一些創(chuàng)新藥物領(lǐng)域的“創(chuàng)新藥廠”,希望能夠在這些領(lǐng)域能夠解決這幾點問題:一是行業(yè)數(shù)據(jù)稀缺,比如說董晨老師提到的免疫靶點的數(shù)據(jù),尤其是自身免疫性疾病領(lǐng)域,整個行業(yè)都是稀缺的,大藥廠內(nèi)部數(shù)據(jù)也有限;第二是怎么把閉環(huán)的驗證能力建立起來,無論是我們自己利用數(shù)據(jù)集進行更好的學(xué)習(xí)、驗證,還是為行業(yè)更多的AI伙伴提供循環(huán),讓大家可以圍繞新的數(shù)據(jù)挖掘出新的可能性,再去賦能傳統(tǒng)的大型藥廠,看看能否圍繞這些數(shù)據(jù)做后續(xù)的研發(fā)。圍繞新的數(shù)據(jù)集和新的計算方法的初期嘗試,其實失敗率還是比較高的,需要比較長周期的嘗試和驗證才能符合大藥廠的標(biāo)準(zhǔn)。

張連山:目前有各種各樣的數(shù)據(jù),比如多組學(xué)、基因、免疫等等,但難的是如何把似乎不相關(guān)的數(shù)據(jù)通過AI處理串聯(lián)起相關(guān)性,找到實質(zhì)性的東西,我認為這是這個領(lǐng)域想發(fā)展起來首先需要解決的問題。

劉維:是的,很多數(shù)據(jù)存在批次效應(yīng),散在各處的標(biāo)準(zhǔn)化程度不夠。標(biāo)準(zhǔn)化程度不夠在以前數(shù)據(jù)的顆粒度比較粗的時候不太會形成實質(zhì)性的阻礙,但隨著目前數(shù)據(jù)的顆粒度越來越細的時候,誤差可能就會掩蓋規(guī)律。

馬維英:如何把看似不相關(guān)的數(shù)據(jù)、知識關(guān)聯(lián)起來真的很重要,尤其是在生命科學(xué)這一非常需要專業(yè)知識儲備的領(lǐng)域。目前的AI制藥公司,還只是做到把小分子化合物推演出來交給后面,但他也不知道怎么引導(dǎo)、去搜索更好的藥物空間,這在目前還是一個斷裂的。

我認為的確需要把知識引擎、知識圖譜規(guī)則的東西引入到深度學(xué)習(xí)里面。生命科學(xué)也提供了一個新的土壤,讓AI繼續(xù)往前突破,把知識跟符號邏輯,跟統(tǒng)計,跟純數(shù)據(jù)驅(qū)動的,或者原來是模型驅(qū)動和數(shù)據(jù)驅(qū)動進一步結(jié)合,再把實驗室打通。我相信將來這個鏈條越通暢我們整個流程會轉(zhuǎn)得越快,創(chuàng)新也會越快,新的科學(xué)發(fā)現(xiàn)也會越快。

劉維:現(xiàn)在有一個詞叫做“計算可成藥性”或者叫“計算藥物”,如果沒有生物計算,這個藥不太能夠做出來,或者說是轉(zhuǎn)化率太低,沒有人敢做。我想問大家比較看好哪一個細分領(lǐng)域,會因為生物計算出現(xiàn)一大批的創(chuàng)新藥物?

張連山:我覺得是在國內(nèi)的小分子領(lǐng)域會有一些突破,我也很有信心我們能做到這一點。

馬維英:我個人的理解是如果是在已有的靶點的基礎(chǔ)上用AI的方法去推斷結(jié)構(gòu),預(yù)測功能。此外,我認為一個新的機會是將來AI成藥性能更加精準(zhǔn)化、個體化。

宋樂:我很贊同馬老師的觀點。除此之外,我的另外一個理解就是AI可以在哪些方面能夠助力現(xiàn)在的新藥開發(fā)。目前該領(lǐng)域已經(jīng)有一些公開數(shù)據(jù)集存在但散落在不同的角落。為了發(fā)現(xiàn)一個新的靶點或設(shè)計一款新的藥物,我們能否把這些紛繁復(fù)雜的數(shù)據(jù)組合起來,通過AI的模型進行數(shù)據(jù)統(tǒng)計、分析和推理,或者通過AI來篩選比如小分子結(jié)構(gòu)、蛋白質(zhì)結(jié)構(gòu)等。在這樣的情況下,AI會助力傳統(tǒng)醫(yī)藥研發(fā)進步,帶來突破。

劉維:我自己的選擇跟兩家大藥廠的不太一樣。百圖生科會把更多的重心放在大分子藥物的設(shè)計中。剛剛馬老師也提到蛋白質(zhì)本質(zhì)上也是一種語言,包括它的序列、結(jié)構(gòu)預(yù)測的進程等,會對整個狀態(tài)空間起到了輔助探索的作用。我們自身會圍繞復(fù)雜動態(tài)免疫問題,復(fù)雜的可編程抗體等作為我們重要的探索方向,希望在這個過程中實現(xiàn)比較精準(zhǔn)的,針對動態(tài)免疫組裝的免疫藥物。

因為時間關(guān)系,今天我們就交流到這里,謝謝各位。

作者:陳宣合

聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點和對其真實性負責(zé),如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問題的,請聯(lián)系我們。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

醫(yī)療科技 獵頭職位 更多
文章糾錯
x
*文字標(biāo)題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號