侵權(quán)投訴
訂閱
糾錯(cuò)
加入自媒體

人工智能在新藥研發(fā)中的應(yīng)用現(xiàn)狀與挑戰(zhàn)

聲明:本文為火石創(chuàng)造原創(chuàng)文章,歡迎個(gè)人轉(zhuǎn)發(fā)分享,網(wǎng)站、公眾號(hào)等轉(zhuǎn)載需經(jīng)授權(quán)。

本文選自《藥學(xué)進(jìn)展》2021年第7期,作者劉曉凡 1,孫翔宇 1,朱迅 2* !端帉W(xué)進(jìn)展》雜志是由中國(guó)藥科大學(xué)和中國(guó)藥學(xué)會(huì)共同主辦、國(guó)家教育部主管

(1. 火石創(chuàng)造,浙江 杭州 310051;2. 吉林大學(xué)基礎(chǔ)醫(yī)學(xué)院,吉林 長(zhǎng)春 130021)

人工智能作為一種新興技術(shù),是新藥研發(fā)實(shí)現(xiàn)降本增效的重要方式之一,人工智能 + 新藥研發(fā)已成為中國(guó)醫(yī)藥企業(yè)加速創(chuàng)新轉(zhuǎn)型的重要驅(qū)動(dòng)力。對(duì)國(guó)內(nèi)外相關(guān)文獻(xiàn)和資料進(jìn)行檢索和歸納,重點(diǎn)分析人工智能在新藥研發(fā)領(lǐng)域的應(yīng)用模式,總結(jié)開(kāi)展人工智能應(yīng)用的企業(yè)主體及應(yīng)用場(chǎng)景,探究我國(guó)人工智能賦能新藥研發(fā)面臨的主要挑戰(zhàn)。

當(dāng)前,新藥研發(fā)面臨著成本高企、收益率下降的雙重困境。新藥研發(fā)具有技術(shù)難度大、投入資金多、研發(fā)風(fēng)險(xiǎn)大、回報(bào)率高和研發(fā)周期長(zhǎng)等特征,隨著疾病復(fù)雜程度的提升,新藥研發(fā)難度和成本迅速增加,全球新藥研發(fā)成功率呈明顯下降趨勢(shì)。2019 年,艾昆緯(IQVIA)發(fā)布報(bào)告 [1] 指出,新藥從臨床試驗(yàn)開(kāi)始到研發(fā)結(jié)束的平均開(kāi)發(fā)時(shí)間在過(guò)去 10 年里增加了 26%,2018 年達(dá)到 12.5 年;新藥開(kāi)發(fā)成功率不斷下降,2018 年降至 11.4%。據(jù) Nature 雜志報(bào)道,新藥研發(fā)成本快速增長(zhǎng),2018 年開(kāi)發(fā)的平均成本約為 26 億美元 [2]。新藥投資回報(bào)率不斷下滑,德勤發(fā)布的報(bào)告顯示,2017 年全球前 12 大制藥公司的研發(fā)投資回報(bào)率僅為 3.2%,較 2010 年的 10.3% 下降7 個(gè)百分點(diǎn) [3]。

人 工 智 能(artificial intelligence,AI) 的 發(fā) 展,為新藥研發(fā)帶來(lái)了新的技術(shù)手段。通過(guò)機(jī)器學(xué)習(xí)(machine learning,ML)、 深 度 學(xué) 習(xí)(deeplearning,DL)等方式賦能藥物靶點(diǎn)發(fā)現(xiàn)、化合物篩選等環(huán)節(jié),大大提升了新藥研發(fā)的效率,為降本增效提供了可能 [4]。應(yīng)用 AI 技術(shù),可縮短前期研發(fā)約一半時(shí)間,使新藥研發(fā)的成功率從當(dāng)前的 12% 提高到 14%,每年為全球節(jié)約化合物篩選和臨床試驗(yàn)費(fèi)用約 550 億美元 [5]。

提升新藥研發(fā)效率,對(duì)加快開(kāi)發(fā)臨床需求未被滿(mǎn)足的創(chuàng)新藥物,助力藥企搶占“best-in-class”和“first-in-class”藥物市場(chǎng)的機(jī)遇窗口期,從而提升藥企全球競(jìng)爭(zhēng)力具有重要意義。AI 技術(shù)作為提升新藥研發(fā)效率的重要驅(qū)動(dòng)力量,正在加速對(duì)新藥研發(fā)各環(huán)節(jié)的滲透 [6]。本文通過(guò)對(duì) AI 技術(shù)、AI 賦能新藥研發(fā)應(yīng)用場(chǎng)景,以及應(yīng)用 AI 技術(shù)的企業(yè)主體進(jìn)行總結(jié)梳理,并展望 AI 技術(shù)未來(lái)發(fā)展趨勢(shì),為 AI+新藥研發(fā)提供思路與參考。

01 人工智能 + 新藥研發(fā)的應(yīng)用模式

與 AI 在其他場(chǎng)景的應(yīng)用類(lèi)似,AI+ 新藥研發(fā)的實(shí)現(xiàn)路徑包括五大流程:1)獲取目標(biāo)訓(xùn)練數(shù)據(jù)集;2)AI 自主學(xué)習(xí)算法建模;3)多次訓(xùn)練優(yōu)化模型;4)測(cè)試集應(yīng)用以評(píng)估模型性能;5)基于模型實(shí)現(xiàn)分子篩選、預(yù)測(cè)、分析等預(yù)定目標(biāo)。算法、數(shù)據(jù)集和模型這 3 個(gè)要素是必不可少的部分,其中,算法和數(shù)據(jù)是實(shí)現(xiàn)應(yīng)用的關(guān)鍵。

1.1 人工智能 + 新藥研發(fā)應(yīng)用算法 AI 技術(shù)涵蓋 ML 和 DL,如表 1 所示。ML 算法在新藥研發(fā)領(lǐng)域被廣泛用于分類(lèi)和回歸預(yù)測(cè)等方面,常見(jiàn)的 ML 算法包括決策樹(shù)(decision tree)、隨機(jī)森林(random forest)、支持向量機(jī)(supportvector machine)、k-最近鄰算法、樸素貝葉斯分類(lèi)器等;DL 算法包括深度神經(jīng)網(wǎng)絡(luò)(deep neural network,DNN)、 卷 積 深 度 網(wǎng) 絡(luò)(convolutionalneural network,CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrentneural network,RNN)和自編碼器(autoencoder,AE)等。DL 算法適合處理大數(shù)據(jù),模型也更為復(fù)雜。隨著計(jì)算機(jī)性能的提高和數(shù)據(jù)量的積累,DL 算法在新藥研發(fā)中的應(yīng)用越來(lái)越廣 [7]。

DNN 是最早應(yīng)用于藥物發(fā)現(xiàn)的 DL 算法之一,最早來(lái)源于1943年McCulloch等[8]提出的計(jì)算模型。CNN 是一種前饋神經(jīng)網(wǎng)絡(luò),它在圖像識(shí)別領(lǐng)域的表現(xiàn)優(yōu)異 [9]。RNN 是一類(lèi)用于處理序列數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò),具有記憶能力,可用于處理基因和蛋白序列數(shù)據(jù)等 [10]。自編碼器的目的在于重構(gòu)輸入數(shù)據(jù),可生成學(xué)習(xí)模型,在藥物分子生成方面應(yīng)用前景廣闊 [11]。DNN、CNN、RNN 等 DL 算法模型通過(guò)定量結(jié)構(gòu)性質(zhì)關(guān)系(QSPR)或定量結(jié)構(gòu)活性關(guān)系(QSAR)等預(yù)測(cè)藥物分子的物理化學(xué)性質(zhì)以及藥物的吸收、分布、代謝、排泄和毒性(ADMET)。
表1:人工智能常見(jiàn)應(yīng)用算法

來(lái)源:火石創(chuàng)造根據(jù)公開(kāi)資料整理

面向新藥研發(fā)的 AI 分子篩選技術(shù)入選《麻省理工學(xué)院技術(shù)評(píng)論》發(fā)布的 2020 年“全球十大突破性技術(shù)”。AI 技術(shù)的發(fā)展正從傳統(tǒng)的大樣本訓(xùn)練向小樣本學(xué)習(xí)、反饋學(xué)習(xí)的模式轉(zhuǎn)變,小樣本學(xué)習(xí)、零樣本學(xué)習(xí)將逐漸在藥物研發(fā)中應(yīng)用和推廣 [12]。

1.2 人工智能 + 新藥研發(fā)應(yīng)用數(shù)據(jù) 新藥研發(fā)過(guò)程涉及大量的數(shù)據(jù),包括文獻(xiàn)資料、化合物數(shù)據(jù)、靶點(diǎn)數(shù)據(jù)、專(zhuān)利數(shù)據(jù)、臨床試驗(yàn)數(shù)據(jù)、真實(shí)世界數(shù)據(jù)、藥品審評(píng)審批數(shù)據(jù)、市場(chǎng)銷(xiāo)售數(shù)據(jù)等。面對(duì)海量、多源、異質(zhì)性的數(shù)據(jù),AI 技術(shù)應(yīng)用已逐漸跳出以靶點(diǎn)和分子篩選為核心的傳統(tǒng)新藥研發(fā)模式,形成以數(shù)據(jù)為核心的研發(fā)模式。

IBM 公司開(kāi)發(fā)的 Watson 系統(tǒng),通過(guò)閱讀 2 500萬(wàn)篇文獻(xiàn)摘要、100 萬(wàn)篇完整論文和 400 萬(wàn)篇專(zhuān)利文獻(xiàn),來(lái)預(yù)測(cè) RNA 結(jié)合蛋白(RNA binding protein,RBP)與肌萎縮側(cè)索硬化(ALS)的相關(guān)性。英國(guó)生物科技公司 Benevolent Bio 從全球范圍內(nèi)海量的學(xué)術(shù)論文、專(zhuān)利、臨床試驗(yàn)結(jié)果、患者記錄等數(shù)據(jù)中,提取對(duì)新藥研發(fā)有用的信息;Atomwise 公司利用其核心技術(shù)平臺(tái) AtomNet 識(shí)別重要的化學(xué)基團(tuán),如氫鍵、芳香度和單鍵碳,分析化合物的構(gòu)效關(guān)系,從而用于新藥發(fā)現(xiàn)和評(píng)估新藥風(fēng)險(xiǎn)。

02 人工智能 + 新藥研發(fā)的應(yīng)用企業(yè)

近年來(lái),越來(lái)越多的企業(yè)布局 AI+ 新藥研發(fā),探索如何用 AI 技術(shù)實(shí)現(xiàn)新藥研發(fā)的降本增效。據(jù)Deep Pharma Intelligence 統(tǒng) 計(jì), 截 至 2020 年, 全球共有 240 家 AI+ 新藥研發(fā)企業(yè),主要分布在美國(guó)、英國(guó)和加拿大,國(guó)內(nèi)也有一些從事此類(lèi)工作的企業(yè)。目前,探索 AI+ 新藥研發(fā)的企業(yè)主要有三類(lèi):一是 AI 藥物研發(fā)創(chuàng)新企業(yè),如 Exscienta、BenevolentAI、Atomwise、Relay Therapeutcs、晶泰科技、燧坤智能等;二是 IT 巨頭,如 Google、微軟、騰訊、阿里巴巴集團(tuán)等

三是大型制藥企業(yè),如羅氏、阿斯利康、強(qiáng)生、葛蘭素史克(GSK)等,見(jiàn)圖 1。

新藥研發(fā) IT 巨頭傾向于利用自身的互聯(lián)網(wǎng)基礎(chǔ)與平臺(tái)優(yōu)勢(shì)進(jìn)行技術(shù)布局,進(jìn)入方式為自主研發(fā)相關(guān)產(chǎn)品,開(kāi)發(fā)相關(guān)領(lǐng)域針對(duì)性技術(shù)以賦能行業(yè)應(yīng)用,業(yè)務(wù)領(lǐng)域不斷下沉,或者通過(guò)外延并購(gòu)擴(kuò)張業(yè)務(wù)版圖,例如騰訊進(jìn)軍 AI+ 新藥研發(fā)領(lǐng)域,發(fā)布首個(gè) AI驅(qū)動(dòng)的藥物發(fā)現(xiàn)平臺(tái)“云深智藥(iDrug)”,谷歌計(jì)劃斥資 4 億美元收購(gòu) AI 企業(yè) DeepMind。

圖1:人工智能+新藥研發(fā)企業(yè)圖譜

來(lái)源:火石創(chuàng)造根據(jù)公開(kāi)資料整理


AI+ 新藥研發(fā)企業(yè)多以技術(shù)優(yōu)勢(shì)切入 1 個(gè)或多個(gè)應(yīng)用場(chǎng)景,如 Benevolent AI 構(gòu)建判斷加強(qiáng)認(rèn)知系統(tǒng)(judgment augmented cognition system,JACS)技術(shù)平臺(tái),針對(duì)包括阿爾茨海默病和罕見(jiàn)腫瘤在內(nèi)的 4 個(gè)不同領(lǐng)域的疾病進(jìn)行 10 多種藥物的研發(fā),晶泰科技組建 Renova AI 新藥研發(fā)平臺(tái),提供“計(jì)算+ 實(shí)驗(yàn)”新模式下的藥物設(shè)計(jì)與固體形態(tài)研究服務(wù)。

大型藥企則以自建 AI 研究團(tuán)隊(duì)、投資并購(gòu)或與 AI 技術(shù)公司合作的方式,布局 AI 新藥研發(fā)。輝瑞、GSK 和諾華等制藥公司也在內(nèi)部建立了大量的AI 研究團(tuán)隊(duì)。當(dāng)前全球十大制藥公司均已布局 AI+新藥研發(fā),諸多大型制藥公司開(kāi)始與 AI 初創(chuàng)公司開(kāi)展合作,例如艾伯維與 AiCure、阿斯利康與 BergHealth、拜耳與Sensyne Health、百時(shí)美施貴寶(BMS)Concerto Health AI,以及輝瑞與 IBM Watson 等。

由于 AI+ 新藥研發(fā)創(chuàng)新公司缺少新藥研發(fā)的相關(guān)數(shù)據(jù)、成熟的研發(fā)管線(xiàn)以及資深的藥物專(zhuān)家,而這恰好是傳統(tǒng)制藥巨頭所具備的優(yōu)勢(shì)。因此,大型藥企和 AI+ 新藥研發(fā)的技術(shù)公司聯(lián)合是目前主要的業(yè)務(wù)模式。從開(kāi)展合作情況來(lái)看,隨著 AI+ 新藥研發(fā)的發(fā)展,現(xiàn)有制藥生態(tài)系統(tǒng)正從執(zhí)行研發(fā)的傳統(tǒng)利益攸關(guān)方逐漸轉(zhuǎn)向更加多樣化的技術(shù)支持伙伴關(guān)系 [13]。

我國(guó) AI+ 新藥研發(fā)起步較晚,目前尚處在初期階段,據(jù)火石創(chuàng)造統(tǒng)計(jì),國(guó)內(nèi)涌現(xiàn)了晶泰科技、深度智藥、云勢(shì)軟件、望石智慧等一批創(chuàng)新企業(yè),主要分布在北京、上海、杭州和深圳等城市。然而,國(guó)內(nèi) AI+ 新藥研發(fā)企業(yè)并不多,總數(shù)不足 20 家。

近年來(lái),隨著我國(guó)醫(yī)藥產(chǎn)業(yè)創(chuàng)新發(fā)展的加速推進(jìn),國(guó)內(nèi)的醫(yī)藥行業(yè)在 AI+ 新藥研發(fā)領(lǐng)域的跨界合作也在增加:一、醫(yī)藥巨頭與 AI+ 新藥研發(fā)技術(shù)公司合作,例如恒瑞醫(yī)藥與百奧知、豪森藥業(yè)與Atomwise 的合作;二、藥企與 IT 巨頭合作,如正大天晴通過(guò)與阿里云合作獲得一種全新的化合物篩選方法 [14];三、合同研究組織(CRO)企業(yè)與 AI+新藥研發(fā)技術(shù)公司合作,如藥明康德和 Schrdinger合資成立了 Faxian Therapeutics,將藥明康德的先導(dǎo)化合物優(yōu)化服務(wù)與 Schrdinger 的藥物設(shè)計(jì)軟件平臺(tái)相結(jié)合,從而加速新藥發(fā)現(xiàn);藥明康德和 Insilico 合作開(kāi)發(fā)了一種 ML 模型,用于從頭設(shè)計(jì) DDR1 蛋白(一種與纖維化等疾病有關(guān)的激酶)的小分子抑制劑。

03 人工智能 + 新藥研發(fā)的應(yīng)用實(shí)踐

目前,從全球 AI+ 新藥研發(fā)企業(yè)的應(yīng)用實(shí)踐來(lái)看,AI+ 新藥研發(fā)主要是將 ML、DL 等 AI 技術(shù),應(yīng)用到前期研究、靶點(diǎn)發(fā)現(xiàn)、化合物合成、化合物篩選、新適應(yīng)證發(fā)現(xiàn)、晶型預(yù)測(cè)、患者招募等新藥研發(fā)環(huán)節(jié)(見(jiàn)圖 2)。例如,數(shù)據(jù)挖掘和分析有助于藥物靶標(biāo)的確立,進(jìn)而找到具有潛力的先導(dǎo)化合物 [15],從而最大程度提升新藥研發(fā)效率。與傳統(tǒng)新藥研發(fā)管線(xiàn)比,基于 AI 和生物計(jì)算的新藥研發(fā)管線(xiàn)平均 1 ~ 2 年就可以完成臨床前藥物研究 [16]。靶點(diǎn)識(shí)別、先導(dǎo)化合物確定、藥物重定向被認(rèn)為是全球AI+ 新藥研發(fā)最具變革意義的研究領(lǐng)域 [17],其中靶點(diǎn)發(fā)現(xiàn)和化合物合成是企業(yè)布局的熱門(mén)方向。

3.1 前期研究 前期研究主要是基于文獻(xiàn)分析和知識(shí)庫(kù)建設(shè),進(jìn)行疾病機(jī)制、靶點(diǎn)、藥物作用方式研究。AI 的應(yīng)用主要在文獻(xiàn)數(shù)據(jù)整合分析、新藥研發(fā)知識(shí)庫(kù)建設(shè)、新藥研發(fā)數(shù)據(jù)集建設(shè)和基準(zhǔn)化合物庫(kù)設(shè)計(jì)等方面,可以借助 AI 自然語(yǔ)音處理、知識(shí)圖譜等技術(shù)實(shí)現(xiàn)海量信息的快速提取,從而對(duì)推動(dòng)新藥研發(fā)的眾多知識(shí)進(jìn)行聚類(lèi)分析,幫助提出新的可以被驗(yàn)證的假說(shuō),進(jìn)而加快新藥研發(fā)的進(jìn)程。例如深度智耀整合了數(shù)百個(gè)開(kāi)放數(shù)據(jù)源,通過(guò) ML 技術(shù),結(jié)合醫(yī)藥研發(fā)專(zhuān)家知識(shí),自動(dòng)提取醫(yī)藥實(shí)體、關(guān)系和屬性,構(gòu)建醫(yī)藥研發(fā)知識(shí)圖譜。

圖2:人工智能+新藥研發(fā)應(yīng)用場(chǎng)景來(lái)源:火石創(chuàng)造根據(jù)公開(kāi)資料整理

3.2 藥物發(fā)現(xiàn) 藥物發(fā)現(xiàn)是關(guān)系新藥研發(fā)成功率的關(guān)鍵環(huán)節(jié),主要包括靶點(diǎn)選擇優(yōu)化、先導(dǎo)化合物的發(fā)現(xiàn)、先導(dǎo)化合物的篩選優(yōu)化,AI 在藥物發(fā)現(xiàn)環(huán)節(jié)的應(yīng)用聚焦于靶點(diǎn)發(fā)現(xiàn)、晶型預(yù)測(cè)以及候選藥物分子的篩選優(yōu)化。

在靶點(diǎn)發(fā)現(xiàn)和驗(yàn)證方面,可以利用自然語(yǔ)言處理技術(shù)檢索分析海量文獻(xiàn)、專(zhuān)利和臨床試驗(yàn)報(bào)告的非結(jié)構(gòu)化數(shù)據(jù)庫(kù),找出與疾病相關(guān)的潛在的、被忽視的通路、蛋白和機(jī)制,從而提出新的可供測(cè)試的假說(shuō),以發(fā)現(xiàn)新機(jī)制和新靶點(diǎn) [13]。例如,Insilico Medicine 利用自主研發(fā)的 AI 新藥靶點(diǎn)發(fā)現(xiàn)平臺(tái) PandaOmics和 AI 分子生成和設(shè)計(jì)平臺(tái) Chemistry42,獲得了全球首例完全由 AI 驅(qū)動(dòng)發(fā)現(xiàn)的特發(fā)性肺纖維化(IPF)疾病新靶點(diǎn)。

在晶型預(yù)測(cè)方面,可以利用認(rèn)知計(jì)算實(shí)現(xiàn)高效動(dòng)態(tài)配置藥物晶型,預(yù)測(cè)小分子藥物所有可能的晶型。例如艾伯維(AbbVie)結(jié)合晶泰科技的晶型預(yù)測(cè)等技術(shù),設(shè)計(jì)了一套新集成模型,能夠以二維結(jié)構(gòu)作為輸入,預(yù)測(cè)得到分子的熱力學(xué)溶解度 [18]。相比于傳統(tǒng)藥物晶型研發(fā),采用 AI 技術(shù)的制藥企業(yè)能更加自如地面對(duì)仿制藥企業(yè)的晶型專(zhuān)利挑戰(zhàn)。另外,晶型預(yù)測(cè)技術(shù)縮短了晶型開(kāi)發(fā)的時(shí)間,能更加高效地挑選出合適的藥物晶型,進(jìn)而縮短研發(fā)周期,控制成本。

在化合物篩選和優(yōu)化方面,要從數(shù)以萬(wàn)計(jì)的化合物分子中篩選出對(duì)特定靶標(biāo)具有較高活性的化合物,往往需要較長(zhǎng)的時(shí)間和成本,可以利用 AI 技術(shù)建立虛擬藥物篩選模型,快速過(guò)濾“低質(zhì)量”化合物,富集潛在有效分子,檢索更快、覆蓋范圍更廣,利用 ML 技術(shù),從海量化合物中挑選出高潛力候選藥物,從而減少研發(fā)新藥的時(shí)間和成本 [19–20],加速先導(dǎo)化合物的發(fā)現(xiàn)和優(yōu)化,以及候選藥物分子的產(chǎn)生。例如 BenevolentBio 曾借助 JACS 技術(shù),標(biāo)記出 100個(gè)或可用于治療 ALS 的潛在化合物,并成功篩選出5 個(gè)化合物;BergHealth 則篩選了多達(dá) 25 萬(wàn)個(gè)疾病組織樣本來(lái)尋找癌癥早期的新生物學(xué)指標(biāo)和生物標(biāo)記等。

當(dāng)前來(lái)看,AI 藥物發(fā)現(xiàn)在藥物靶點(diǎn)發(fā)現(xiàn)和藥物篩選環(huán)節(jié)的技術(shù)應(yīng)用相對(duì)成熟:研究層面,現(xiàn)有 AI解決方案在藥物發(fā)現(xiàn)階段更具先進(jìn)性 [13],例如阿斯利康作為 AI 領(lǐng)域的探索者,僅在 2019 年就發(fā)布了65 篇 AI 相關(guān)的新藥發(fā)現(xiàn)及研發(fā)的相關(guān)文獻(xiàn);專(zhuān)利層面,AI+ 新藥研發(fā)領(lǐng)域的專(zhuān)利發(fā)布數(shù)量盡管還較少,但主要技術(shù)指向還是集中分布在藥物發(fā)現(xiàn)的靶標(biāo)確定和化合物篩選這 2 個(gè)技術(shù)分支 [21]。

另外,也有研究指出使用目前的數(shù)據(jù)不太可能大幅度地提升 AI 藥物發(fā)現(xiàn)的性能,因?yàn)槟壳暗臄?shù)據(jù)沒(méi)有反映出藥物在體內(nèi)的情況,所以計(jì)算機(jī)僅利用這些數(shù)據(jù)并不能很好地做出決策,尤其是針對(duì)復(fù)雜的疾病。雖然目前有大量的描述化學(xué)特性的數(shù)據(jù),這些數(shù)據(jù)能夠使計(jì)算機(jī)生成相應(yīng)的配體,但配體發(fā)現(xiàn)不等于藥物發(fā)現(xiàn) [22]。

3.3 臨床前研究 臨床前研究需要開(kāi)展藥效學(xué)、藥動(dòng)學(xué)和毒理學(xué)研究以及藥劑學(xué)研究,主要是提前預(yù)測(cè)候選藥物的ADMET 在后續(xù)藥物開(kāi)發(fā)中起到關(guān)鍵作用的性質(zhì),評(píng)估候選藥物通過(guò)臨床試驗(yàn)的可能性,提高后續(xù)臨床試驗(yàn)的成功概率。在臨床前研究環(huán)節(jié),可以利用AI 技術(shù)提升 ADMET 性質(zhì)預(yù)測(cè)的準(zhǔn)確度,以及幫助加速識(shí)別新適應(yīng)證。

在藥物 ADMET 性質(zhì)研究方面,可利用深度神經(jīng)網(wǎng)絡(luò)算法有效提取結(jié)構(gòu)特征的預(yù)測(cè)方式,進(jìn)一步提升 ADMET 性質(zhì)預(yù)測(cè)的準(zhǔn)確度。例如,云深智藥采用“從頭折疊”的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方法幫助解析了 SRD5A2 晶體結(jié)構(gòu),并通過(guò)自研 AI 工具“tFold”有效提升了蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)精度,在科研突破中發(fā)揮了核心作用 [23]。

在新適應(yīng)證拓展方面,一是可以利用 AI 的 DL能力和認(rèn)知計(jì)算能力,將已上市或處于研發(fā)管線(xiàn)的藥物與疾病進(jìn)行匹配,發(fā)現(xiàn)新靶點(diǎn),擴(kuò)大藥物的治療用途;二是借助公共領(lǐng)域的公開(kāi)大數(shù)據(jù)集資源,可以利用 AI 算法,選擇訓(xùn)練推導(dǎo)出預(yù)測(cè)跨目標(biāo)活動(dòng)的 ML 模型,應(yīng)用于藥物的再利用,實(shí)現(xiàn)對(duì)現(xiàn)有藥物識(shí)別新的適應(yīng)證;三是利用 AI 技術(shù)通過(guò)模擬隨機(jī)臨床試驗(yàn)發(fā)現(xiàn)藥物新用途 [24]。例如,燧坤智能通過(guò)ML 預(yù)測(cè),利用 AI 算法系統(tǒng)性整合疾病、靶點(diǎn)、藥物等多個(gè)維度的海量數(shù)據(jù),重建藥物-靶點(diǎn)相互作用網(wǎng)絡(luò),實(shí)現(xiàn)了對(duì)藥物-靶點(diǎn)相互作用的全景刻畫(huà),實(shí)現(xiàn)老藥新用、在研藥物二次開(kāi)發(fā)、失敗藥物再利用、天然產(chǎn)物開(kāi)發(fā)等。

3.4 臨床試驗(yàn) 臨床試驗(yàn)是新藥研究中周期最長(zhǎng)、成本最高的環(huán)節(jié),由于患者隊(duì)列選擇和臨床試驗(yàn)期間對(duì)患者的監(jiān)測(cè)不力等原因,當(dāng)前的藥物臨床試驗(yàn)成功率不高,通常 10 種進(jìn)入臨床試驗(yàn)的化合物中只有 1 種能進(jìn)入市場(chǎng)。在臨床試驗(yàn)環(huán)節(jié),可以利用 ML、自然語(yǔ)言處理等技術(shù)輔助臨床試驗(yàn)設(shè)計(jì)、患者招募和臨床試驗(yàn)數(shù)據(jù)處理。

AI 輔助臨床試驗(yàn)設(shè)計(jì)主要是利用自然語(yǔ)言處理技術(shù)快速處理同類(lèi)研究、臨床數(shù)據(jù)和監(jiān)管信息,以及讀取臨床試驗(yàn)等數(shù)據(jù)。例如 Trials.a(chǎn)i 公司使用 AI來(lái)優(yōu)化臨床試驗(yàn)設(shè)計(jì),使患者更容易參加臨床試驗(yàn),消除不必要的臨床操作負(fù)擔(dān)。

AI 患者招募主要利用自然語(yǔ)言處理、ML 等技術(shù),對(duì)不同來(lái)源的受試者信息和臨床試驗(yàn)方案的入組 / 排除標(biāo)準(zhǔn)進(jìn)行識(shí)別和匹配,包括醫(yī)學(xué)資料的數(shù)字化、理解醫(yī)學(xué)資料的內(nèi)容、關(guān)聯(lián)數(shù)據(jù)集和模式識(shí)別、擴(kuò)大受試者范圍、開(kāi)發(fā)患者搜索臨床試驗(yàn)的簡(jiǎn)化工具等 [25]。例如梅奧診所與 IBM Watson 合作,基于自然語(yǔ)言處理技術(shù),掃描臨床試驗(yàn)數(shù)據(jù)庫(kù),為臨床試驗(yàn)尋找合適的患者。在他們進(jìn)行的一項(xiàng)試點(diǎn)研究中,IBM Watson 臨床試驗(yàn)匹配系統(tǒng)使乳腺癌試驗(yàn)的平均每月注冊(cè)人數(shù)增加了 80%;零氪科技利用大數(shù)據(jù)整合患者資料,加快了招募患者參加臨床試驗(yàn)的速度。

AI 輔助臨床數(shù)據(jù)處理主要是利用云計(jì)算強(qiáng)大算力支快速處理臨床數(shù)據(jù)分析并及時(shí)調(diào)整優(yōu)化整個(gè)試驗(yàn)進(jìn)程,提升臨床試驗(yàn)風(fēng)險(xiǎn)控制能力。例如,太美醫(yī)療推出由病例報(bào)告表(CRF)設(shè)計(jì)平臺(tái)、臨床試驗(yàn)電子數(shù)據(jù)采集系統(tǒng) / 數(shù)據(jù)管理系統(tǒng)(EDC)、數(shù)據(jù)分析技術(shù)組合構(gòu)成的自動(dòng)化臨床數(shù)據(jù)解決方案,可以幫助藥企應(yīng)對(duì)臨床項(xiàng)目中多變的需求,優(yōu)化數(shù)據(jù)處理的流程。

表 2 介紹了 AI 主要應(yīng)用場(chǎng)景的代表企業(yè)。

表2:人工智能主要應(yīng)用場(chǎng)景代表企業(yè)

來(lái)源:火石創(chuàng)造根據(jù)公開(kāi)資料整理

04 人工智能 + 新藥研發(fā)面臨的挑戰(zhàn)

AI+ 新藥研發(fā)目前已進(jìn)入快速成長(zhǎng)期,備受業(yè)界矚目;但其作為新興領(lǐng)域,也面臨著一些挑戰(zhàn)。

一是生物學(xué)的復(fù)雜性,給數(shù)據(jù)獲取和 AI 算法設(shè)計(jì)帶來(lái)巨大挑戰(zhàn)。藥學(xué)是一個(gè)融合化學(xué)和生物學(xué)的學(xué)科,在數(shù)據(jù)層面,二者具有較大的差異性。一般來(lái)說(shuō),化學(xué)方面的數(shù)據(jù)更加穩(wěn)定、可控與易于計(jì)算;生物學(xué)數(shù)據(jù)涉及受體蛋白的構(gòu)象變化,平衡和偏置信號(hào)等難以定量計(jì)算。化合物與人體靶點(diǎn)的結(jié)合與反應(yīng)過(guò)程非常復(fù)雜,目前理論認(rèn)知不足,受環(huán)境影響因素很大,數(shù)據(jù)穩(wěn)定性和可重復(fù)性較差。

二是當(dāng)前的 AI 算法模型只納入部分化學(xué)指標(biāo),生物學(xué)指標(biāo)不完整。我們能夠基于化學(xué)數(shù)據(jù)去設(shè)計(jì)AI 算法,比如判斷小分子的各種體外物理化學(xué)性質(zhì)、晶型以及與靶點(diǎn)結(jié)合的親和力;但是對(duì)于小分子藥物在生物系統(tǒng)中的作用很難用一組有限的參數(shù)來(lái)定義,而化合物在體內(nèi)的其他特性在模型中被降級(jí)為次要的或可忽略部分,包括其前體化合物、代謝產(chǎn)物、濃度依賴(lài)性效應(yīng)等,這些被忽略的因素決定著藥物能否到達(dá)其預(yù)期的靶點(diǎn)、能否起到治療效果、以及其毒副作用是否在可以接受的范圍等。這使得 AI 在藥物發(fā)現(xiàn)和藥效評(píng)估中面臨著更大的不確定性。

三是高質(zhì)量數(shù)據(jù)制約。我國(guó)的醫(yī)藥大數(shù)據(jù)存在數(shù)據(jù)量少、數(shù)據(jù)體系不完整、數(shù)據(jù)標(biāo)準(zhǔn)不統(tǒng)一、數(shù)據(jù)共享機(jī)制不完善等問(wèn)題。諸如病歷、隨訪(fǎng)記錄目前還很難標(biāo)準(zhǔn)化、數(shù)字化;由于涉及患者隱私,臨床數(shù)據(jù)的靈活運(yùn)用也受到了一定限制;國(guó)內(nèi)創(chuàng)新藥研發(fā)起步較晚,原始數(shù)據(jù)積累有限;國(guó)內(nèi)藥品數(shù)據(jù)存儲(chǔ)分散,存儲(chǔ)格式不一,完整藥物數(shù)據(jù)獲取比較困難;新藥研發(fā)領(lǐng)域的核心數(shù)據(jù)來(lái)源于藥企,考慮到商業(yè)機(jī)密的問(wèn)題,企業(yè)不愿公開(kāi)核心數(shù)據(jù)。醫(yī)藥數(shù)據(jù)的數(shù)量和質(zhì)量將成為制藥行業(yè) AI 發(fā)展的主要障礙。

四是高端復(fù)合型人才缺失。AI 新藥研發(fā)兼具信息科技和醫(yī)藥雙重屬性,需要一批既掌握 AI 前沿技術(shù),又精通新藥研發(fā)的復(fù)合型人才,由于我國(guó)相關(guān)領(lǐng)域的教學(xué)科研起步較晚,人才問(wèn)題難以在短期內(nèi)得到解決 [26]。據(jù)統(tǒng)計(jì),全世界大約有 2.2 萬(wàn)名 AI 領(lǐng)域高端研究人員,而在中國(guó)只有約 600 名,人才需求缺口較大 [27]。

五是政策法規(guī)的制定滯后。AI 存在監(jiān)管體系滯后于技術(shù)發(fā)展、政府單向監(jiān)管無(wú)法有效管控風(fēng)險(xiǎn)、企業(yè)缺乏合規(guī)治理有效工具和體系等問(wèn)題。AI 因算法不透明、難解釋、跨界傳播性和外溢性強(qiáng),比一般的數(shù)字治理涉及范圍廣、難度大、問(wèn)題突出。當(dāng)前,AI 新藥研發(fā)監(jiān)管體系不健全,缺少具體的評(píng)估標(biāo)準(zhǔn)、市場(chǎng)準(zhǔn)入、退出機(jī)制和收費(fèi)機(jī)制,難以對(duì)潛在的問(wèn)題進(jìn)行監(jiān)督與反饋。在涉及人格權(quán)、知識(shí)產(chǎn)權(quán)、財(cái)產(chǎn)權(quán)、侵權(quán)責(zé)任認(rèn)定、法律主體地位等方面的 AI法律法規(guī)尚屬空白 [28]。
05 結(jié)語(yǔ)

AI 在新藥研發(fā)的各個(gè)階段都發(fā)揮著重要作用,也在一定程度上助力藥企降本增效,在資本驅(qū)動(dòng)下,AI+ 新藥研發(fā)正掀起創(chuàng)新熱潮。但需強(qiáng)調(diào)的是,從已經(jīng)開(kāi)展 AI+ 新藥研發(fā)的應(yīng)用實(shí)踐來(lái)看,AI 不是“靈丹妙藥”,不能在一夜之間提高臨床試驗(yàn)的效率 [29],當(dāng)前 AI 技術(shù)尚不能為提升新藥研發(fā)效率帶來(lái)革命性的突破。受生物系統(tǒng)內(nèi)在的復(fù)雜性和疾病異質(zhì)性特征的制約,AI 分析藥物在體內(nèi)活性的數(shù)據(jù)非常有限,計(jì)算機(jī)不能很好地做出決策 [30],導(dǎo)致準(zhǔn)確模擬疾病的發(fā)病機(jī)制難度大,使得 AI 技術(shù)在提升新藥的臨床試驗(yàn)成功率方面發(fā)揮的作用還非常有限。因此,未來(lái) AI 賦能新藥研發(fā)相關(guān)研究和應(yīng)用的進(jìn)一步深化,需要傳統(tǒng)醫(yī)藥研發(fā)基礎(chǔ)科學(xué)(生物化學(xué)、生物學(xué)、生物醫(yī)學(xué)等)和核心 AI 技術(shù)的深度結(jié)合,需要技術(shù)專(zhuān)家、生物學(xué)家、醫(yī)學(xué)家等聯(lián)合攻關(guān)。

著眼當(dāng)下,為了更好地發(fā)展 AI+ 新藥研發(fā),應(yīng)對(duì)其面臨的五大挑戰(zhàn),提升新藥研發(fā)的效率從而加速我國(guó)醫(yī)藥創(chuàng)新升級(jí),一是要突破新技術(shù)和新算法,引導(dǎo)技術(shù)創(chuàng)新以及 AI 技術(shù)在新藥研發(fā)各個(gè)環(huán)節(jié)的深入應(yīng)用;二是建立“AI+ 新藥研發(fā)”領(lǐng)域復(fù)合人才跨學(xué)科培養(yǎng)輸出機(jī)制,自主培養(yǎng)一批高學(xué)識(shí)、高能力的“AI+ 新藥研發(fā)”領(lǐng)域的科研人員、技術(shù)工作者和應(yīng)用開(kāi)拓者,加快形成滿(mǎn)足行業(yè)發(fā)展需求的人才網(wǎng)絡(luò);三是集中大數(shù)據(jù)力量助力攻關(guān)重大疾病致病機(jī)制、藥物靶點(diǎn)/表型/分子分型研究,完善醫(yī)藥研發(fā)數(shù)據(jù)庫(kù),為拓展 AI 在新藥研發(fā)領(lǐng)域的應(yīng)用構(gòu)建高質(zhì)量數(shù)據(jù)支撐體系;四是強(qiáng)化創(chuàng)制體制設(shè)計(jì),建立支撐保障措施包括及時(shí)建立監(jiān)管機(jī)制,明晰產(chǎn)權(quán)結(jié)構(gòu),注重保護(hù)新藥研發(fā)中數(shù)據(jù)資產(chǎn)安全和知識(shí)產(chǎn)權(quán)。

參考資料:

Terry M. IQVIA report: biopharma R&D investment has increased32% over last 5 years[EB/OL].(2019-04-23)[2021-06-24].https://www.biospace.com/article/report-biopharma-focuses-on-oncologyrare-diseases-and-orphan-drugs/.

Fleming N. How artificial intelligence is changing drugdiscovery[EB/OL].(2018-05-10)[2021-06-05]. https://www.nature.com/articles/d41586-018-05267-x.

Taylor P. Pharma is ‘getting lower returns on R&D’[EB/OL].(2017-12-15)[2021-05-21]. http://www.pmlive.com/pharma_news/pharma_is_getting_lower_returns_on_r_and_d_1214594.

劉伯炎 , 王群 , 徐俐穎 , 等 . 人工智能技術(shù)在醫(yī)藥研發(fā)中的應(yīng)用[J]. 中國(guó)新藥雜志 , 2020, 29(14): 1979–1986.

? Wong C H, Siah K W, Lo A W. Estimation of clinical trial successrates and related parameters[J]. Biostatistics, 2019, 20(2): 273–286.

陸濤 . 人工智能在醫(yī)藥領(lǐng)域的應(yīng)用 [J]. 藥學(xué)進(jìn)展 , 2019, 44(1):1–3.

梁禮 , 鄧成龍 , 張艷敏 , 等 . 人工智能在藥物發(fā)現(xiàn)中的應(yīng)用與挑戰(zhàn) [J]. 藥學(xué)進(jìn)展 , 2020, 44(1): 18–27.

Mcculloch W S, Pitts W. A logical calculus of the ideas immanent innervous activity[J]. Bull Math Biophys, 1943, 5(4): 115–133.

Lu H M, Li Y J, Uemura T, et al. FDCNet: filtering deepconvolutional network for marine organism classification[J].Multimed Tools Appl, 2017, 77(17): 21847–21860.

Yang X, Wang Y F, Byrne R, et al. Concepts of artificial intelligencefor computer-assisted drug discovery[J]. Chem Rev, 2019, 119(18):10520–10594.

Chen H M, Engkvist O, Wang Y H, et al. The rise of deep learningin drug discovery[J]. Drug Discov Today, 2018, 23(6): 1241–1250.

Lavecchia A. Deep learning in drug discovery: opportunities,challenges and future prospects[J]. Drug Discov Today, 2019,24(10): 2017–2032.

張建楠 , 李瑩瑩 , 張燁琳 . AI 驅(qū)動(dòng)新藥研發(fā)深度發(fā)展 [EB/OL].(2021-01-27)[2021-06-28]. http://www.imit.org.cn/index.php?g=&m=article&a=index&id=356&cid=11.

搜狐網(wǎng) . 正大天晴與阿里云合作,AI 制藥提高化合物篩選準(zhǔn)確率 20% 新藥研發(fā)困難重重?正大天晴與阿里云合作用 AI 尋找解決辦法 [EB/OL]. (2018-09-04)[2021-06-30]. https://www.sohu.com/a/251826274_114877.

Willems H, De Cesco S, Svensson F. Computational chemistryon a budget: supporting drug discovery with limited resources:miniperspective[J].J Med Chem, 2020, 63(18): 10158–10169.

Chan H, Shan H, Dahoun T, et al. Advancing drug discovery viaartificial intelligence[J]. Trends Pharmacol Sci, 2019, 40(8): 592–604.

Zhavoronkov A. Artificial intelligence for drug discovery, biomarkerdevelopment, and generation of novel chemistry[J]. Mol Pharm,2018, 15(10): 4311–4313.

Hong R S, Mattei A, Sheikh A Y, et al. Novel physics-basedensemble modeling approach that utilizes 3D molecular conformationand packing to access aqueous thermodynamic solubility: a casestudy of orally available bromodomain and extraterminal domaininhibitor lead optimization series[J]. J Chem Inf Model, 2021, 61(3):1412–1426.

Lee P K. Shortcut strategy for screening compounds with clinicalpotentials for drug development[EB/OL].(2018-11-03)[2021-06-26].https://www.eurekalert.org/pub_releases/2018-12/cuoh-ssf120318.php.

Lin X, Duan X, Jacobs C, et al. High-throughput brain activitymapping and machine learning as a foundation for systemsneuropharmacology[J]. Nat Commun, 2018, 9(1): 5142. DOI:10.1038/s41573-019-0024-5.

Vamathevan J, Clark D, Czodrowski P, et al. Applications ofmachine learning in drug discovery and development[J]. Nat RevDrug Discov, 2019(18): 463–477.

Bender A, Cortés-Ciriano I. Artificial intelligence in drug discovery:what is realistic, what are illusions? Part 1: Ways to make an impact,and why we are not there yet[J]. Drug Discov Today, 2021,26(2):511–524.

Xiao Q, Wang L, Supekar S, et al. Structure of human steroid5α-reductase 2 with the anti-androgen drug finasteride[J]. NatCommun, 2020, 11(1): 5430. DOI:10.1038/s41467-020-19249-z.

Liu R, Wei L, Zhang P. A deep learning framework for drugrepurposing via emulating clinical trials on real-world patientdata[J]. Nat Mach Intell, 2021(3): 68–75.

Ulenaers J. The impact of artificial intelligence on the right to a fairtrial: towards a robot judge?[J]. Asian J Law Econ, 2020, 11(2):20200008. DOI:10.1515/ajle-2020-0008.

朱壽華 , 凌澤農(nóng) , 周金花 . 人工智能技術(shù)在醫(yī)療健康領(lǐng)域的應(yīng)用 [J]. 電子技術(shù)與軟件工程 , 2020, 171(1): 18–19.

央廣網(wǎng) . 中國(guó)人工智能人才缺口超 500 萬(wàn)供求比例僅為 1:10[EB/OL]. (2017-07-14)[2021-06-30]. https://baijiahao.baidu.com/s?id=1572854410914751&wfr=spider&for=pc.

中國(guó)日?qǐng)?bào)網(wǎng) . 法律該賦予人工智能什么地位 ? 實(shí)現(xiàn)與人的智能疊 拼 [EB/OL]. (2018-01-23)[2021-06-30]. https://baijiahao.baidu.com/s?id=1590352506664610651&wfr=spider&for=pc.

Bhatt A. Artificial intelligence in managing clinical trial design andconduct: man and machine still on the learning curve?[J]. PerspectClin Res, 2021, 12(1): 1. DOI:10.4103/picr.PICR_312_20.

Jiménez-Luna J, Grisoni F, Weskamp N, et al. Artificial intelligencein drug discovery: recent advances and future perspectives[EB/OL].(2021-04-02)[2021-06-28]. http://doi-org-443.group10-s.ccame.net/10.1080/17460441.2021.1909567.

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)