深陷AI“迷信”里的醫(yī)療保健烏托邦
2017年12月,一個星期五的晚上,倫敦醫(yī)療應用開發(fā)商Babylon Health的創(chuàng)始人Ali Parsa,與自家的醫(yī)生坐下來進行了一次交流。這位出生于伊朗的前銀行家,依靠該公司的高評分應用,為Babylon融資了8500萬美元。這款應用可以讓英國患者快速與醫(yī)生進行視頻會診。在英國,國營醫(yī)療保健為每個公民提供了高質(zhì)量的醫(yī)療服務,但是卻要耗費很長時間等候門診。這款應用的出現(xiàn)改變了這一局面。
現(xiàn)在,Parsa希望通過添加一款人工智能聊天機器人,來進一步提高效率和降低成本。Parsa承諾,該聊天機器人可以在沒有人類互動的情況下,就常見疾病提供診斷建議。Babylon的應用用戶將于12月享受到這款全新機器人的服務。在未來某個時候,英國國家健康服務機構(gòu)(NHS)的患者也將享受到相應的服務。但問題是,根據(jù)這些醫(yī)生的交流,機器人給出的建議經(jīng)常是錯誤的。
據(jù)一名現(xiàn)任和前任工作人員稱,為了證明他們的觀點,醫(yī)生們花了大約一天時間,主動進行了一次審計。據(jù)一位知情人士稱,他們發(fā)現(xiàn),聊天機器人給出的100個最常見的結(jié)果中,約有10%至15%的結(jié)果,錯過了更嚴重疾病的警告信號,或者完全就是錯誤的。這些臨床醫(yī)生周五直接向Parsa進行了匯報,希望推遲新的發(fā)布。他們提出了自己的理由,經(jīng)過一番談判,他同意推遲發(fā)布。
但是醫(yī)生們?nèi)匀桓械嚼_。對現(xiàn)任和前任Babylon工作人員以及外部醫(yī)生的采訪顯示,他們普遍擔心該公司匆忙部署了未經(jīng)仔細審查的軟件,并夸大了其有效性。
根據(jù)一位外部醫(yī)生展示的電子郵件,2018年4月,一家英國廣告監(jiān)管機構(gòu)要求Babylon刪除其網(wǎng)站上的一項聲明,該聲明宣稱其分流功能能夠100%的給出安全建議。該機構(gòu)同時援引了一項關于這一聲明的“獨立研究”。但是根據(jù)Babylon自己在2016年發(fā)表的研究論文,這項研究來自一次內(nèi)部測試,在測試中,它雇傭了專業(yè)演員扮成病人,并按照劇本進行流程。
在那次周五會議后的六個月,Parsa在倫敦皇家醫(yī)學院舉行了一場盛大的直播活動,宣布Babylon的新軟件——人工智能驅(qū)動的聊天機器人——已經(jīng)達到了“全球醫(yī)療第一”的水平。Babylon展示了機器人在醫(yī)學檢查中的得分高于人類醫(yī)生的平均得分,并聲稱人工智能已經(jīng)達到了人類醫(yī)生的“同等準確度”。當時,多家媒體報道了這一成就。
布朗大學生物醫(yī)藥信息學教授Hamish Fraser表示,這一聲明是有問題的。他在英國主要醫(yī)學雜志《柳葉刀》最近的一篇文章中反駁了Babylon的聲明。他指出,Babylon的軟件只回答了50個檢查問題中的15個,并被允許對每個問題給出三個答案!爱斸t(yī)生做這個測試時,你會得到一個正確的答案,”他說。Babylon表示,它沒有試圖證明人工智能比醫(yī)生更好,Parsa也退出了這篇文章的預定采訪。
人工智能還沒有發(fā)展到可以替代(甚至可靠地協(xié)助)人類醫(yī)生的程度,這一點可能不足為奇。而傲慢的科技企業(yè)家對他們的產(chǎn)品進行過高的宣傳,也并不是什么新現(xiàn)象。這一切都不太重要,但是Babylon與英國國家醫(yī)療服務機構(gòu)簽訂了兩份合同。英國國家醫(yī)療服務機構(gòu)是世界上最大的國有醫(yī)療系統(tǒng)之一。Babylon的GP At Hand應用向3.5萬名NHS患者提供了視頻通話支持,并可以讓其訪問分流聊天機器人,以獲得是否就醫(yī)的建議。NHS還鼓勵200萬公民使用NHS 111: Online——一款由Babylon開發(fā)的應用,主要用來代替NHS咨詢熱線。工作人員表示,NHS還沒有使用Babylon的診斷建議聊天機器人,但該公司已經(jīng)討論過將這一功能引入NHS應用中。
NHS的動機很明確,也很簡單:它既想省錢,也想為病人帶來更好的健康結(jié)果。2020年,英國將在國家醫(yī)療系統(tǒng)上花費近2000億美元,相當于GDP的7%。自1950年以來,這一占比已經(jīng)翻了一番,因此英國迫切需要找到一種方法來控制成本,同時仍能提供被視為英國社會契約核心的福利。
減少急診室就診似乎是很合邏輯的,因為每次就診平均花費NHS 200美元。在過去的一年里,NHS為此總共花費了40億美元,而由于至少有150萬英國人在不需要的時候也會去急診室,導致候診時間不斷增加。如果Babylon的聊天機器人效果很好,將會對節(jié)省成本有很大的幫助。
但是,人們質(zhì)疑該軟件的有效程度。Babylon的一名工作人員稱,早期和當前版本的聊天機器人,在大約30%的情況下會建議用戶去急診室;相比之下,撥打國家健康咨詢熱線111的人大約只有20%。不清楚有多少病人接受了聊天機器人的建議,Babylon表示自己并沒有跟蹤這些數(shù)據(jù)。
即使在診斷建議聊天機器人最終被修復,并于2018年1月發(fā)布給Babylon私人應用用戶之后,一些Babylon醫(yī)生仍然對他們沒有看到開發(fā)過程中更嚴格的改革而感到擔憂。而在公司外部,發(fā)現(xiàn)的問題數(shù)量也越來越多。6月,一名正在Babylon應用上測試新診斷聊天機器人的英國醫(yī)生發(fā)現(xiàn)了一個錯誤:它錯過了一個肺栓塞的癥狀。他在Twitter上發(fā)布了一段視頻,并向醫(yī)療監(jiān)管機構(gòu)MHRA進行了投訴。根據(jù)該醫(yī)生分享的電子郵件和私人Twitter消息,這至少是他在過去一年半中第三次投訴聊天機器人軟件。據(jù)Babylon內(nèi)部消息來源稱,被MHRA記錄為事故的一些錯誤,直到2018年11月,仍然存在于內(nèi)置聊天機器人的健康應用上。MHRA以保密為由不予置評。
Babylon表示,MHRA要求其調(diào)查這些投訴,但“隨后沒有基于安全相關的理由展開正式調(diào)查”。當被問及MHRA記錄的錯誤時,Babylon堅持認為“任何臨床概率分析都不可能總是正確的”,并且“即使非常有經(jīng)驗的醫(yī)生有時也會錯誤地診斷”。
而在這一切正在發(fā)生的過程中,Babylon成功地將自己推銷為醫(yī)療系統(tǒng)過度擴張的數(shù)字藥膏。該公司最大的粉絲之一是英國衛(wèi)生部長Matt Hancock,他最近在一份由Babylon贊助的報紙副刊中宣稱,他“因使用這款GP at Hand應用而出名”。
Babylon應用的海報經(jīng)常出現(xiàn)在倫敦地鐵上。據(jù)Parsa稱,該公司正在預訂數(shù)千萬美元的收入,包括與NHS簽訂的GP at Hand合同(預計290萬美元)和NHS 111合作伙伴的收入。NHS England的發(fā)言人和Hancock沒有回應置評請求。
一名前工作人員表示,Babylon軟件的最大缺陷之一是缺乏真實的臨床評估和跟蹤。使用聊天機器人的人真的去過急診室嗎?如果他們看了醫(yī)生,那診斷是什么?一名前員工表示:“目前還沒有找到能夠提供答案的系統(tǒng)!盉abylon表示,其GP at Hand應用在用戶使用聊天機器人24小時后會向他們發(fā)送信息。據(jù)一名用戶稱,應用會詢問更多癥狀。
軟件是通過迭代開發(fā)的。開發(fā)人員構(gòu)建了一個應用并將其發(fā)布,在不同的實時用戶群體上測試它,并在前進的過程中不斷重復。這種硅谷心態(tài),曾經(jīng)被馬克·扎克伯格總結(jié)為“行動迅速,打破現(xiàn)狀”。但是開發(fā)新藥或醫(yī)療器械需要一種更慎重的方法,因為患者的生命是懸而未決的。Babylon尚未在同行評審的醫(yī)學雜志上發(fā)表任何研究成果,而這一過程往往也是需要時間的。
該公司的首席醫(yī)療官Mobasher Butt堅持認為,在市場上部署之前,Babylon“經(jīng)歷了臨床醫(yī)生對產(chǎn)品許多許多輪的嚴格測試!痹摴境姓J它沒有進行醫(yī)學研究,并稱未來進行醫(yī)院研究時,它會在醫(yī)學雜志上進行發(fā)表。
對Babylon人工智能的擔憂指出了醫(yī)療系統(tǒng)與科技初創(chuàng)公司合作時可能會出現(xiàn)的困難。雖然Babylon已經(jīng)將自己定位為一家醫(yī)療保健公司,但它的運營似乎更像硅谷的初創(chuàng)公司。一名工作人員說,“公司的重點是快速構(gòu)建并推出”,并補充說,Parsa喜歡和員工談論“逃逸速度”。短語“快速構(gòu)建”出現(xiàn)在至少一名Babylon工作人員的電子郵件簽名下。該公司內(nèi)部的醫(yī)生甚至在解決安全問題時也很難讓人們聽到他們的聲音,而現(xiàn)任和前任工作人員表示,數(shù)據(jù)科學家被視為搖滾明星,不過他們表示,過去12個月,情況已經(jīng)開始好轉(zhuǎn)。
Babylon稱這些斷言為“誹謗”,并指出定期審查的舉報政策和專用電子郵件地址是其“安全第一文化”的關鍵。它宣稱,員工“有義務將任何問題正式提交給當局”。一名現(xiàn)任和前任員工表示,他們不知道有舉報電子郵件系統(tǒng)。
盡管一些醫(yī)生很謹慎,但Parsa還是因其堅韌不拔的精神和宏偉的愿景而受到倫敦科技界的推崇,認為他將“把方便和負擔得起的醫(yī)療服務帶給地球上的每一個人”。對許多人來說,這是一種令人耳目一新的企業(yè)家精神,在謙遜的英國你并不總是能找到這種精神。Parsa的故事令人鼓舞,他出生在伊朗的Ali Parsadoust,父母是中產(chǎn)階級,17歲時為了逃避革命,作為難民來到英國。他自學英語,然后進入了高中和倫敦最負盛名的大學,在那里他發(fā)表了工程物理學博士論文,并積極參與到學生政治中。雖然他的職業(yè)生涯建立在投資銀行業(yè),但他的心始終關注著社會正義。
將他的社會烏托邦本能與商業(yè)結(jié)合起來并不總是奏效。2003年,Parsa通過共同創(chuàng)建一個名為Circle Health的“社會企業(yè)”,進入了醫(yī)療保健領域。然后在2011年,Parsa通過獲得一份合同,成為第一家接管國有醫(yī)院的私營公司,而創(chuàng)造了歷史。這家醫(yī)院是位于劍橋郡的Hinchingbrooke Hospital。Circle做出了削減成本的崇高承諾,包括在10年交易中,可以為NHS節(jié)省超過4.95億美元。Parsa于2012年退出,當時該公司仍處于債務之中。2015年,Circle保釋了這一合同。審計人員表示,他的出價“過于樂觀”。Parsa離開Circle一年后,創(chuàng)辦了Babylon,并最終再次與NHS簽訂了重要合同。
為了鞏固這種關系,并為擴大到更多患者奠定技術基礎,Parsa正在雇傭軟件工程師。它最近承諾投資1億美元進一步開發(fā)他的人工智能。
但是,為醫(yī)療保健構(gòu)建人工智能可能需要進一步反思Babylon技術的設計方式。簡而言之,它的診斷引擎是基于一套復雜的規(guī)則。這些規(guī)則由臨床醫(yī)生決定,并在電腦中輸入一系列癥狀的概率。隨著規(guī)則數(shù)量的增加,軟件做出決策的路徑變得更加復雜和難以改變。那么,你如何讓這樣的聊天機器人變得更聰明呢?一種方法是提高其語言能力。另一個是改進支撐它的診斷引擎!叭绻鸅abylon擁有醫(yī)療記錄,他們可能會更準確,”Action.AI首席執(zhí)行官John Taylor表示。Action.AI是一家倫敦初創(chuàng)公司,幫助公司構(gòu)建聊天機器人。
為了更好地診斷,我們需要訓練軟件深入了解反饋回路:在一個人描述自己的癥狀,然后去看醫(yī)生,接受x光檢查,并有可能接受進一步治療后,會發(fā)生什么?Babylon表示,它可以訪問健康改善網(wǎng)絡研究數(shù)據(jù)庫,該數(shù)據(jù)庫包含不可識別的患者數(shù)字記錄,但目前尚未向監(jiān)管機構(gòu)請求訪問醫(yī)療記錄。
對于Babylon來說,要實現(xiàn)用更智能的技術提高醫(yī)療保健提供商效率的愿景,它可能需要在更多的患者記錄上訓練算法。為此,它需要繼續(xù)贏得監(jiān)管者和醫(yī)學界的信任。
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
圖片新聞
最新活動更多
-
2 石藥集團的陽謀
-
10 科源制藥并購“大戲”深解
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市