納入環(huán)境數(shù)據(jù)能否提升CDS識別兒童哮喘風(fēng)險的能力?
導(dǎo)讀
此項研究目的是開發(fā)一種臨床決策支持(CDS)工具,來準(zhǔn)確識別出哮喘發(fā)作風(fēng)險最大的兒童。研究評估了臨床數(shù)據(jù),及空間和時間分辨的環(huán)境數(shù)據(jù)對哮喘惡化預(yù)測模型性能的價值貢獻(xiàn)。
哮喘是一種慢性氣道疾病,在美國影響超過500萬兒童,每年有超過一半的哮喘兒童會出現(xiàn)急性加重,其中有1/6會到急診室就診,每20人中有1人因哮喘加重需要住院。哮喘加重由多種臨床和環(huán)境因素引發(fā),但這些因素的相互作用及其對惡化風(fēng)險的影響尚不清楚。
近期發(fā)表在BMC Medical Informatics and Decision Making的一項研究,探索了開發(fā)臨床決策支持(CDS)工具的潛力,以識別在30天、60天和180天期間哮喘發(fā)作高風(fēng)險的兒童。評估了EHR中提取的臨床數(shù)據(jù),及空間和時間分辨的環(huán)境數(shù)據(jù)對兒童哮喘惡化預(yù)測模型性能的影響,并表明空間和時間數(shù)據(jù)沒有顯著提高模型性能。
01 臨床、空間、時間三方面數(shù)據(jù)關(guān)聯(lián)納入評估
該研究使用杜克大學(xué)衛(wèi)生系統(tǒng)(DUHS)的回顧性數(shù)據(jù)進(jìn)行的,DUHS包含一家三級保健醫(yī)院、兩家社區(qū)醫(yī)院以及初級保健網(wǎng)絡(luò)專業(yè)診所的EHR系統(tǒng),基于EHR的臨床研究數(shù)據(jù)集市(clinical Research Datamart)提取了階段時間的臨床數(shù)據(jù),確定了6395名(5-18歲)患有哮喘的兒童,根據(jù)相應(yīng)條件,最終5982名兒童納入研究分析。研究采用臨床數(shù)據(jù)與空間數(shù)據(jù)、時間數(shù)據(jù)的所有預(yù)測變量相關(guān)聯(lián),評估模型在預(yù)測兒童哮喘惡化方面的效用。以下為各方數(shù)據(jù)提取來源:
臨床數(shù)據(jù):從EHR中提取每個孩子的臨床和社會人口學(xué)信息,包括性別、年齡、種族、保險類型、合并癥、藥物處方。
空間數(shù)據(jù):根據(jù)患者地址得出社區(qū)層面的環(huán)境數(shù)據(jù)。通過每個孩子的居住地郵政編碼和美國社區(qū)調(diào)查的相關(guān)數(shù)據(jù),來計算醫(yī)療保健研究與質(zhì)量機(jī)構(gòu)(AHRQ)的社會經(jīng)濟(jì)地位指數(shù)(SES);使用ArcGIS計算數(shù)據(jù)集中每個地理編碼地址到道路的直線距離。
時間數(shù)據(jù):從美國環(huán)境信息中心下載了每日平均氣溫、總降水量等氣候數(shù)據(jù);從美國環(huán)境保護(hù)署下載了最大二氧化硫讀數(shù)等空氣質(zhì)量數(shù)據(jù);還從環(huán)境質(zhì)量部下載了花粉數(shù)據(jù);以及通過提取當(dāng)月每天進(jìn)行流感檢測的次數(shù)來計算季節(jié)性流感負(fù)擔(dān)等。
02 EHR中提取的臨床數(shù)據(jù)賦予模型預(yù)測性能更多價值
研究者使用LASSO、隨機(jī)森林和xgBoost構(gòu)建Person-Month預(yù)測模型,由5組不同的預(yù)測變量(所有預(yù)測變量、時間因素、臨床因素、空間因素、簡約模型)訓(xùn)練出15個不同模型,在三個不同的時間范圍(30天、90天和180天),預(yù)測兒童哮喘惡化的風(fēng)險。通過計算預(yù)測事件發(fā)生率和曲線下面積(AUC)來比較不同模型的性能。
研究結(jié)果顯示,所有模型的短期預(yù)測性能優(yōu)于長期,xgBoost模型的性能名義上優(yōu)于使用LASSO或隨機(jī)森林的模型。在評估時間、空間和臨床因素對模型預(yù)測惡化風(fēng)險的相對貢獻(xiàn)時發(fā)現(xiàn),無論采用何種建模方法,臨床因素賦予了模型預(yù)測性能更多價值,時間因素賦予的預(yù)測價值偏低,空間因素的預(yù)測價值最小。以隨機(jī)森林預(yù)測模型30天時間范圍內(nèi)的結(jié)果為例:基于臨床因素模型AUC=0.741,基于時間因素模型AUC=0.608,基于空間因素模型AUC=0.502,簡約模型AUC=0.672。
使用不同建模方法預(yù)測不同時間范圍和變量集的哮喘發(fā)作AUC
此外,研究構(gòu)建的方便患兒和其父母提供必要信息的簡約模型,用來評估不同類型數(shù)據(jù)對模型性能的貢獻(xiàn)。由于xgBoost模型的性能結(jié)果更優(yōu)越,文章重點介紹了xgBoost模型的結(jié)果。經(jīng)比較,簡約模型30天時間范圍AUC=0.664,使用所有數(shù)據(jù)元素的整體模型30天時間范圍AUC=0.761,基于臨床因素模型30天時間范圍AUC=0.742,故簡約模型在30天內(nèi)哮喘惡化的預(yù)測性能不如整體模型和基于臨床數(shù)據(jù)的模型。同時也發(fā)現(xiàn),臨床因素模型比起簡約模型,在所有時間范圍內(nèi)的預(yù)測性能都更具優(yōu)勢。
不同建模方法創(chuàng)建的整體模型、臨床模型和簡約模型的比較
03 180天范圍內(nèi)模型決策規(guī)則指標(biāo)性能更好
最后,研究使用了基于臨床數(shù)據(jù)的每個模型評估了決策規(guī)則的性能,以指導(dǎo)臨床決策支持。通過計算Precision-Recall曲線來評估決策的影響,并評估不同切點的敏感性和陽性預(yù)測值。這強(qiáng)調(diào)了在將風(fēng)險模型轉(zhuǎn)化為決策支持工具時考慮事件發(fā)生率的重要性。
對于30天的時間范圍,如果我們希望敏感度約為70%,使用xgBoost模型的PPV僅為2.9%;如果在180天的時間范圍,PPV則約為13.8%。同樣,如果在180天的時間范圍內(nèi)獲得一個約15%的PPV,那么敏感度為66.2%;而在30天時間范圍內(nèi)的敏感度則為1.5%。因而,基于敏感性和PPV的決策規(guī)則指標(biāo)在長期即180天時間范圍內(nèi)更好。
三個不同時間范圍內(nèi)的敏感性和陽性預(yù)測值之間的關(guān)系
最后,研究者表示無法考慮所有可能對哮喘惡化產(chǎn)生重大影響的變量,包括藥物補(bǔ)充數(shù)據(jù)、室內(nèi)環(huán)境和直接呼吸道病毒暴露。未來的研究將需要評估當(dāng)前研究中無法包含的變量的重要性,并評估本研究中開發(fā)的模型對來自其他衛(wèi)生系統(tǒng)的患者群體的可移植性。
原文標(biāo)題 : 納入環(huán)境數(shù)據(jù)能否提升CDS識別兒童哮喘風(fēng)險的能力?
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
圖片新聞
最新活動更多
-
11月19日立即報名>> 【線下論壇】華邦電子與恩智浦聯(lián)合技術(shù)論壇
-
11月25日立即預(yù)約>> 【上海線下】設(shè)計,易如反掌—Creo 11發(fā)布巡展
-
即日-12.26火熱報名中>> OFweek2024中國智造CIO在線峰會
-
精彩回顧立即查看>> 2024(第五屆)全球數(shù)字經(jīng)濟(jì)產(chǎn)業(yè)大會暨展覽會
-
精彩回顧立即查看>> 全數(shù)會2024中國人形機(jī)器人技術(shù)創(chuàng)新發(fā)展大會
-
精彩回顧立即查看>> OFweek 2024中國激光產(chǎn)業(yè)高質(zhì)量發(fā)展峰會
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市