AI大戰(zhàn)10位華西醫(yī)院醫(yī)生

瞿依賢2023-07-03 09:36

經(jīng)濟(jì)觀察網(wǎng) 記者 瞿依賢 “您好,麻煩您告訴我您的年齡及性別,以及哪里不舒服?”當(dāng)真人醫(yī)生和AI醫(yī)生以同樣的問題開始問診,最后的診療結(jié)果、治療方案會一致嗎?

6月30日,國內(nèi)首次AI醫(yī)生與真人醫(yī)生一致性評測完成。這場PK發(fā)生在成都高新海爾森醫(yī)院,AI醫(yī)生為互聯(lián)網(wǎng)醫(yī)療公司醫(yī)聯(lián)推出的MedGPT,真人醫(yī)生是四川大學(xué)華西醫(yī)院的10位醫(yī)生,包括副主任醫(yī)師和主治醫(yī)師,涉及科室包括骨科、內(nèi)分泌代謝科、心內(nèi)科、腎內(nèi)科、老年呼吸科、消化科和泌尿外科。參與這場義診評測的患者共120多位。

問診過程中,真人醫(yī)生和AI醫(yī)生都沒有與患者直接接觸,患者與醫(yī)生助理接觸,醫(yī)生助理通過電腦輸入文字分別與真人醫(yī)生和AI醫(yī)生聯(lián)系,真人醫(yī)生和AI醫(yī)生的問題也經(jīng)由醫(yī)生助理傳遞給患者。

引導(dǎo)患者說出完整病情、收集足夠多決策因子后,真人醫(yī)生與AI醫(yī)生為患者開具檢查單或診斷,患者直接在成都高新海爾森醫(yī)院完成檢查;獲得檢查結(jié)果后,患者再復(fù)診,并由AI醫(yī)生及真人醫(yī)生提供臨床診斷及治療方案。

從開始問診到評審結(jié)果,整個過程在網(wǎng)上直播。

8個小時的問診結(jié)束后,形成有效病例91份,由北大人民醫(yī)院、中日友好醫(yī)院、阜外醫(yī)院和友誼醫(yī)院的7位專家教授進(jìn)行審核。7位專家教授的專業(yè)與前述科室對應(yīng),評價維度包括7個——問診準(zhǔn)確性、診斷準(zhǔn)確性、治療建議準(zhǔn)確性、輔助檢查方案準(zhǔn)確性、數(shù)據(jù)分析準(zhǔn)確性、提供可解釋信息、自然語言問診與交互。

最終,真人醫(yī)生綜合得分為7.5分,AI 醫(yī)生綜合得分為7.2分。AI醫(yī)生與真人醫(yī)生在比分結(jié)果上的一致性為96%。5位專家給真人醫(yī)生的打分都高于AI醫(yī)生,只有2位專家給AI醫(yī)生的打分高于真人醫(yī)生,一位差1.6,一位差0.1。

在專家評審環(huán)節(jié),北大人民醫(yī)院腎內(nèi)科主任醫(yī)師蔡美順表示,AI詢問比較全面,檢查也做得比較全面,不太容易漏診,但存在概念錯誤,比如AI醫(yī)生在其中一個病例的問診中說,“尿微量白蛋白在正常范圍內(nèi),腎臟的過濾功能是正常的”,這句話就不準(zhǔn)確。

蔡美順表示,這次一致性測評的樣本量還不夠豐富,總體來說,“人工智能對我們的工作有一些幫助”。

北大人民醫(yī)院骨科主任醫(yī)師薛峰對AI醫(yī)生的評價是:總體不錯,稍稍有些超出預(yù)期。MedGPT是一項非常有發(fā)展前景的技術(shù),應(yīng)該定位在常見病和基礎(chǔ)病的診斷上。

薛峰以147號病例舉例,這個病例的癥狀是膝蓋痛,AI醫(yī)生問診非常詳細(xì),“MedGPT不嫌累,話多,問題也很多”,會關(guān)注女性患者是否正在備孕、懷孕,而現(xiàn)實(shí)臨床工作中,骨科醫(yī)生較少會問這類問題,“有些細(xì)節(jié)問題漏掉之后很容易犯一些錯誤,一些癥狀漏掉之后也可能漏診”。對膝蓋痛這種常見疾病,很多時候醫(yī)生需要做一些科普,告知患者生活中需要注意的事項,AI醫(yī)生的詳細(xì)表達(dá)也會給患者更多信息。

薛峰還發(fā)現(xiàn)了一個“驚喜”:MedGPT根據(jù)患者腳底板疼痛判斷患者有可能出現(xiàn)神經(jīng)壓迫,真人醫(yī)生卻沒有想到這一點(diǎn)。

對于AI醫(yī)生的不足,薛峰認(rèn)為,AI醫(yī)生無法查體,但AI醫(yī)生也沒有關(guān)注查體結(jié)果,比如關(guān)節(jié)的活動度、有無壓痛點(diǎn)等等。此外,對檢查結(jié)果,AI醫(yī)生只會讀報告,報告怎么寫的就會認(rèn)為是什么樣的,但專科醫(yī)生要自己會看片子,“片子上的細(xì)微改變,報告有時候是體現(xiàn)不出來的”。

中日友好醫(yī)院心內(nèi)科主任醫(yī)師任景怡舉例,對早搏問題,AI醫(yī)生還關(guān)注了中度貧血,這在臨床上可能跟早搏密切相關(guān),但在實(shí)際工作中,專科醫(yī)生比較聚焦自己的專業(yè),可能會忽略相關(guān)癥狀。AI醫(yī)生的知識儲備比較全面。

多位專家認(rèn)為,AI醫(yī)生雖然問診詳細(xì),但是針對性不夠強(qiáng),系統(tǒng)性和邏輯性也不夠強(qiáng),還有待訓(xùn)練。

版權(quán)聲明:以上內(nèi)容為《經(jīng)濟(jì)觀察報》社原創(chuàng)作品,版權(quán)歸《經(jīng)濟(jì)觀察報》社所有。未經(jīng)《經(jīng)濟(jì)觀察報》社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,否則將依法追究相關(guān)行為主體的法律責(zé)任。版權(quán)合作請致電:【010-60910566-1260】。
大健康新聞部資深記者
關(guān)注醫(yī)療、醫(yī)藥、醫(yī)保、醫(yī)美等大健康領(lǐng)域的人物、故事、資本,微信號:yixian-er,郵箱:quyixian@eeo.com.cn。

熱新聞