醫(yī)聯(lián)MedGPT丨“診斷”直播測評!治療方案與真人醫(yī)生96%一致
據(jù)消息,醫(yī)聯(lián)研發(fā)的國內(nèi)首個(gè)醫(yī)療大模型:MedGPT,已經(jīng)在“接診”患者了。
【資料圖】
不可否認(rèn)的是,MedGPT還有些問題需要調(diào)整,幾位專家指出它會出現(xiàn)偶爾過度給出治療建議、重復(fù)推薦檢查項(xiàng)目、某些概念表述不準(zhǔn)確,以及無法實(shí)現(xiàn)查體等局限——要想MedGPT更加可用,這些意見一定程度比正面評價(jià)還要重要。
但總的來說,首個(gè)醫(yī)療大模型的公開首秀的結(jié)果還算不錯。
總結(jié)下來,首先是大模型的基本能力都有,語義理解、多輪對話、多模態(tài)識別等,還能像OpenAI那樣通過插件商店鏈接到各種行業(yè)應(yīng)用。
還有通用大模型被廣為詬病的對齊和準(zhǔn)確性問題,MedGPT整個(gè)流程結(jié)果也不輸真人醫(yī)生。
再從行業(yè)維度來看,確實(shí)能真正從醫(yī)學(xué)角度為醫(yī)生提供有效幫助,提升患者疾病管理效率。
此次真實(shí)測試過程中可以看到,它能基于有效問診以及醫(yī)學(xué)檢查數(shù)據(jù),MedGPT得以進(jìn)行準(zhǔn)確的疾病診斷,并為患者設(shè)計(jì)疾病治療方案。
甚至在診后,MedGPT還會在患者收到藥品后進(jìn)行用藥指導(dǎo)與管理、智能隨訪復(fù)診、康復(fù)指導(dǎo)等智能化疾病管理工作。
目前它基本覆蓋ICD10的60%疾病病種,這意味著常見病癥都能Hold住還能7*24小時(shí)不間斷干活,一旦規(guī)?;涞剌o助醫(yī)生診療,能大大提升醫(yī)療效率,對于分級診療,醫(yī)療資源普惠,都能夠發(fā)揮一定作用。
首個(gè)醫(yī)療大模型如何煉成?
醫(yī)療向來是AI落地中專業(yè)性最強(qiáng)、壁壘性最高,對安全要求最高的領(lǐng)域之一。
以往用戶們會習(xí)慣性使用信息搜索來幫助自己做一些初步的疾病判斷,但信息魚龍混雜,普通用戶缺乏專業(yè)知識無法進(jìn)行有效篩選,最終導(dǎo)致往往會收效甚微。
但又因?yàn)檫@個(gè)領(lǐng)域牽涉到每個(gè)人的生命健康,市場需求和社會價(jià)值一直很大。
因此自ChatGPT誕生以來,關(guān)于何時(shí)能在醫(yī)療領(lǐng)域“上崗”發(fā)揮作用,就備受產(chǎn)學(xué)研各界專家的關(guān)注。
誠如“弱智吧”成為檢驗(yàn)各個(gè)通用大模型能力的Benchmark一樣,各個(gè)大模型的醫(yī)療能力也在美國執(zhí)業(yè)醫(yī)師資格考試USMLE中摩拳擦掌。
早些時(shí)候,?哈佛大學(xué)教授曾親自下場測試ChatGPT輔助診斷的表現(xiàn)。
結(jié)果顯示,ChatGPT在45個(gè)案例中39個(gè)診斷正確,并為30個(gè)案例提供適當(dāng)?shù)姆衷\建議。這樣的表現(xiàn)已經(jīng)超過現(xiàn)有機(jī)器診斷水平,接近醫(yī)生。
另一個(gè)代表,谷歌健康團(tuán)隊(duì)打造的Med-PaLM 2,它能回答各種醫(yī)學(xué)問題,據(jù)稱是首個(gè)在美國醫(yī)療執(zhí)照考試中達(dá)到專家水平的大語言模型。
標(biāo)簽: