→ birdy590: 以后会变成协助医师做出判断的好工具~ 119.14.42.10 12/14 17:58
推 widec: 当然主要就辅助医师,AI比人类更细心 1.165.15.7 12/14 18:00
→ widec: 只是相对的人类会变懒,AI出错时人类会忽视 1.165.15.7 12/14 18:00
→ xbearboy: 然后诊断出包看要甩锅那边了118.161.218.228 12/14 18:01
https://jamanetwork.com/journals/jamanetworkopen/fullarticle/2825395
Large Language Model Influence on Diagnostic Reasoning:
A Randomized Clinical Trial
今年10/28 史丹佛大学医学院发表的研究 下面提到的数字都是用中位数
找来24位住院医师(正式菜鸟,助理教授的概念),26位主治医师(封顶,教授概念)
行医年数是三年
使用过去已经确定病因的病例给他们诊断
1:1 随机分配给两组,一组使用传统的诊疗方式,另一组使用传统加上GPT4(付费plus)
传统诊断组的正确率是73.7% (IQR 63-84%),每个个案耗时565秒
传统诊断搭配GPT4的正确率是76.3% (IQR 66-87%),每个个案耗时519秒
这样使用AI辅助只增加 2.6%准确率??? 跟节省82秒
p只有0.2根本没差。吹那么大的AI 花那么多资源跟电费的成效只有这样?????
→ jovi8401: 人看错的机会比较大 61.64.6.63 12/14 18:55
你是对的
因为如果只有GPT的话,正确率是92% (IQR 82-97%)
跟只用传统方法的相比p=0.03 有显著差异
耗时....没看到 大概很伤人
因此史丹佛这篇的最后结论是 医师跟AI之间要发展新的信任关系才对
另外各大医院开始买H200,自己炼丹过去收集的病例成ai数据库不要太意外