[新闻] 医疗人工智能联合学习-CIO Taiwan

楼主: Toeic195 (多益195)   2021-10-22 08:37:42
医疗人工智能联合学习
2021-09-22
医疗人工智能联合学习
甫在《Nature Medicine》期刊上发表的研究结果表明,联合学习 (federated learning) 打造出可以普及到各医疗机构的强大人工智能 (AI) 模型,这项发现有望更进一步将联合学习用在能源、金融服务、制造及其它领域。
在一项由多间医院因新冠肺炎疫情而制定的计画中显示,任何产业的机构只要携手合作,都能发展出具预测能力的 AI 模型,为准确性和通用性树立新的标准。
由业界同侪评阅的顶尖医疗照护领域期刊《Nature Medicine》中所发表的内容,可以看到并肩合作展现能保护隐私的联合学习技术,是如何打造在各组织中均能顺畅运行的强大 AI 模型,即使是在受到机密资料或稀疏资料而绑手绑脚的产业中亦是如此。
该研究的第一作者 Ittai Dayan 博士表示:“通常在开发 AI 的过程中,使用一间医院的资料来建立算法时,在其它医院不见得能正常运作。但是,使用联合学习及其它地区客观的多模态资料来开发模型,便能将该模型普及到其它医院,以协助世界各地第一线的医生。”Ittai Dayan 博士在 Mass General Brigham 带领 AI 的发展,今年还成立医疗新创公司 Rhino Health。
医疗照护产业已正进行其它大规模的联合学习专案,包括五名研究人员的团队在评估乳房 X 光检查结果,以及制药业龙头拜耳公司正训练用于脾脏分割的 AI 模型。
除了医疗照护领域,联合学习还能帮助能源公司分析地震和井壁资料、协助金融公司改善诈欺侦测模型、协助自动驾驶车研究人员打造能够归纳不同国家驾驶行为的 AI。
联合学习:AI 需要一群人的付出
开发 AI 模型的公司和研究机构通常无法顺利取得各种可用资料,而饱受巧妇难为无米之炊的苦恼。这或许也代表,规模较小的组织或小众研究领域缺乏足够的资料来训练一个准确的预测模型。就算是大型资料集,也可能因为某一组织的患者或客户的人口统计资料、特定的资料纪录方法,甚至使用的科学设备品牌而产生偏误。
大多数组织必须和同行分享资料,才能蒐集到足够的资料以训练强大又能够普及的模型。但在许多情况下,资料隐私法规又使他们无法在共用的超级电脑或云端服务器上,直接分享患者病历或专有资料集等资料。而这就是联合学习可以派上用场的地方。
这项在《Nature Medicine》期刊上所发表名为 EXAM (为 EMR CXR AI Model 的缩写) 的全新研究项目,在 Mass General Brigham 与 NVIDIA 的领军下,汇集横跨五大洲的 20 间医院合力训练一个神经网络,能够预测出现新冠肺炎症状的患者在到达急诊科等护理点的 24 及 72 小时后,可能需要补充氧气的程度。这是迄今规模最大、最多元的临床联合学习研究项目之一。
集众人之力发挥 AI 的作用
联合学习让 EXAM 研究案的合作对象能够打造出一个 AI 模型,从每个参与医院所提供的胸部 X 光影像、患者的生命征象、人口统计资料及实验室数值中学习,又不会看到存放在各地私用服务器中的隐私资料。
每间医院使用本地端的 NVIDIA GPU 来训练同一套神经网络的副本。在训练的过程中,每间医院定期把更新完的模型权重发送到中央服务器,全球版本的神经网络在这里汇集更新后的模型,形成一个新的全球版本模型。这就像是分享试题的答案,但不透露任何用来找出答案的学习材料。
研究报告共同作者、美国国立卫生研究院介入肿瘤学中心所长、美国国立卫生研究院临床中心介入放射科主任 Brad Wood 博士表示:“EXAM 研究案的结果告诉我们,在医疗照护领域训练出高效能且可普及化的 AI 模型,又不用交换能辨识个人身分的隐私资料是可行的方式,这么一来便能保护资料隐私。这些发现的影响力远超出原先用于预测新冠肺炎的跨医院模型,也让我们了解到将联合学习用于一般领域大有可为之处。这让我们有了一个框架,能以更有效且合规的方式分享大数据,如果我们想要在医学领域发挥 AI 深度学习的潜力,或许就得这么做。”
全球版本的 EXAM 模型在与所有参与机构分享资料后,AI 模型的平均效能提高了16%。研究人员发现,与透过任何单一机构训练的模型相比,普及性平均提高了 38%。对于拥有较小型资料集的医院来说,效能提升尤其显著,如下图所示。
泰国朱拉隆功大学 (Chulalongkorn University) 与朱拉隆功国王纪念医院 (King Chulalongkorn Memorial Hospital) 医学 AI 中心联合主任 Sira Sriswasdi 表示:“联合学习让全球各地的研究人员能够合作朝着同一个目标前进,也就是发展一个能够从每个人的资料中学习且进行归纳的模型。有了 NVIDIA GPU 及 NVIDIA Clara 软件,参与这项研究的过程本身并不困难,却能产生影响深远的结果。”该医院是合作进行 EXAM 研究的 20 间医院之一。
医疗院所、新创公司从事更深入的 EXAM 研究活动
集合来自北美、南美、欧洲及亚洲等地合作单位之力,最初的 EXAM 研究只用了两周的训练时间,便能准确预测患者对氧气的需求,这项洞察可以协助医师判断患者需要照顾的程度。
从那时起,合作单位验证了这套 AI 模型在协助建立和训练该模型的地点以外的地方,有着不错的普及率且表现良好。麻塞诸塞州的另外三间医院 ── Cooley Dickinson Hospital、Martha’s Vineyard Hospital 及 Nantucket Cottage Hospital 也都对 EXAM 进行了测试,发现使用各院独立未公开的资料,这套神经网络也有着优秀的表现。
Cooley Dickinson Hospital 发现这套模型能预测患者到达急诊室后 24 小时内对呼吸器的需求,灵敏度为 95%,特异性超过 88%。英国剑桥的 Addenbrookes Hospital 也发现了类似的结果。
根据开发原始模型的 MGH & BWH 临床资料科学中心科学主任 Quanzheng Li 博士,Mass General Brigham 计画在近期部署 EXAM。Mass General Brigham 的医疗网络除了与 Lahey Hospital & Medical Center 及英国的 NIHR Cambridge Biomedical Research Center 合作,也和 NVIDIA Inception 计画成员的新创公司 Rhino Health 合作,运用 EXAM 进行前瞻性研究。
使用先前新冠肺炎患者的病历对初版 EXAM 模型进行回顾性训练,研究人员已经掌握有关患者最终需要多少氧气量的真实资料。这项前瞻性研究将 AI 模型用于新入院患者的资料,朝着在真实世界环境中进行部署的目标又迈出了一步。
剑桥大学医学院放射学系主任 Fiona Gilbert 说:“联合学习具有变革的力量,可以将 AI 创新带入临床工作流程。我们与 EXAM 持续合作,目的在于让这类全球性的合作可以重复进行且更有效率,这样便能满足临床医生处理棘手的健康问题,和日后出现传染病疫情时的需求。”
NVIDIA NGC 软件中心开放下载 EXAM 模型用于研究用途。刚开始使用联合学习的企业与研究机构可以运用 NVIDIA AI Enterprise 软件套件的 AI 工具和框架,该套件经最佳化调整且可运行于 NVIDIA 认证系统。
心得:
Federated learning最初是Google为了解决欧洲的用户数据授权法案General Data Protection Regulation(GDPR)所限制的病患数据外传问题。
隐私权看来已经不是障碍了。
作者: EGFR (认识念头的空性!)   2021-10-22 18:44:00
还是障碍阿, 只是透过分散在各医院机械学习后参数回传中央服务器绕过罢了。
作者: B0402090 (煞气a群仔)   2021-10-23 00:50:00
做正确标注这件事还是主要障碍
作者: catinbush (草猫小子)   2021-10-24 11:57:00

Links booklink

Contact Us: admin [ a t ] ucptt.com