团队主持人胡勇教授以通讯作者身份(暨南大学为第一单位)在Nature Communications 发表题为“Cross site transportability of an explainable AI model for AKI prediction”的原创性论文(2020, 11(1):5668)。Nature Communications是发表各个领域有重要意义和突破性进展的著名国际综合期刊,最新影响因子为12.121。据目前发表情况,这是在Nature、Science及其子期级别发表的全球第1篇AI迁移学习+医疗预测研究成果,迁移学习是第三代AI的发展核心技术。
该项研究历时3年,项目完全用AI算法和大数据进行科学发现。研究围绕住院患者的急性肾损伤(AKI)发病风险AI预测模型的透明度和可移植性展开研究。AI模型的临床可解释性和可移植性是影响其临床应用的关键问题。Google团队的Tomasev等人基于深度学习技术应用于AKI预测得到了非常高的性能(Nature,2019; 572:116-119),然而他们的模型缺乏对其他中心的可移植性,因此不能应用于更广泛的人群。针对此问题,团队基于跨数据平台研究AI模型可迁移性,整合了上万个数据变量用于预测患者在住院期间的AKI发病风险。大数据实验表明,该模型具有很好的性能,尤其在预测中度至重度AKI方面具有竞争优势。研究通过6中心的数据评估模型的可移植性,证明由于跨人群的异质性,模型应用在不同医院时预测性能会有不同程度的降低,而且无论在原始医院训练的AI模型有多么准确,在目标医院的效果仍然是未知的。为此,团队研究提出了评估AI模型可移植性并确定模型适应性变化来源的新方法,在不需要公开私有数据的情况下,可对移植模型的有效性进行推断。该方法为医院是否采用外部AI模型提供了可计量尺度,加速外部AI模型的迁移和推广能力。
大数据团队在新一代人工智能方面有超过10年的积累,在因果学习、迁移学习和增强学习、智能学习与行动决策领域有深入研究,形成团队自主创新的新一代人工智能算法体系。本研究是基于新一代人工智能技术积累与医疗领域大数据关键问题相结合的跨领域大科学大交叉研究。团队的愿景是“做正确事,成为AI赋能领先者”。
本研究得到了国家自然科学基金重大研究计划重点支持项目、广东省科技计划重大科技专项、广东省大数据精准健康工程技术研究中心等项目的支持。
论文链接:https://www.nature.com/articles/s41467-020-19551-w