新的人工智能系统提前数年预测1000种疾病的风险

CN
Decrypt
關注
4 小時前

研究人员构建了一种人工智能系统,能够在症状出现前最多20年预测您患上超过1,000种疾病的风险,相关研究本周发表在《自然》杂志上。

该模型名为 Delphi-2M,在短期健康预测中达到了76%的准确率,即使在预测十年后的情况时,准确率仍保持在70%。

它在评估整个范围的人类疾病风险时,超越了现有的单一疾病风险计算器。

“人类疾病在年龄增长过程中的进展特征是健康期、急性疾病发作和慢性虚弱的阶段,通常表现为共病的聚集,”研究人员写道。“很少有算法能够预测人类疾病的全谱,这些疾病在国际疾病分类第十版(ICD-10)编码系统的顶层识别出超过1,000种诊断。”

该系统从402,799名英国生物库参与者那里学习了这些模式,然后在190万份丹麦健康记录上证明了其能力,而无需任何额外的训练。

在您开始幻想自己的医疗预测器之前,您能自己尝试Delphi-2M吗?并不完全可以。

经过训练的模型及其权重被锁定在 英国生物库 的受控访问程序后——这意味着仅限研究人员。用于训练您自己版本的代码库在 GitHub 上,采用MIT许可证,因此从技术上讲,您可以构建自己的模型,但您需要访问大量医疗数据集才能使其工作。

目前,这仍然是一个研究工具,而不是消费者应用。

幕后揭秘

该技术通过将医疗历史视为序列来工作——就像ChatGPT处理文本一样。

每个诊断记录了首次发生的年龄,成为一个标记。模型读取这种医疗“语言”,并预测接下来会发生什么。

通过适当的信息和训练,您可以预测下一个标记(在这种情况下,下一个疾病)以及生成该“标记”的预计时间(如果最可能的事件发生,您多久会生病)。

对于一位60岁、患有糖尿病和高血压的患者,Delphi-2M可能预测胰腺癌的风险增加19倍。如果在该病史中增加胰腺癌的诊断,模型计算出的死亡风险几乎增加了十万倍。

Delphi-2M背后的变换器架构将每个人的健康历程表示为诊断代码、生活方式因素(如吸烟和BMI)以及人口统计数据的时间线。“无事件”填充标记填补医疗访问之间的空白,教会模型简单的时间流逝会改变基线风险。

这也类似于正常的LLM如何理解文本,即使它们错过了一些单词甚至句子。

在与已建立的临床工具进行测试时,Delphi-2M的表现与它们相匹配或超越。对于心血管疾病预测,它的AUC为0.70,而AutoPrognosis为0.69,QRisk3为0.71。对于痴呆症,它的AUC为0.81,与UKBDRS相同。关键区别在于:这些工具预测单一疾病,而Delphi-2M则同时评估所有情况。

除了个体预测外,该系统还生成整个合成健康轨迹。

从60岁数据开始,它可以模拟数千种可能的健康未来,产生在统计范围内准确的人口级疾病负担估计。一个合成数据集训练了一个次级Delphi模型,达到了74%的准确率——仅比原始模型低三个百分点。

该模型揭示了疾病如何随着时间相互影响。癌症的死亡风险增加具有数年的“半衰期”,而脓毒症的影响则急剧下降,几个月内恢复到接近基线水平。心理健康状况显示出持续的聚集效应,一种诊断在几年后强烈预测该类别中的其他诊断。

局限性

该系统确实存在局限性。其20年的预测一般准确率降至约60-70%,但这取决于它尝试分析和预测的疾病类型和条件。

“对于97%的诊断,AUC大于0.5,表明绝大多数遵循至少部分可预测的模式,”研究指出,并补充说“Delphi-2M的平均AUC值在10年后从0.76降至0.70”,并且“在采样的第一年,平均有17%的疾病标记被正确预测,而20年后这一比例降至不到14%。”

换句话说,这个模型在相关场景下的预测能力相当不错,但20年内可能会发生很多变化,因此它并不是诺查丹玛斯。

罕见疾病和高度环境相关的条件证明更难预测。英国生物库的人口统计偏差——主要是白人、受过教育、相对健康的志愿者——引入了研究人员承认需要解决的偏见。

丹麦的验证揭示了另一个局限性:Delphi-2M学习了一些特定于英国的数据收集特征。主要在医院环境中记录的疾病似乎被人为夸大,与丹麦人登记的数据相矛盾。

该模型预测脓毒症的发生率是正常水平的八倍,部分原因是93%的英国生物库脓毒症诊断来自医院记录。

研究人员使用修改过的GPT-2架构训练Delphi-2M,参数为220万——与现代语言模型相比,这个数字很小,但足以用于医疗预测。关键修改包括连续年龄编码而不是离散位置标记,以及预测事件发生时间的指数等待时间模型,而不仅仅是预测会发生什么。

训练数据中的每个健康轨迹平均包含18个疾病标记,涵盖从出生到80岁的时间段。性别、BMI类别、吸烟状态和酒精消费提供了背景信息。

该模型学会了自动权衡这些因素,发现肥胖增加了糖尿病风险,而吸烟提高了癌症概率——这些关系医学早已确立,但在没有明确编程的情况下出现。它确实是一个针对健康状况的LLM。

对于临床部署,仍然存在几个障碍。

该模型需要在更具多样性的人群中进行验证——例如,来自尼日利亚、中国和美国的人们的生活方式和习惯可能非常不同,这使得模型的准确性降低。

此外,使用详细健康历史的隐私问题需要谨慎处理。与现有医疗系统的整合面临技术和监管挑战。

但潜在的应用范围从识别不符合年龄标准的筛查候选人到建模人口健康干预措施。保险公司、制药公司和公共卫生机构可能会对此产生明显的兴趣。

Delphi-2M加入了一个不断增长的基于变换器的医疗模型家族。一些例子包括哈佛的 PDGrapher 工具,用于预测可能逆转帕金森病或阿尔茨海默病的基因-药物组合,专门 训练于蛋白质连接 的LLM,谷歌的AlphaGenome模型 训练于DNA对, 以及其他模型。

Delphi-2M之所以如此有趣和与众不同,是因为其广泛的作用范围、涵盖的疾病种类之广、长远的预测视野,以及生成现实合成数据的能力,这些数据在保护个人隐私的同时保持统计关系。

换句话说:“我还有多久?”可能很快不再是一个修辞性问题,而是一个可预测的数据点。

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

分享至:
APP下載

X

Telegram

Facebook

Reddit

複製鏈接