人工智能预测未来胰腺癌
根据哈佛医学院和哥本哈根大学的研究人员与VA合作开展的一项新研究,人工智能工具仅使用患者的医疗记录就可以在诊断前长达三年成功识别出胰腺癌风险最高的人BostonHealthcareSystem、Dana-Farber癌症研究所和哈佛大学THChan公共卫生学院。
该研究结果于5月8日发表在《自然医学》杂志上,表明基于AI的人群筛查对于发现疾病风险较高的人群可能很有价值,并且可以加快对经常在治疗效果较差的晚期发现的疾病进行诊断研究人员说,结果令人沮丧。胰腺癌是世界上最致命的癌症之一,其死亡人数预计还会增加。
目前,还没有基于人群的工具来广泛筛查胰腺癌。那些有家族病史和某些易患胰腺癌的基因突变的人会以有针对性的方式进行筛查。但研究人员表示,这种有针对性的筛查可能会漏掉不属于这些类别的其他病例。
“临床医生每天面临的最重要的决定之一是谁处于疾病的高风险中,谁会从进一步的测试中受益,这也可能意味着更具侵入性和更昂贵的程序会带来自己的风险,”研究合作者说-高级研究员ChrisSander,HMS布拉瓦尼克研究所系统生物学系教员。“一种人工智能工具可以将那些胰腺癌风险最高的人归零,这些人将从进一步的测试中获益最多,这可能会对改善临床决策大有帮助。”
Sander补充说,大规模应用这种方法可以加快胰腺癌的检测速度,导致早期治疗,改善结果并延长患者的寿命。
“许多类型的癌症,尤其是那些难以早期发现和治疗的癌症,对患者、家庭和整个医疗保健系统造成了不成比例的伤害,”研究联合高级研究员、疾病系统生物学教授兼研究主任SørenBrunak说。在哥本哈根大学的诺和诺德基金会蛋白质研究中心。“基于AI的筛查是改变胰腺癌发展轨迹的机会,胰腺癌是一种众所周知难以早期诊断和在成功机会最高时及时治疗的侵袭性疾病。”
在这项新研究中,AI算法在两个独立的数据集上进行了训练,数据集总计来自丹麦和美国的900万条患者记录。研究人员“要求”人工智能模型根据记录中包含的数据寻找线索。根据疾病代码及其发生时间的组合,该模型能够预测哪些患者将来可能患上胰腺癌。值得注意的是,许多症状和疾病代码与胰腺没有直接关系或源于胰腺。
研究人员测试了不同版本的AI模型在不同时间尺度(6个月、1年、2年和3年)内检测疾病发展风险较高人群的能力。
总的来说,人工智能算法的每个版本在预测谁会患上胰腺癌方面比目前全人群疾病发病率估计要准确得多——疾病发病率定义为一种疾病在特定时间段内在人群中发展的频率。研究人员表示,他们认为该模型在预测疾病发生方面至少与目前通常仅适用于数据集中一小部分患者的基因测序测试一样准确。
“愤怒的器官”
筛查某些常见癌症(例如乳腺癌、子宫颈癌和前列腺癌)依赖于相对简单且高效的技术——分别是乳房X线照片、子宫颈抹片检查和血液检查。这些筛查方法通过确保在最可治疗的阶段进行早期检测和干预,改变了这些疾病的结果。
相比之下,胰腺癌的筛查和检测难度更大、成本更高。医生主要查看家族史和基因突变的存在,虽然这些是未来风险的重要指标,但往往会遗漏许多患者。人工智能工具的一个特别优势是它可以用于任何和所有有健康记录和病史的患者,而不仅仅是那些具有已知家族病史或疾病遗传易感性的患者。
研究人员补充说,这一点尤为重要,因为许多高危患者甚至可能不知道自己的遗传易感性或家族史。
在没有症状且没有明确迹象表明某人处于胰腺癌高风险的情况下,临床医生可能会谨慎推荐更复杂和更昂贵的测试,例如CT扫描、MRI或内窥镜超声,这是可以理解的。当使用这些测试并发现可疑病变时,患者必须接受活组织检查的程序。该器官位于腹部深处,难以接近并且容易被激怒和发炎。它的易怒为它赢得了“愤怒的器官”的绰号。
研究人员说,一种识别胰腺癌风险最高人群的人工智能工具将确保临床医生测试正确的人群,同时避免其他人进行不必要的测试和额外程序。
大约44%的早期胰腺癌患者在诊断后存活了五年,但只有12%的病例被诊断得这么早。研究人员估计,那些肿瘤生长超出原发部位的患者的存活率会下降到2%到9%。
“尽管外科技术、化学疗法和免疫疗法取得了显着进步,但存活率仍然很低,”桑德说。“因此,除了复杂的治疗之外,显然还需要更好的筛查、更有针对性的测试和更早的诊断,而基于人工智能的方法是这个连续过程中的第一个关键步骤。”
以前的诊断预示着未来的风险
对于当前的研究,研究人员设计了多个版本的AI模型,并根据丹麦国家卫生系统41年来620万患者的健康记录对它们进行了训练。在这些患者中,有23,985人随着时间的推移患上了胰腺癌。在训练期间,该算法根据疾病轨迹辨别出指示未来胰腺癌风险的模式,即患者是否具有随时间推移以特定顺序发生的特定情况。
例如,胆结石、贫血、2型糖尿病和其他胃肠道相关问题等诊断预示着3年内患胰腺癌的风险更大。不足为奇的是,胰腺炎症在两年更短的时间内强烈预示着未来的胰腺癌。
研究人员警告说,这些诊断本身都不应被视为未来胰腺癌的指示或致病因素。然而,随着时间的推移,它们发生的模式和顺序为基于人工智能的监测模型提供了线索,并可能促使医生更密切地监测那些风险较高的人或进行相应的测试。
接下来,研究人员在一组以前从未遇到过的全新患者记录上测试了性能最佳的算法——美国退伍军人健康管理局的数据集包含近300万条记录,跨越21年,包含3,864名被诊断患有胰腺癌的人。该工具在美国数据集上的预测准确性略低。
这很可能是因为美国数据集是在较短的时间内收集的,并且包含的患者人口概况有所不同——丹麦数据集中的丹麦全体人口与退伍军人事务数据集中的现任和前任军事人员。当该算法在美国数据集上从头开始重新训练时,其预测准确性得到提高。
研究人员说,这强调了两个要点:首先,确保人工智能模型是在高质量和丰富的数据上进行训练的。其次,需要访问在国内和国际上汇总的具有代表性的大型临床记录数据集。在没有此类全球有效模型的情况下,人工智能模型应根据当地健康数据进行训练,以确保其训练反映当地人口的特质。
声明:本站所有文章资源内容,如无特殊说明或标注,均为采集网络资源。如若本站内容侵犯了原著者的合法权益,可联系本站删除。