首页 > 医疗资讯/ 正文

人工智能对肺结节合并气腔播散预测价值的研究进展

来源 2025-10-18 13:28:27 医疗资讯

 摘  要

随着肺癌筛查的普及,越来越多的患者被诊断为早期肺腺癌。对于ⅠA期肺腺癌,亚肺叶切除术是其主要治疗方式。然而,对于合并气腔播散(spread through air space,STAS)的患者,目前很多研究认为肺叶切除是其主要治疗手段。由于术前预测及术中冰冻切片对STAS情况的判断具有局限性,目前的研究均局限于运用临床和影像学特征对患者是否合并STAS进行预测,结果参差不齐,且不令人满意。多是集中于对单个临床和影像学特征进行研究,尚缺乏大样本的研究。近年,人工智能的兴起对该难题的解决提供了新的思路,且已有相关研究显示人工智能预测STAS的效能优于既往的预测方式。本文对人工智能在STAS预测中的价值进行综述。

正  文

肺癌是全球癌症相关死亡的主要原因[1]。2015年,世界卫生组织对肺癌进行了分类,将“微毛细血管簇、实体巢或主肿瘤边缘以外空间内的单个肿瘤细胞”定义为气腔播散(spread through air space,STAS),作为肿瘤侵袭的一种新病理特征[2]。根据大量文献[3]报道,STAS的阳性率约为15%~40%。肺癌预后不良可归因于这一重要的危险因素[4-5]。研究[6]显示,对于肿瘤直径≤2 cm且肺门/纵隔淋巴结病理阴性的周围型非小细胞肺癌患者,亚肺叶切除术在无病生存期方面不劣于肺叶切除术。然而,有研究[7]显示,STAS患者在亚肺叶切除术后复发的风险更大。因此,Ⅰ期肺腺癌患者的STAS状态会影响手术方式的选择。通过术前判断肿瘤的STAS状态,并在条件允许的情况下对疑似阳性的患者进行肺叶切除术,可以降低复发的可能性。但由于材料范围有限和其他原因,术前影像学、支气管细胞学或术中冰冻切片不足以准确预测肿瘤STAS,术前或术中冰冻切片STAS的预测尚缺乏有效的预测方法。传统CT影像对STAS的识别敏感度低,且依赖医师经验判断。近年人工智能(artificial intelligence,AI)的兴起为该难题提供了解决思路,AI通过挖掘CT影像的深层特征(如形态异质性、微环境变化等),为术前预测STAS提供了新方向,AI结合病理也为术中冰冻病理高效且准确诊断STAS提供新思路,因此STAS对个体化手术规划及预后评估具有重要意义。

1 技术方法与研究进展

1.1   影像组学与STAS特征关联

STAS无法从CT上直接观察到,但有研究显示其与CT的相关性。一些研究[8]认为,肿瘤密度是预测STAS的重要因素,其存在的概率可以通过CT上肿瘤实变比率预测,例如Kim等[9]的研究表明,在各种定性和定量CT特征中,固体成分的百分比是STAS的独立预测因素。其他形态特征,如肿瘤凹陷、周围磨玻璃样阴影、血管会聚、胸膜凹陷和毛刺,也与STAS的存在有关[10]。一些研究[10-14]也得到相似的结论,STAS会导致肺癌CT表现的变化,如边缘存在切迹或凹陷、血管聚集、胸膜凹陷、中心低密度影、边界不清、形状不规则、空气支气管征象和实性成分,其表明放射学预测STAS的潜在价值。基于临床或CT图像的放射组学模型,已经显示出较为可观的前景,例如Wang等[15]回顾性研究了2个中心395例经病理证实的肺腺癌患者,其中146例(36.96%)患者检测到STAS,放射组学模型内部测试集曲线下面积(area under the curve,AUC)为0.851,外部测试集AUC为0.699,该研究表明基于CT的放射组学模型显示出较好的预测效果。Zhuo 等[16]的研究也得到相同结论,他们利用肺结节的放射组学列线图预测STAS的状态,该放射组学列线图由7个选定的放射学参数和临床特征组成,在训练集[AUC=0.980,95%CI(0.97,1.00)]和测试集[AUC=0.990,95%CI(0.97,1.00)]中显示出良好的预测性。然而,传统的临床及放射学诊断指标和体征存在许多局限性,例如CT层厚等技术参数的差异、由于STAS成像标准的不一致和不确定以及患者临床特征读取的主观性,难免因个人解读而导致偏倚[14]。

1.2   深度学习模型预测STAS的研究现状

目前,应用深度学习技术预测STAS的研究有限,预测能力仍然有限,但也显示出客观的前景。对于STAS预测的AI模型,主要包括基于临床深度学习模型、基于放射组学学习模型、基于病理学学习模型及多模态模型等。AI在肺癌放射组学中的主要应用之一是自动图像分割。利用深度学习算法,AI可以精确地分割肺部图像中的肿瘤区域,从而显著减少人为错误并减少时间消耗[17],U-Net和Mask R-卷积神经网络(convolutional neural network,CNN)等架构广泛应用于医学图像分割,在从周围组织中描绘肿瘤边界方面表现出了很高的效率[18]。在特征提取和选择方面,机器学习算法起着关键作用,这些算法自动提取高维成像特征,如形状、纹理和小波特征,随后选择具有最重要诊断和预后价值的特征用于对STAS进行更为准确的预测。AI驱动的诊断支持系统,如计算机辅助诊断,通过识别CT扫描中的异常并突出临床医师感兴趣的区域,提高了早期检测的准确性,有利于发现STAS的高危肺结节。目前计算机视觉(computer vision,CV)特征,包括局部和全局特征,在图像处理中得到了广泛的应用,并且减少了人为干扰因素[19],且已有多项研究[19-20]表明,CV特征可用于诊断疾病和治疗效果预测。然而,CV特征是2D成像特征,由于肿瘤在时间和空间上是异质的,2D描述符无法提供整个组织的全面评估。深度学习,如3D CNN,可以学习医学图像数据集之间高度复杂的线性/非线性相关性,以预测非小细胞肺癌(non-small cell lung cancer,NSCLC)的STAS状态,3D CNN模型优于临床病理、CT模型、传统影像组学模型、CV模型和组合模型,并在训练队列中实现了令人满意的鉴别性能,AUC为0.930[95%CI(0.70,0.82)],在验证队列中为0.800[95%CI(0.65,0.86)][21]。动态双delta混合模型:黄佳团队结合CT序列的放射组学与深度学习特征,构建的混合模型在内部验证AUC达0.940,外部验证AUC为0.840[22]。Wang等[15]也得到相同研究结果,深度学习模型的内部测试集AUC为0.918,外部测试集为0.766。放射组学模型的内部测试集AUC为0.851,外部测试集AUC为0.699,基于胸部CT构建的深度学习模型较放射组学模型具有更好的诊断性能,而外部验证集AUC较内部测试集低主要原因可能在于数据异质性、模型过度拟合及技术流程不一致。基于病理的空间拓扑图覆盖了更广泛的空间范围,使模型能够从更远的位置捕捉关系,该模型预测肺癌冰冻病理和石蜡病理中的STAS,内部验证中的AUC为0.922,在冰冻和石蜡包埋的测试切片中的AUC分别为0.828和0.883,证明了更为可行的临床预测模型[22]。

1.3   多模态模型预测STAS的研究现状

与广泛研究的单模态模型相比,多模态模型的优势在于其与多模态数据的高效集成能力,利用全面而丰富的患者资料来提高预测的准确性[23]。多模态模型涵盖影像学图像、结构化影像报告、病理学图像、病理结构化报告及详尽的临床信息等多模态信息。该模型打破了传统单一数据模式的局限,全面捕捉患者的疾病特征,有效应对临床中模态数据的潜在缺失问题。展示了多模态分析技术在临床决策中具有重要的支撑作用[24]。然而目前关于多模态模型预测STAS的研究较少。山东大学团队[25]通过整合13项临床指标,如癌胚抗原(carcinoembryonic antigen,CEA)、第一秒用力呼气容积(forced expiratory volume in 1 second,FEV1)、CT实性成分比,构建的XGBoost模型,在预测≤ 2 cm肺腺癌STAS中表现优异,训练集AUC达0.931,外部验证集AUC为0.904,特异性高达0.921。SHAP分析结果显示,CEA水平升高与STAS风险显著相关。该模型的高可解释性和泛化能力使其成为临床决策的重要工具,但其局限性在于未整合分子数据且外部验证仅来自单中心。此外越来越多的临床数据加入发现,与非STAS组相比,STAS患者的程序性死亡配体1(programmed death-ligand 1,PD-L1)、P53、Ki67和间变性淋巴瘤激酶(anaplastic lymphoma kinase,ALK)水平显著升高[26-27]。类似地,肿瘤抑制基因P53的突变、较高的Ki67指数和ALK基因重排患者易患STAS,证实了其在蛋白质和基因水平上的高侵袭性,也为预测STAS提供更多的参考。STAS中PD-L1表达的增加和ALK重排的更高发生率提示了这些患者可能从特定治疗中获益的可能性,并为后续的检测和治疗决策提供了依据[22]。

1.4   关键研究成果

关于AI预测肺癌STAS,国内外均有团队对此展开研究,其中国内研究尤为活跃且成果丰硕。目前的学习模型主要基于临床影像学模型、病理图像模型及多模态模型。基于影像学的模型主要有上海交通大学团队[28]提出结合CT时间序列的“双delta”模型,徐州医科大学团队[29]利用VNet框架自动分割CT图像,构建基于ResNet101的模型,以及3D CNN模型[21]。病理图像模型主要有彭绍亮团队[22]开发的首个基于病理全切片图像(WSI)的VERN模型,并搭建开放平台辅助病理诊断,提升术中冰冻切片与术后石蜡切片评估效率。多模态模型主要有联合术前CT、血清标志物(如CEA)及冰冻病理等结果的XGBoost模型[25],以及上海交通大学团队[30]开发的BEPH模型通过自监督学习预训练,可泛化至多种癌症诊断任务,其高精度特征提取为多任务STAS预测提供新思路,虽未直接针对STAS,但潜力显著。

2 临床价值与意义

2.1   提升诊断准确性与效率

传统的STAS诊断具有一定局限性,STAS诊断依赖组织病理学评估,但病理学家的主观判断可能导致漏诊或误诊(冰冻切片诊断准确率约74.14%)[31]。AI和深度学习的最新进展彻底改变了医学图像分析,特别是在组织学图像中肿瘤组织的检测、分割和分类方面[32-34]。许多研究[35–36]强调了深度学习模型在从常规病理图像中提取关键信息方面的有效性,提供了有价值的临床见解。如3D正电子发射计算机断层扫描(positron emission tomography-computed tomography,PET-CT)融合模型,结合18F-FDG PET代谢信息和CT解剖信息,采用ResNet50架构融合多模态数据。测试集AUC为0.889,灵敏度与特异性优于人工阅片,辅助医师制定术前治疗方案[37]。此外,对于早期肺癌的诊断及病理微小变化,AI在图像识别中的潜力是巨大的。通过将AI和图像识别技术应用于大量的CT扫描,AI可以自动识别早期肺结节和微小的病理变化,从而促进早期诊断并增加成功治疗的机会[38],许多医院现在都在使用AI驱动的计算机辅助检测系统,以协助放射科医师在CT扫描中检测和表征肺结节。这些系统可以快速分析数百张图像,标记可疑区域,供放射科医师进一步审查。这不仅加快了诊断过程,而且提高了仅凭人眼可能忽视的小结节的检测率。此外,正在开发AI算法来区分良性和恶性结节,这可能会减少不必要的活检和后续扫描[39]。这些已经应用于临床模型,其高精度特征提取能力为STAS预测提供新的思路。

2.2   优化手术方案与预后

研究[7, 40]显示STAS阳性患者若接受亚肺叶切除术,相比于肺叶切除,局部复发风险较高,因此肺叶切除术可能是更好的选择。组织病理学目前是诊断肺癌STAS的金标准,然而病理科医师对STAS的评估是主观的,容易漏诊或误诊,耗时耗力,不适合大范围组织病理学诊断[22]。术中冰冻切片诊断有助于临床医师在手术过程中做出决策,包括调整手术范围和方法,以及及时评估手术切缘[7]。石蜡包埋切片也是病理检查的基本方法,用于研究疾病的发病机制、病理生理学和分子生物学特征,为疾病预防、治疗和控制提供科学依据[41]。然而,目前使用冰冻切片和石蜡包埋切片诊断STAS的准确性仍然很低,假阳性和假阴性率很高,工作量很大,因此迫切需要使用AI来预测冰冻切片和石蜡包埋切片上的STAS[42]。AI预测STAS可为术前手术方式决策提供依据,如调整切除范围或淋巴结采样。许多研究[36]强调了深度学习模型在从常规病理图像中提取关键信息方面的有效性,提供了有价值的临床见解。例如深度学习已被用于定量图像分析,以预测疾病进展模式、预后和其他临床结果[43],VERN结合临床数据分析显示,STAS与肺癌分期、PD-L1等蛋白表达显著相关,有助于评估患者生存率和复发风险[22]。此外,有研究[44]显示STAS检测具有直接的临床功能,STAS患者更容易发生胸膜、血管和神经受累,临床分期较高的STAS组患者明显多于非STAS组。STAS组患者更有可能发生淋巴结转移、远处转移,更容易复发,预后更差,这提醒医师更改治疗方式以改善预后,例如对于ⅠA期患者,若有STAS,可建议患者行术后辅助化疗。

2.3   推动精准医疗与多模态数据整合

肺癌精准医疗领域正在经历一场范式转变,这在很大程度上是由AI的进步驱动的。精准医疗是指根据每例患者的个体特征(如基因图谱、肿瘤分子特征和其他生物标志物)量身定制医疗方法。通过将治疗方案与每例患者的独特生物背景相结合,精准医学旨在提高治疗效果,同时最大限度地减少不必要的不良反应。AI在肺癌精准医疗的未来前景看好,包括早期诊断、个性化治疗方案、治疗监测和新药开发[45]。此外,AI可以整合多学科数据,包括遗传信息、成像数据、临床记录和生活习惯,以全面评估患者情况。整合临床、病理和基因组数据的AI模型在精准预测NSCLC患者的STAS显示出了希望,这可能会指导治疗强度和随访方案的决策。

上海交通大学的多模态融合模型MPI-RF 在肺结节良恶性鉴别中具有良好的诊断性能[AUC=0.887,95%CI(0.84,0.92),灵敏度为 81.22%,特异性为 83.70%];其中,MPI-RF 对实性结节的 AUC 为 0.877[95%CI(0.82,0.93)],混合磨玻璃结节的AUC为0.858[95%CI(0.77,0.94)],纯磨玻璃结节AUC为0.978[95%CI(0.92,1.00)]。对于直径<8 mm 的结节,MPI-RF 的 AUC 为 0.840[95%CI(0.71,0.96)];直径≥8 mm的结节,其 AUC 为 0.891[95%CI(0.84,0.93)]。与现有模型对比的结果显示,MPI-RF 的诊断性能优于 Mayo Clinic 模型、VA 模型、Brock 模型(P<0.001)[46]。斯坦福医学院的科研团队成功研发了一款名为MUSK的AI模型,该模型通过结合医学图像和文本数据,能够精准预测癌症患者的预后和治疗反应。MUSK模型的独特之处在于其突破性地整合了视觉数据(如病理图像)和文本数据(如病历和临床记录),从而更全面地理解患者病情。MUSK模型可以准确预测16种癌症类型的患者生存率和治疗反应。类似斯坦福MUSK模型整合图像,未来STAS预测可结合基因表达、影像组学等多维度信息,进一步提升预测精度[22, 47]。

2.4   促进研究与临床验证的标准化及经济可行

目前的预测模型还存在很多问题,无法在临床中开展,例如泛化能力差、过度拟合等。原因可能在于,不同试验中的患者群体差异太大。如果模型未识别到数据中区分患者的关键信息,或者与目标试验相比,用于开发模型的数据集中该信息的范围受到更多限制,则预测可能不准确。其次试验在纳入标准或治疗方案方面可能存在微妙的重要差异。由于这些特征在试验中因患者而异,因此无法在单个试验中将其建模为预测因素[48]。对此很多模型正尝试解决这个问题,例如 VERN在3个外部数据集中的表现验证了其跨机构适用性,为模型临床推广提供了证据。这与阿尔茨海默病AI模型需多中心验证的结论一致[49-51]。部分AI模型因过度拟合(如精神分裂症疗效预测)在外部验证集中表现不佳,但VERN通过大规模数据集和外部验证规避了这一问题[48]。未来的AI模型可能替代昂贵检测,例如阿尔茨海默病AI模型通过磁共振成像和认知测试替代腰椎穿刺,降低了就医成本。类似地,传统STAS诊断依赖复杂病理分析,而AI模型仅需数字化病理图像,成本更低且适合资源有限地区[52]。

挑战与局限性

对于目前的AI模型还存在很多挑战和局限性,如数据异质性:不同CT扫描参数导致特征可重复性降低,需跨中心标准化数据集支持[22]。其次模型泛化性差:现有研究多基于回顾性数据,前瞻性验证及多中心研究不足,尤其是针对亚实性结节的STAS预测效能仍需验证[48]。STAS在CT影像中表现为微小结节或磨玻璃影,易与良性病变混淆,AI可能因微小特征识别偏差导致误判,尤其在早期肺癌中,假阴性可能延误治疗[48]。伦理与责任归属:AI辅助决策的透明性不足,法律层面尚未明确AI诊断错误的责任划分[22]。

未来研究方向

多模态预测框架构建:整合CT影像与临床数据(如PD-L1表达、基因突变)或病理图像,构建多模态预测框架。例如XGBoost模型整合13项临床指标(如CEA、FEV1、CT实性成分比),该模型的高可解释性和泛化能力使其成为临床决策的重要工具[25]。泛化能力提升:通过多中心、多设备数据训练模型,减少机构间差异。例如,冠状动脉CT血管造影的AI模型通过国际多中心研究验证了泛化性,开发类似“冠状动脉CTA评分”的量化指标(如“STAS风险评分”),统一评估标准,便于跨机构比较与临床决策[25, 53]。预后与复发预测:结合STAS预测结果与TNM分期、蛋白表达(如Ki67、ALK),构建生存分析模型。例如,VERN已探索STAS与癌症分期的强相关性,未来可结合CT特征进一步验证[22]。指南制定:推动多学科协作(胸外科、病理科、AI团队),制定STAS AI评估的临床路径与标准。

小结

AI结合CT影像在肺结节STAS评估中展现了从静态特征分析到动态趋势预测的全链条潜力,其核心价值在于实现术前无创风险分层与精准治疗决策。未来需突破数据标准化与模型可解释性瓶颈,推动AI从辅助工具向临床决策核心环节渗透,最终改善肺癌患者的生存预后。

利益冲突:无。

作者贡献:宁显璞、夏丽波、黄祖军和孔维双确立选题,修订及终审文章;孔维双总结资料;宁显璞收集资料,书写文章;夏丽波、王定伦、梁训提出修改意见,解答专家意见并审阅、修订文章。

Tags: 人工智能对肺结节合并气腔播散预测价值的研究进展  

搜索
网站分类
标签列表