首页 > 医疗资讯/ 正文

人工智能辅助诊断肺结节临床应用与研究进展

来源 2025-09-02 12:11:04 医疗资讯

摘  要

人工智能(artificial intelligence,AI)已在肺结节辅助诊断方面显示出巨大的应用价值。面对大量的肺部影像数据,临床医师运用AI 工具更加快速精准地识别出病灶,提高了工作效率,然而该领域仍然面临诸多问题,如识别的假阳性率高,特殊类型结节难以识别等。科研人员和临床医师积极开发和运用AI 工具,促进其持续进化,使之更好地服务于人类健康。本文就AI 辅助诊断肺结节的临床应用和研究进展作一综述。

正  文

国家癌症中心(National Cancer Center,NCC)发表的最新数据估计2022 年我国肺癌新发例数和死亡例数分别为106.06 万和73.33 万,发病率和死亡率均居于恶性肿瘤首位[1]。癌症二级预防策略包括“早发现、早诊断、早治疗”,为实现肺癌的早诊早治,中国临床肿瘤学会(Chinese Society of Clinical Oncology,CSCO)和美国国立综合癌症网络(National Comprehensive Cancer Network,NCCN)均将低剂量螺旋CT(low-dose computed tomography,LDCT)作为肺癌高危人群的筛查手段[2-3]。肺结节在影像中表现为直径≤3 cm 的病灶,直径<5 mm 者称微小结节,5~10 mm 者称小结节。据其密度差异可分为实性结节(solid nodule)和亚实性结节(subsolid nodule),亚实性结节分为混杂性结节(mixed ground-glass nodule,MGGN)和纯磨玻璃结节,MGGN 又称部分实性结节(partsolid nodule)[4]。近年来随着人们对自身健康的愈加关注,肺结节检出率逐年增高,早期干预高危结节,合理随访低危结节,既需引起人们的足够重视,又要减轻其心理焦虑,这是临床医师需要重视的问题。根据肺结节影像学等特点可对肺结节的危险程度进行划分,给出相应的诊治建议,实际工作往往面临影像数量多、判读时间短、人员阅片水准参差不齐等情况,肺结节的诊断存在误诊和漏诊的风险。使用AI 工具辅助诊断肺结节迅速成为人们关注的焦点。

1 人工智能辅助诊断肺结节

1.1   肺部影像数据集

临床实践中产生的大量胸部X 线片( chestX-ray,CXR)和CT数据包含了丰富的信息,肺结节相关影像数据可用于训练诊断肺结节的AI模型。CXR 检查的应用历史远早于CT,其费用低廉,是呼吸系统疾病的一线影像学检查,但CXR对肺结节不够敏感,小肺结节在CXR上难以被显影和识别[5],该检查对早期肺癌有一定的误诊率,这种误诊在经验不足的放射科医师中更为常见,在胸部影像学专家中也可能发生,为提高敏感度、降低误诊率和漏诊率,CXR的计算机自动检测和辅助诊断成为倍受关注的课题[6]。ChestX-ray8 数据集纳入1992—2015年32 717例患者的108 948张CXR,标注了8种常见疾病,ChestX-ray14在此基础上增加到了14 种[7],可以为计算机提供参照。CheXpert数据集公布于2019 年,包含65 240 例患者的224 316张CXR[8],MIMIC-CXR 数据集的CXR 超过37 万[9],数量愈加庞大的影像数据被归纳用于训练AI模型。

CT设备已在我国各级医院普及,LDCT对肺结节的敏感性明显高于CXR,已成为肺癌高危人群重要的筛查手段。CT相关数据集如美国国家癌症研究所发起收集的LIDC-IDRI,包括1 010 例患者的1 018份CT 和290 份CR/DX数据[10],极大促进了AI在肺结节辅助诊断领域的发展。2016年在LIDC-IDRI中选取的子集LUNA16,删除了切片厚度>3 mm和肺结节<3 mm的CT影像,成为 AI模型训练和测试常用的数据集[11]。2018 年美国国立卫生研究院临床中心(NIH Clinical Center,NIHCC)发布DeepLesion数据集,该数据集除标注肺部病变外,也标注了肝脏、肾脏、骨骼病变和淋巴结肿大[12]。常见的CXR 和胸部CT数据集见表1。

图片

1.2    预测肺结节性质的数学模型

诊断肺结节除根据影像数据外还需参考被检出者的性别、年龄、地域、吸烟史、肿瘤史等信息,分别设置参数后可设计出具有预测肺结节恶性概率功能的数学模型,如Swensen 等[18]1997 年建立的梅奥模型,该模型使用629 例患者CXR,综合患者的年龄、吸烟史、结节发现既往胸外恶性肿瘤史>5 年、直径、毛刺、位置等因素,设置数学模型见式(1)和式(2),模型的受试者工作特征(receiver operating characteristic,ROC)曲线下面积(area under curve,AUC)为0.833,成为肺结节良恶性预测的典型工具。美国退伍军人事务部VA 模型以532 例患者为基础,将戒烟时间(年)纳入模型参数,也得到良好的预测效能[19]。

图片

随着胸部LDCT检查日益增多,以CXR 为基础的数学模型难以满足临床需要,为提高模型的准确性,以CT为基础的数学模型以及纳入更多因素如人种、地域、检验结果等的模型被提出;见表2。北京大学人民医院(PKU)模型纳入钙化、肿瘤家族史[20],南方医科大学纳入1项肿瘤标志物指标Cyfra21-1[21],复旦大学附属中山医院LCBP模型纳入4项肿瘤标志物指标[22],河南省人民医院的HN模型对瘤-肺界面、空泡征、血管集束征分别设置参数[23]。南京医科大学附属脑科医院胸外科以肿瘤的CT平均密度和2种肿瘤标志物为指标构建预测模型,经1 000次抽样验证其预测概率与实际风险一致[24]。数学模型以统计学方法为基础提供了一种实用工具,使对肺结节恶性概率的预测量化为具体数字,AI工具则内置或集成数学模型,将预测过程自动化和精确化。

图片

2 临床应用

2.1 应用产品

根据影像数据集开发出的 AI 产品已经上市应用,多数集成到医院的影像归档和通信系统(picture archiving and communication system,PACS)中,可无障碍读取和分析数据,即时产生报告。2021 年van Leeuwen 等[27] 总结欧洲 100 种已上市的放射学AI 产品,发现大多数都在两年内上市,说明 AI 在该领域的应用正在蓬勃发展,截至 2024 年 11 月该组织已登记 63 种胸部相关的 AI 产品,其中 33 种可用于诊断肺结节;见表 3。我国联影智能 CT 肺结节智能筛查系统、推想医疗肺部疾病智能解决方案、睿影 AI 医学辅助诊断/评估系统、讯飞医疗AI 影像辅助诊断、依图医疗肺结节计算机智能检测系统、腾讯觅影、体素冠影、杏脉锐影、啄医师、数坤科技数字胸、点内科技肺小结节辅助诊断系统 等产品进入临床应用阶段。美国目前已有 42 种食品药品监督管理局(Food and Drug Administration,FDA)批准的用于胸部放射学 AI 软件,随着医师和开发人员的合作、开发人员与监管机构的沟通,AI 设备能够为患者管理提供关键支持,最终提高医师对肺结节的诊疗能力[28]。

图片

2.2 临床应用效果

一项 9 名初级和高级放射科医师诊断 100 张CXR 的研究[29] 发现,AI 辅助使得医师的诊断准确率提高了 6.4%[95%CI(2.3%,10.6%)],初级放射科医师在肺结节检测的灵敏度上较高级放射科医师 有更大的提高。荷兰一机构比较 7 种商业化 AI 工具与人类对 CXR 肺结节的检测水平, 发现其中4 种工具优于人类判读水平,3 种与人类判读水平没有差异[30],基于 CXR 的 AI 辅助诊断工具显著提高了肺结节的诊断准确率。

为了对比放射科规培医师在不同工作状态和有无 AI 工具辅助时的诊断能力,王亮等[31] 搜集本单位(三级甲等医院)182 份薄层胸部 CT 数据,分别统计规培医师在正常工作状态、疲劳状态和疲劳状态借助 AI 软件辅助三种模式下的检测指标,对比三种状态下对肺结节的检出敏感度、假阳性结节的数量。结果显示,疲劳状态显著降低了规培医师的检验效能,而 AI 软件辅助有助于提高疲劳状态下的检验效能甚至优于正常工作状态。蔡少辉等[32] 将所在的县级医院 1 年 100 例肺结节患者作为研究对象,以病理检查为金标准,结果显示 AI 肺结节诊断系统对恶性结节、良性结节、实性结节、部分实性结节和磨玻璃结节的诊断符合率均高于一般CT 检查组,AI 可以辅助临床医师更好地判断肺结节性质。邢宇彤等[33] 回顾性分析经病理诊断为肺癌的 40 例肺结节患者,其中 38 例由 AI 工具报告,73 个良性结节中 25 个 AI 判断为高危结节,综合分析 AI 辅助诊断系统在肺结节检出方面性能较强, 但在肺结节良恶性鉴别方面尚不能满足临床需求, 可以作为区域医疗中心有价值的辅助手段。张潇文等[34] 所在的三级甲等医院在多学科诊疗团队模式(multi-disciplinary team,MDT)下运用 AI 工具识别肺微小结节,即时报告患者的肺结节数目、大小、倍增时间、密度、恶性程度,提高了 MDT 的诊疗效率,减少了漏诊和误诊。

叶文卫等[35] 回顾性分析 230 例患者 325 个肺结节的 CT 图像,比较双人阅片、AI、双人+AI 三组的阅片时间、灵敏度、特异度。结果显示,AI 辅助医师阅片可以缩短阅片时间,有效提高肺结节诊断的 灵敏度、特异度和准确率。李斌等[36] 设置人工阅片组和 AI 阅片组,比较两组在识别灵敏度、准确度、特异度、阴性预测值、阳性预测值等指标的差异。结果显示,AI 阅片组在直径≤10 mm 肺结节的识别上显示更高的灵敏度,在直径>10 mm 肺结节识别上与 AI 组在灵敏度上无显著差异,两组对恶性肺结节识别的准确度和阳性预测值也无显著差异。一项对 1 000 个平均肺结节直径为 5.3 mm 的健康体检 LDCT 运用计算机辅助诊断系统的实验表明, 系统能够自动高效地检测肺结节,特别是直径 3~ 6 mm 的小结节,准确率达 0.879,与经验丰富的医师相当[37]。低收入和中等收入国家的卫生系统往往 更加薄弱或存在缺陷,特别是基层卫生机构对肺癌的诊断偏晚。一项研究[38] 比较了亚洲、拉丁美洲和俄罗斯的试点,AI 能提高中低收入国家的诊断能力,提高肺结节的准确识别率和早期识别率,促进对潜在可治愈阶段肺癌的干预。

为测试已上市成人肺结节 AI 工具在儿科胸部CT 中的性能,Salman 等[ 39 ] 纳入 30 例年龄 12~18 岁患者的胸部 CT,在 3 mm 和 1 mm 切片厚度下回顾性重建图像,成人肺结节 AI 工具在儿科患者中表现出低敏感性,但在较薄的切片厚度和排除较小结节时表现更好。一项研究[40] 评估 4 种 AI 辅助诊断系统在识别和测量小磨玻璃结节、小实性结节、磨玻璃结节和实性结节四种肺结节方面的性能,在 4 种类型的结节中,小磨玻璃结节最难识别, 需要提高 AI 系统的准确度和精密度。一项AI 对 4 771 例肺癌诊断价值的系统评价与 Meta 分析[41] 显示,基于 CT 影像的 AI 辅助诊断系统在肺癌诊断方面具有较高价值,可以在临床推广使用, 研究同时指出,扩大训练集样本量以对 AI 辅助诊断系统的模型进行调整和改善,重视建立多中心标 准的 CT 影像数据库,完善责任界定与追究的法律法规等。另一项研究[42] 通过分析 10 种 FDA 批准的用于肺结节检测的软件,发现 AI 通过降低不确定肺结节的不确定性来造福患者,也会通过增加不必要的检查伤害患者。

研究进展

AI 使用深度学习(deep learning,DL)的方法,使输入的肺结节相关图像数据直接输出为图像类别信息,主要结构为卷积神经网络(convolutional neural networks,CNN),CNN对输入的图像数据进行卷积计算,根据得到的感兴趣区域(region of interest,ROI)的特征输出判断结论。

3.1    影响人工智能性能的因素

不同医疗机构或不同的时期,因设备差异往往存在不同分辨率尺寸的CXR,多数CNN 只接受单一分辨率图像。针对该问题Pereira等[43]提出一种轻量级的分类架构,可实现类似于多尺度模型集成的分类性能。为分析影响肺结节检出的相关因素,刘强等[44]将AI诊断系统应用于胸部仿真体模实验,将相关因素归纳为扫描因素和非扫描因素,扫描因素包括扫描剂量、重建算法及重建层厚,非扫描因素包括结节大小、密度及在胸部的位置。不同扫描剂量对真阳性率无明显影响,低剂量模式下假阳性率升高,薄层图像有助于提高真阳性率。直径≥8 mm的肺结节检出真阳性率明显高于直径≤5 mm组,纵隔旁肺结节真阳性率明显高于胸膜下和肺实质。为比较CT辐射剂量和重建算法对AI诊断结果的影响,对15 个肺结节设置5个辐射剂量方案的扫描,最低的辐射剂量较标准降低了20 倍,所有扫描均采用2种重建方案,结果显示辐射剂量和重建方案对AI诊断均有影响,改变重建方案可使低剂量扫描AI诊断结果与标准剂量相当,提示可调整CT剂量水平和重建方法用于肺癌筛查[45]。在一项前瞻性研究[46]中,682 例使用双能量系统进行胸部 CT 检查的患者被随机分为两组:单能量模式组和双能量模式组,与单能CT相比,双能CT可显著提高AI对肺结节诊断的敏感性,对成人人群肺结节的筛查具有实用性。Zhang 等[47]将260例孤立性肺结节分为恶性173例和良性87例,采用分层数据分析比较AI系统的诊断效果。AI判断结节良恶性肿瘤的准确率为75.77%,AUC 为 0.755,按结节位置:左上叶、左下叶、右上叶、右中叶、右下叶结节的AUC分别为0.677、0.758、0.744、0.982 和0.725;按结节大小:直径为5~10 mm、10~20 mm和20~30 mm的结节的AUC分别为0.778、 0.771 和0.686;亚实性肺结节的预测准确率高于实性肺结节。

肺结节的增长是判断其生物学行为的重要参考,肺部影像报告和数据系统(lung imaging-report and data system,Lung-RADS)2022 版定义肺结节增长的概念,即12 个月内平均直径增大1.5 mm(体积> 2 mm3)[48],该定义将直径或体积作为判断增长与否的标准。此外,AI工具还可将肺结节的实性占比、恶性概率、表面征象、平均CT值等因素纳入计算,可更全面地评估肺结节的增长[49]。有的工具还可给出肺结节的质量、密度、熵、曲度等参考指标。由于评价体系的差异,Lung-RADS对肺结节进行危险分层给出相应的随访时间与AI工具的建议不完全一致,两者结合则可提高随访时间的准确性[50]。

世界卫生组织(World Health Organization, WHO)2015版和2021版两种分类标准分别将腺体前驱病变纳入恶性病变和良性病变组,分类标准的更新造成AI对肺结节的诊断出现差异,提示AI需要随着病理分类标准的更新进一步优化对腺体前驱病变的评估[51]。

3.2    人工智能模型的创新

目前不少AI工具存在假阳性率高、灵敏度低的问题,通过优化AI算法如构建可分析3D信息的模型和两阶段分析模型等,可在一定程度上解决该问题。为了降低识别的假阳性率,Yuan 等[52]构建一种3D CNN 模型,通过分层架构,有效提取候选结节特征的空间信息,主动适应肺结节之间的形状、大小和位置变化,有效降低了假阳性率。谷歌AI公司提出一种基于3D CNN的DL算法,该算法使用被检查者当前和既往的LDCT数据,测量图像中的ROI体积和整体肺部的体积来预测肺癌风险,无既往CT数据时,该算法的预测结果优于放射科医师,有既往CT作为对比时,该算法的预测结果与放射科医师水平相当[53]。类似地,一项荷兰等多个欧洲国家参与的研究[54]以NLST为训练集,得到一种可对比既往CT数据的新模型,对恶性肺结节的预测优于仅对单次CT进行预测的模型,新模型检测能力在丹麦和意大利两个外部测试中得到了验证。Wu等[55]提出一种多核驱动的三维卷积神经网络(MK-3DCNN),针对不同结节大小和形状开发了多核学习模块,采取多模混合池化策略,在公共数据集LUNA16上的试验实现了更具竞争力的结节检测性能,在临床数据集CQUCH-LND中显示了良好的应用前景。Zhao等[56]提出一种基于Faster R-CNN 整合多尺度特征的候选结节检测模型,灵敏度比单尺度模型高10%。Chen等[57]提出一种新型多尺度多视角两阶段模型,通过候选结节检测阶段和假阳性还原阶段,该模型表现出更高的检测灵敏度、更低的假阳性率和更好的普适性。上海交通大学和上海AI实验室提出首个CXR基于医学知识增强的基础模型(knowledge-enhanced auto diagnosis model,KAD),该模型不需要额外标注数据,具有胸部相关任意疾病的诊断功能[58]。

采用3 种AI诊断方案(基于图像的深度神经网络、基于临床和图像特征的机器学习方法、融合原始图像与临床和图像特征的融合诊断模型)对双中心867个肺结节进行良恶性鉴别,结果显示融合诊断模型在双中心数据集均取得最佳性能[59],提示AI的开发纳入更多临床信息的必要性。AI模型在利用生物标志物和肿瘤标志物作为补充筛查工具方面表现出了前景,有效提高了早期检测的特异性和准确性。AI算法具有整合多种成像模式和临床数据的潜力,通过利用高质量数据,包括患者人口统计学、临床病史和遗传特征,AI 模型可以预测治疗反应并指导最佳疗法的选择,在预测靶向治疗后的反应和复发可能性以及优化肺癌患者的放疗方面取得相当大的成功[60]。一项纳入424例肺结节患者的研究[61]将肿瘤标志物7-AAB检测与基于CT的AI诊断系统相结合,结果显示这种方法在区分肺结节尤其是直径≤2 cm的肺结节方面表现出良好的诊断性能。

总结与展望

肺结节AI辅助诊断工具从一般智能到深度智能,被逐步推广应用于临床,极大提高了工作效率,逐渐改变放射科、胸外科等科室的工作方式。同时AI作为新兴技术,在医学领域的应用仍处在起始阶段,不断迈向深度智能化过程中仍面临诸多问题和挑战。例如目前肺结节AI辅助诊断工具多不能全面考虑被检查者影像学之外的信息,如年龄、性别、人种、吸烟史、致癌物接触史、家族史、肿瘤标志物、生物化学指标等,难以对比分析院外或动态分析既往影像学信息,不具备融合X线、 CT、正电子发射计算机断层扫描、磁共振成像等多模态能力。未来AI辅助诊断工具如能自动提取影像、检验、病历等系统中的关键信息进行综合判断,则更有利于提高AI辅助诊断工具对肺结节判断的准确性,降低误诊和漏诊的风险。随着AI的发展和推广使用,人们将面临一系列新问题,医学影像数据存在复杂性,人机间和不同工具间报告的一致性、标准化和质量控制问题,报告的合法合规性,人员对工具的依赖,对AI 的监管等需引起高度重视。AI作为辅助工具无法解决所有医学问题,不能取代医师的主导地位,解决诸多问题不仅需要AI工具开发部门,也需要医疗机构、卫生管理机构、法律机构等部门的共同参与。优化模型算法、提高工具的准确性、提升多病种集成程度、完善相关法律法规是肺结节AI辅助诊断领域未来的进展方向。

利益冲突:无。

作者贡献:刘琛负责文献检索,论文撰写与编辑;方泽民负责论文构思、审阅;邵佐良、俞若婷负责文献检索和资料搜集;高威负责论文审阅和修改。

Tags: 人工智能辅助诊断肺结节临床应用与研究进展  

搜索
网站分类
标签列表