|
本帖最后由 hyc3140 于 2024-3-27 20:53 编辑
【摘要】2023年RSNA年会的主题是“引领变革”,强调了放射学领域的不断发展,旨在让放射学专业人员在变革中起到引领作用。今年关于胸部影像学方面的研究热点和重点包括以下几个方面:人工智能、深度学习、影像组学、气道病变与慢性阻塞性肺疾病、肺弥漫性疾病、肺结节与肺癌筛查、胸部恶性肿瘤、血管疾病、肺部感染性疾病、胸部MRI和能量CT。本文针对上述内容进行较全面的综述。
人工智能/深度学习
胸部X线片(CXR)是放射科最常见的检查。Pant等使用人工智能(AI)模型DeepTek AI回顾性地将四家医院(A、B、C和D)17500例正位CXR分为“可能正常”或“疑似异常”,在不同的阈值下,DeepTek AI从A、B、C和D区分出“可能正常”的比例分别为21%、28%、31%、20%和45%、55%、63%、37%,错误率(实际异常但评估为可能正常的比例)分别为4%、3%、1%、3%和11%、6%、8%、8%,医生从A、C和D区分出“可能正常”的比例为41%、65%和76%,错误率为11%、3%和11%,AI评估的结果与医生的一致性高达95%。DeepTek AI可以有效地区分正常和异常CXR,从而优化放射科工作流程。Lee等评估了正常过滤(NF)AI模型检测异常CXR的敏感度及报告的正常CXR的比例,发现当NF模型阈值特异度设定为50%时,可以减少22.0%的正常CXR的报告工作量,总体敏感度为97.8%。研究还联合了可检测CXR异常的商用(CA)AI模型,CA模型检测出了16.7%的漏诊异常病例。NF模型具有减少放射科医生工作量的潜在价值,而与CA模型的联合使用有助于防止漏诊。
CXR的诊断错误率一直保持不变,AI的应用有助于提高诊断正确率。Talwar等基于一种商用AI系统(Annalise Enterprise CXR)回顾性分析了一家教学医院的1559例CXR,并与原始影像报告进行了对比。AI共发现169例CXR存在重要病变,而其中97例原始报告经医生确认为漏诊,常见的漏诊病变有肺结节(16%)、胸腔积液(16%)、椎体压缩性骨折(12%)等。Frias等通过基于自然语言处理(NLP)的影像报告搜索引擎(Microsoft Nuance)查询了3760例CXR是否存在孤立性肺结节(SPN)、肺炎和气胸等,每份影像报告(Rad1)由医生进行人工审核,并用多发现AI算法(Annalise.AI)确认诊断是否一致,结果发现NLP/Rad1和AI具有较高的真阳性和真阴性一致性,NLP/AI模式可以识别CXR的误诊和漏诊。Luchs等应用AI模型回顾性地分析了519例65岁以上患者的CXR,用于评估是否存在骨质疏松和椎体楔形骨折。AI模型检测出的骨质疏松和椎体楔形骨折分别为76例(14.6%)和58例(11.2%),而放射报告中分别为8例(1.5%)和0例(0.0%),模型与报告不一致的原因主要是放射科医生的未报告。他们还利用AI模型回顾性分析了1261例门诊老年(≥65岁)患者的CXR图像,发现AI模型对于部分慢性疾病检测的敏感度和特异度优于放射科医生的报告。
尽管AI应用于临床可以提高诊断效能和工作效率,但仍需要评估实际使用情况,以确保AI更好地辅助临床实践。Tang等比较了使用三种AI用户界面(仅文本;联合AI置信度评分和文本;AI置信度评分、文本和图像)和不使用AI下放射科医生对胸片上肺结节和肿块的诊断情况,发现医生使用仅文本AI用户界面时的受试者操作特征(ROC)曲线下面积(AUC)高于未使用时的AUC(0.87 vs.0.82),而另外两种界面与未使用时无明显差异。Dasegowda等对应用于临床的CXR诊断AI算法进行了多中心上市后监测(PMS),发现AI算法的独立诊断性能优于放射学报告,AI辅助显著提高了放射科医生诊断的AUC(增加6%~19%)。Scrivner等使用扩展技术接受模型(ETAM)评估了放射科医生对计算机辅助诊断(CAD)技术的接受和使用情况,参与评估的医生表示信任AI,但AI仍存在阅片时间等方面的问题,主要问题在于AI用户测试中缺乏放射科医生参与导致整合性和可用性低。AI开发应将用户训练和工作流程整合等纳入考虑,有助于AI更好应用于临床。目前通过图像预处理技术[如直方图均衡化(HE)、对比限制适应性直方图均衡化(CLAHE)以及非锐利掩膜(UM)],许多检测CXR异常的AI方法已经有了具有前景的进展,但应用于来自不同机器的不同图像特征时这些方法受到了一定限制。Shin等提出了一种基于X射线物理的数据增强(XPA)技术,发现应用XPA的AI模型诊断性能在不同的扫描机器上都优于未应用的模型。
要在临床中发挥AI的价值,还应该关注其应用在不同类型患者上的差异。Sourlos等比较了商用AI软件和放射科医生检测肺气肿患者和非肺气肿患者胸部CT上肺结节的能力,发现在非肺气肿患者中,AI检测肺结节的能力优于放射科医生,但在肺气肿患者中,尽管AI敏感度较高,但假阳性率也较高,因此诊断能力不如医生。不同软件之间诊断也有所差异。Hsiao等比较了三种AI软件ClearRead CT v5.6.3(Riverain Technologies,Miamisburg,OH)、InferRead Lung CT.AI vR12(Infervision Technology,Philadelphia,PA)和Lung AI(MICA v29.8,Research Model:AMM7;Arterys,Redwood city, CA)在胸部CT上检测肺转移癌患者肺结节的能力,发现三种软件检测的结节与放射科医生报告的结节有很大差异,尽管Infervison检测到的结节数量最多,但Arterys检测到的结节在最终报告中的占比最大。
Chalil等利用2000例CXR(训练集:验证集=80:20)对预先训练的卷积神经网络(CNN)进行迁移学习,用于检测胸片上的医疗设备或其他异物并进行分类,发现训练过的模型可以较准确地进行分类,未来需要进一步更大量的数据集对其进行训练以提高模型性能。在CXR上检测和测量气管导管(ETT)的AI工具主要应用于放射科。Bera等比较了ICU医生在有和没有AI辅助的情况下检测和测量ETT的差别,发现使用AI后医生诊断的敏感度和特异度都有所提高,平均诊断时间缩短了约52%,75%的受试者表示希望在临床实践中使用AI。
高分辨率(HR)数据可以提高深度学习(DL)模型的诊断性能。Yanagawa等分别基于正常分辨率(NR,矩阵512×512,层厚0.5 mm)和HR(矩阵2048×2048,层厚0.25 mm)CT图像数据开发了两个预测浸润性肺腺癌(IVA)的DL模型,发现在训练集和测试集中,HR模型的AUC均明显高于NR模型(P<0.05),放射科医生在使用HR模型的情况下,诊断的准确率和敏感度相比于未使用时明显提高。
DL重建(DLR)方法可以提高图像质量。Ota等回顾性收集了20例急诊胸部CT图像,并用运动伪影矫正DL重建(MC-DLR)方法进行重建,并由几位放射科医生和技师独立随机地对运动伪影进行评分,结果发现使用MC-DLR重建的图像评分相比于未使用的显著降低。急诊患者通常难以采集到高质量的CT图像,而MC-DLR能有效减少后处理图像中的运动伪影,提高图像质量。Takenaka等分别用混合迭代重建(Hybrid-IR)和DLR方法对40例患有肺部疾病患者的标准[CT剂量指数体积(CTDIvol):9.0±1.8mGy]、减量(CTDIvol:1.7±0.2mGy)和超低剂量(CTDIvol:0.8±0.1mGy)CT(SDCT、RDCT和ULDCT)的高清CT(HDCT)进行了重建并分析比较,发现DLR获得的CT图像信噪比(SNR)明显高于Hybrid-IR(P<0.0001),且在ULDCT中DLR对病灶的检出能力优于Hybrid-IR。Lv等发现相比于自适应统计迭代重建(ASiR-V)算法,DLR算法结合低管电压(100 kVp)可以显著降低胸部CT扫描的辐射剂量,联合图像增强滤波器(LU)可以明显降低图像噪声,提高图像质量。Wang等对60位患者的常规剂量CT(RDCT)和低剂量CT(LDCT)图像进行了分析,RDCT使用Hybrid-IR算法重建,LDCT分别使用Hybrid-IR和DLR算法重建,发现DLR重建的LDCT的整体图像质量明显优于Hybrid-IR(P<0.001),与RDCT相当。
Cho等开发了一个基于DL的自动预测算法(DLLV),可以根据CXR预测左心室射血分数(LVEF)。在测试集中,DLLV预测患者LVEF≤35%和≤50%的AUC分别为0.79和0.80,根据DLLV结果有选择性地建议超声心动图检查可减少70%的检查,而DLLV不建议超声心动图检查的患者中,仅有0.1%的患者LVEF异常。DLLV可对需要超声心动图检查的患者进行预筛,减少不必要的检查。
最近大型语言模型(LLMs),如ChatGPT和Google Bard已被广泛应用,带来许多益处,但也存在一些问题。Rahsepar等分别在ChatGPT和Google Bard提出了关于肺癌预防、筛查以及影像报告中常用术语(基于美国放射学学会和Fleischner学会的Lung Imaging Reporting and Data System(Lung-RADS)v2022建议)的问题,发现ChatGPT回答时的准确率和一致性均优于Google Bard。尽管LLMs为医学等领域提供了新的可能性,但医疗决策的实施仍需要严格审查。Haver等评估了由ChatGPT生成的肺癌预防和筛查常见问题回答的可读性,得到的答案总体平均语言复杂度为49.7,总体平均可读性为12.6级,对于大众难以理解。在经过ChatGPT、GPT-4和Bard对这些答案进行简化后,语言复杂度和可读性得到优化。LLM的文本简化能够提高信息的临床适用性,有助于大众更好地获取健康信息。
影像组学
PD-L1表达决定了非小细胞肺癌(NSCLC)患者治疗方案的选择,其表达水平可用于评估患者免疫治疗后反应。Gong等从259例病理确诊的NSCLC患者术前平扫CT图像中提取了影像组学特征和DL特征,用于预测PD-L1表达,计算得到了每位患者的影像组学得分(Rad-score)和DL影像组学得分(DLR-score)。在训练队列和验证队列中,PD-L1表达的Rad-score AUC分别为0.786和0.702,DLR-score AUC分别为0.983和0.942,可非侵入性地预测PD-L1表达。Chen等收集了117例接受度伐单抗治疗的晚期NSCLC患者的治疗前(n=117)和治疗后(n=79)CT图像,并提取了影像组学特征,发现治疗后影像组学特征与临床特征结合的模型预测患者总生存期(OS)的能力最佳,治疗前影像组学特征模型的预测能力也优于单独的临床特征模型。
模型设计是成功构建模型的关键。Gordon等分别使用两种特征提取技术(从分割病灶中手工提取特征和预训练ResNet从最大肿瘤周围边界提取深度特征)构建了基于胸部CT预测NSCLC患者表皮生长因子受体突变状态(EGFRm+/-)影像基因组学的模型,发现使用手工提取特征通过主成分分析(PCA)过滤影像基因组学模型相比于深度特征表现出更好的预测能力和前瞻普适性。
肺泡间转移(STAS)会影响NSCLC患者手术方法的选择和患者的预后。Lou等回顾性收集了373例NSCLC患者的术前胸部CT和临床资料,构建了五个预测NSCLC STAS的模型:一个临床模型、两个影像组学模型(经典肿瘤影像组学模型和扩大肿瘤影像组学模型)和两个组合模型(经典肿瘤组合模型和扩大肿瘤组合模型),研究发现经典肿瘤影像组学和组合模型对STAS的预测能力相对较好,但扩大肿瘤兴趣区(ROI)并不能提高模型预测能力。
Huang等基于DL和影像组学提取了胸部CT上磨玻璃密度结节(GGN)的临床和形态特征及全肺影像特征,并利用反向传播神经网络构建5种预测良性和恶性GGN的模型,研究发现综合临床形态学特征、全肺影像组学特征和全肺图像特征(CMRI)的模型在内部验证集、外部测试集1和2中的AUC最高,分别为0.886、0.830和0.879。
酪氨酸激酶抑制剂(TKIs)是复发或晚期不可切除骨肉瘤(OS)患者的主要治疗手段。Zhou等回顾性纳入了90例OS肺转移患者的胸部CT图像,提取并生成了影像组学特征,利用影像组学特征和临床特征分别建立了两个多变量COX比例风险回归模型(R模型和C模型),并基于所有特征建立了多维诺莫图(RC模型),用于预测OS患者的无进展生存期(PFS)。研究发现R模型和RC模型预测PFS的能力均优于C模型,影像组学可用于预测接受TKIs治疗的OS患者的预后。
Zhang等开发和验证了一个基于增强CT评估胸腺上皮肿瘤(TET)侵袭性和组织学风险的影像组学和语义学诺莫图,对于Masaoka-Koga分期和WHO分类,联合模型分别整合了5个瘤周影像组学特征、4个语义学特征和5个瘤周影像组学特征、2个语义学特征,测试集上区分早期(I/II期)、进展期(III/IV期)和低风险(A/AB/B1型)、高风险(B2/B3/C型)TETs的AUC分别为0.958和0.857。结合了瘤周影像组学特征和语义学特征的诺莫图有助于确定晚期和高风险TET以及术前决策。
气道病变与慢性阻塞性肺疾病
Lee等基于胸部CT对重症哮喘患者治疗前后支气管扩张(BE)评分和黏液嵌塞(MI)程度进行可视化定量分析,发现治疗后MI范围变化的临床意义高于BE评分,其变化与管径10 mm的气道壁面积的平方根(Pi10)、肺功能检查(PFT)和嗜酸性粒细胞的变化相关,可通过对气道的定量分析和对MI程度的视觉分析评估患者治疗后的反应。
肺叶切除术后右肺中叶(RML)扭转可能危及患者的生命。Tamizuddin等分析了52例影像学疑似但并未扭转及6例确诊RML扭转的患者的CXR及CT的影像学特征,发现确诊患者影像更易出现反晕征、受累肺叶磨玻璃密度影(GGO)范围更广、冠状面上RML支气管和中间支气管之间的夹角更大,这些特征有助于放射科医生更早、更准确地诊断RML扭转,从而改善患者预后。
肺淋巴管畸形(PLM)在伴有淋巴-气道或肺泡漏时,乳糜漏会导致乳糜性肺炎和塑型性支气管炎,由于压力变化等原因气道中的气体会进入淋巴管,形成淋巴泡沫征(LBS),是高分辨率CT(HRCT)上诊断淋巴-气道或肺泡漏的特殊征象。Liu等回顾性收集了810例诊断为原发性肺淋巴瘤(PPL)的患者,其中62例伴有乳糜性痰和塑型性支气管炎的患者都有肺和(或)纵隔LBS,这些患者在之后1~6个月的随访中LBS呈动态变化。
Jorshery等对之前开发的基于CXR预测肺相关死亡率的CNN(CXR-Lung-Risk)进行了外部验证,用于评估其预测6年内慢性阻塞性肺疾病(COPD)高风险人群的能力。研究发现CXR-Lung-Risk与COPD的发生显著独立相关,且CXR-Lung-Risk与临床风险评分(TargetCOPD)联合预测的AUC(0.72)高于仅TargetCOPD预测的AUC(0.66)。CXR-Lung-Risk有助于识别COPD高风险的人群,有助于患者的早期干预。Park等使用AI分析了COPD患者胸部CT的支气管扩张评分,该评分反映了内气道相对于近端气道的异常变细程度(评分≥1.1可认为有气道扩张),研究发现支气管扩张评分、CT壁面积百分比和第一秒用力呼气容积(FEV1)在多变量分析中是COPD急性加重的重要预测因素(OR:1.12,95%CI:1.03-1.22,P=0.007)。使用AI自动量化支气管扩张程度可以预测COPD急性加重。
骨质疏松是COPD的主要合并症,也是椎体压缩性骨折(VCF)易发生的原因之一,而VCF导致的脊柱形态改变会影响肺的扩张从而影响肺功能。Nadeem等开发了一种基于DL自动评估VCF的方法,发现GOLD 2~4级的COPD患者VCF计数显著高于GOLD 0级的患者,女性患者的VCF计数较低,年龄与VCF计数呈正相关。
Lee等开发并验证了一种基于CXR检测肺气肿的深度神经网络,深度神经网络在内部测试集(n=184)、外部测试集1(n=491)和外部测试集2(n=559)中的AUC分别为0.90、0.90和0.87,可较准确地诊断肺气肿。
肺弥漫性疾病
Lee等应用基于DL的人体成分分析软件对特发性肺纤维化(IPF)患者基线和1年后胸部CT所示的T12~L1层面的平均脂肪面积和肌肉面积进行了计算,通过COX回归分析、Kaplan-Meier曲线及Log-rank检验评估了成分变化与预后之间的关系。研究发现,第一年病程中脂肪面积显著减少与患者的不良预后相关。Rothenberg等比较了全自动和半自动定量CT(QCT)生物标记物预测IPF患者无移植生存期(TFS)的准确性,研究使用全自动AI算法基于HRCT量化肺间质异常(ILA),包括全肺百分比(ILA-WL)和边缘百分比(ILA-R),并应用半自动测量得到肺表面不规则(PSI)评分,同时计算了由性别、年龄、肺功能测试结果组成的性别-年龄-生理学(GAP)评分。结果发现全自动AI算法的生物标志物在预测TFS方面的准确性高于PSI和GAP评分,可能可以作为IPF患者更准确的预后评估方法。Knopf等分析比较了端粒长度正常和缩短的间质性肺病(ILD)患者胸部HRCT影像进展的情况,发现端粒缩短患者的进展率更高,端粒长度与影像学进展显著相关。端粒长度可用于评估ILD患者的影像进展风险,从而对高风险人群进行密切随访或早期干预。
进行性肺纤维化(PPF)是指表现出进行性特征,除IPF外的其他ILD,可通过抗纤维化药物治疗。Cho等回顾性收集了75位确诊为ILD(除IPF外)并进行肺活检的患者,将患者分为PPF和非PPF,发现普通型间质性肺炎(UIP)病理类型与影像学上蜂窝样改变、牵拉性支气管扩张和网格样改变表现相关(P<0.001),牵拉性支气管扩张为PPF的唯一预测因素(HR=6.54,P=0.003),PPF(HR=3.96,P=0.013)和高龄(HR=1.13,P<0.001)与非IPF ILD患者死亡风险增加相关,提示及时开始抗纤维化治疗对改善患者预后的重要性。目前除了IPF,尚没有针对UIP病理类型的的HRCT诊断标准,而UIP是预测PPF的关键。Egashira等基于机器学习训练了一种基于HRCT预测UIP病理类型的AI,发现该模型在预测不同ILD UIP病理类型方面的能力优于经验丰富的放射科医生。
DL模型在不同CT成像参数中稳定性的不确定是其尚未广泛应用于临床的原因之一。Yu等比较了三个基于胸部CT将ILD患者分为IPF和非IPF的DL模型的能力,发现模型在应用于不同的CT成像参数时其预测性能有区别,预测性能的相关因素包括平均有效mAs、患者体位和扫描层厚。在开发AI模型并将其应用于临床时,应增强其泛化能力。Choi等基于自动化定量软件根据肺癌术前胸部CT图像将1199名患者分为正常组和ILA组,并评估了ILA范围,发现基于增强扫描评估的ILA范围要大于平扫,因此使用增强CT进行自动定量评估时,需要谨慎对待,以免对ILA过度诊断。
一氧化碳弥散量(DLCO)是IPF患者的重要功能指标,但有的患者难以配合这项检查。Chung等利用XGBoost机器学习算法,基于QCT的肺部结构和功能特征预测IPF患者1年后的DLCO,发现左肺区域通气指数(RRAVC)、高衰减面积百分比(HAA%)和气管壁增厚与较低的DLCO相关。
Marrocchio等利用量化软件(Aview, Coreline Soft,Seoul,Republic of Korea)对系统性硬化症(SSc)患者胸部CT显示的肺血管进行了定量分析,分析发现SSc患者的平均血管数、小于5 mm2的血管数和小于5 mm2的血管总体积与总血量(BV5/TBV)的比值均小于正常对照组,在SSc患者中,合并肺动脉高压(PH)患者的肺血管总表面积低于未合并PH的患者。定量CT可以检测SSc患者肺血管的变化,有助于对SSc病理生理机制的理解,并对其严重程度和预后进行评估。
特发性炎症性肌病相关性ILD(IIM-ILD)的急性加重(AE)会危及患者的生命,根据诊断标准,AE可分为特发性(I-AE)和感染性(iT-AE)。Zhang等回顾性分析了69例AE-IIM-ILD(I-AE34例、iT-AE35例)患者,发现特发性AE-IIM-ILD的预后优于感染性,而中性粒细胞百分比(NEU)与HRCT显示的GGO范围结合有助于区分两种患者(AUC为0.812),让临床医生为患者提供更合适的治疗方案。
HRCT不仅可以对ILD进行初步筛查,还可以用于评估疾病进展。Lee等回顾性收集了120例2013年3月-2021年2月至少进行了两次HRCT的原发性干燥综合征(pSS)患者的临床和影像学数据,研究发现基线HRCT无ILD的pSS患者(n=81)在随访期间(中位数2.8年)无ILD发生,pSS-ILD患者(n=39)中,约半数(19/39,48.7%)患者出现进展,呈缓慢逐渐恶化,CT表现为UIP(OR=15.237)和随访间隔时间(OR=1.403)是pSS-ILD进展的独立危险因素。
普通变异型免疫缺陷病(CVID)可能会并发肉芽肿性和淋巴细胞性ILD(GL-ILD),GL-ILD包括多种ILD异常,会导致CVID加重。Landini等回顾性收集了38位GL-ILD和38位非GL-ILD的CVID患者的胸部CT和PFT数据,发现GL-ILD最常见的影像学表现为支气管扩张、支气管壁增厚、黏液栓、树芽征、马赛克灌注等,CT网格样改变与PFT恶化相关,这些特征有助于诊断GL-ILD。
Grafham等利用自动化CT分析工具对肺移植患者基线和6个月时肺纹理和肺血管容积(PVV)的变化进行了分析计算,并研究了这些变化与慢性肺移植功能障碍(CLAD)发病的关系。非闭塞性细支气管炎综合征(BOS)型CLAD的PVV从基线到发病时有所增加,GGO及网格样改变也增加,而BOS型CLAD的PVV和肺纹理从基线到发病时无显著差异。PVV的增加与非BOS型CLAD的发病相关。
Kim等对肺纤维化合并肺气肿(CPFE)的影像学类型及其与预后的关联进行了研究,发现10%的吸烟相关性间质纤维化(SRIF)/脱屑性间质性肺炎(DIP)患者在一年后表现为进行性纤维化(PF),明显低于UIP患者(56%),进展速度最慢的类型是SRIF,其次是非特异性间质性肺炎(NSIP)和寻常性间质性肺炎(UIP)。尽管影像学类型与无肺移植存活率无关,但与纤维化进展相关,而纤维化进展是预测无肺移植存活率的重要因素。
肺淋巴回流病(PLRD)是一种罕见疾病,其特征是支气管-纵隔淋巴干发育畸形和/或胸导管出口异常。Hao等分析了580例PLRD确诊患者的HRCT和MSCT淋巴造影图像,发现86例表现为蛙卵征,其特征为弥漫性不均匀分布的GGO和多个不连续的小结节叠加。蛙卵征有助于放射科医生对PLRD引起的肺淋巴水肿和淋巴管扩张进行诊断,同时也有助于水肿程度的判断及临床分期。
弥漫性囊性肺疾病(DCLD)是以肺实质内弥漫分布含气囊腔为特征的一组肺部疾病,由于DCLD相对罕见,且与肺气肿等疾病表现相似,因此常被误诊。Noonan等提出了一种能识别和量化DCLD CT图像中囊性区域的模板匹配方法,并与放射科医生的手动标注结果进行比较,结果显示Dice相似系数、精确度、特异度和F1评分分别为86%、79%、99%和88%,模板匹配方法为DCLD提供了一种可靠、高效的评估手段。
肺结节与肺癌筛查
Tsepang等回顾性收集了71位经病理证实的SPN患者的双层光谱探测器CT静脉期图像,发现恶性组SPN的碘浓度(IC)值、肺动脉标准化IC(NICpa)、40 keV单色图CT值以及光谱HU曲线斜率明显高于良性组(P<0.05),双层光谱探测器CT有助于区分良性和恶性SPN。Pu等收集了109位接受过多次LDCT肺癌筛查且基线CT扫描时发现肺结节的患者,发现基于基线LDCT得到的皮下脂肪(SAT)和内脏脂肪(VAT)体积与结节倍增时间(DT)显著相关。身体成分特征可作为预测肺结节生长的生物标志物,有助于不确定结节的评估。Ma等将453例病理确诊的肺实性结节患者按结节相邻情况分为肺胸膜实性结节(PPSN)组和孤立性实性结节(ISN)组,使用DL模型Swin Transformer来预测结节良恶性,发现分组后ISN组预测的AUC高于分类前预测的AUC,而PPSN组AUC减低。使用DL模型时进行更详细的分类可能有助于提高预测能力。Staudte等对组织胞浆菌病流行地区的235例检查报告中包含“卫星结节”字样的胸部CT/CTA患者进行了分析,发现约86%伴有卫星结节的肺结节为良性病变,其他因素中,边缘毛刺征(OR=0.06,P<0.01)、转移性疾病或新诊断癌症史(OR=0.15,P<0.01)与恶性相关性最强,而支气管血管束结节、边缘光滑与年轻三种变量联合预测良性的性能最强(AUC 0.84,P<0.01)。因此在组织胞浆菌病流行地区,根据卫星结节和支气管血管束结节等预测肺结节的良恶性有助于指导随访计划。
Alam等分析了一家医院参加肺癌筛查(LCS)、Lung-RADS分级为4B/4X并因肺恶性结节手术治疗的患者手术延迟(LCS与手术间隔时间超过60天)的相关因素,发现手术延迟与就诊地点和区域中位收入相关。肺癌手术延迟可能恶化诊疗差距,尤其是对于来自低收入地区的患者。他们还收集了260例参加LCS并因肺结节进行手术治疗的患者的结节病理结果,发现15%为良性病变,病理主要为感染/炎症、瘢痕/纤维化和良性肿瘤等,尽管Lung-RADS指南应用于LCS中,但良性结节的手术治疗无法避免。
进展型部分实性结节(PSN)可能会发展为肺癌。Bondarenko等利用商业算法识别PSN,并通过放射学报告NLP来确认PSN进展与否,发现在多变量分析中,位于右肺中叶(OR=0.27,0.12~0.99,P=0.02)、年龄(OR=1.10,0.98~1.02,P<0.001)和分叶征(OR=1.53,2.77~6.50,P<0.001)是预测PSN进展的重要因素。商业算法与放射学报告NLP的结合有助于对PSN的识别和生长监测。Weng等利用PSN的影像组学特征和患者临床特征开发了一种用于预测PSN进展的ML模型,该模型在验证集上的AUC为0.78,可以识别进展性结节。
肺癌是癌症死亡的的首要原因,尽管有明确证据表明LCS有益,但肺癌筛查率仍较低。Zhao等利用CT和基于广角碳纳米管X射线的固定式数字胸部断层合成系统对带有肺结节的“LUNGMAN”模型进行了扫描,每个模型不同肺叶中随机放置3个不同密度的结节(-800 HU、-600 HU、+130 HU),CT和断层合成系统在检测可活检的结节方面特异度均为1,敏感度分别为0.958和0.850,断层合成系统的敏感度随肺结节密度的增加而增加,检测130 HU可活检结节的敏感度为1。该断层合成系统可能可以提高肺癌筛查率,其诊断能力及临床应用还需要更进一步的研究。Sandler等回顾性收集了两家医院32165位进行过乳腺X射线检查的患者,根据电子健康记录确定了符合LCS条件的1569位患者并通知其参加LCS,研究发现通过这样针对性地通知提高了LCS的参与率。
Trujillo等基于一个大型学术多中心机构的影像数据库评估了2021年美国预防服务工作组(USPSTF)LCS指南标准扩大对目标人群社会人口学特征和临床特征的影响,发现新的指南下,目标人群平均年龄和每年吸烟数量降低,LungRads Score(LRS)1和2占比增高,而3和4减低,2021-USPSTF指南可能有助于更早发现与吸烟相关的肺癌。
Kiraly等开发了一个辅助肺癌筛查的AI助手,并用627例(141例癌症阳性)病例对其进行了回顾行测试,研究发现在AI的帮助下,放射科医生诊断的准确性和特异性均有所提高。Fabritius等利用AI系统对100位肺结节患者随访前后胸部CT图像上的结节进行了匹配分析,发现AI的正确匹配率为97.8%,但在结节数量大于50个的图像中正确匹配率明显降低,肺实质、外周及血管旁结节的正确匹配率优于膈旁结节。AI有助于对肺结节患者随访的标准化评估,但也需要考虑结节数量和位置。
Yip等利用国家肺筛查试验(NLST)和国际肺癌研究协会(IASLC)两个数据库对其之前发表的随访时间延迟对早期肺癌预后影响的量化结果进行了验证,估算了不同体积倍增时间(VDT)的肺癌直径随随访时间延迟的变化,并评估了肺癌治愈率的下降情况,研究发现CT随访时间的间隔对患者的预后有显著影响,尤其是生长较快及体积较大的肺癌,因此应量化延迟随访对肺癌患者的影响,从而制定更好的管理方案。目前,LDCT Lung-RADS评分≤2分(良性)的患者的随访时间间隔为1年。Chaudhari等利用NLST数据集开发了一个基于胸部CT和临床特征预测患者2年内Lung-RADS评分进展情况的DL模型,与Lung-RADS进展至4分的显著相关特征包括平均结节大小、最大结节大小、结节数量和肺气肿,该模型有助于优化低风险患者的随访时间间隔。
Rau使用DL模型自动分割了NLS参与者基线和一年随访时胸部CT上的主动脉,并对大血管病变(最大直径、体积和钙化)进行量化,通过多变量COX比例风险回归分析评估了病变与心血管疾病死亡率之间的关系。结果发现,主动脉体积和钙化的预测价值显著高于最大直径,一年随访时钙化增加与心血管疾病死亡相关性最高。基于AI的大血管病变量化技术可以识别出心血管死亡高危人群,从而提早预防和治疗。Karout等比较了放射科医生和AI算法在LCS-LDCT上诊断及测量胸主动脉扩张和动脉瘤的性能,研究发现放射科医生诊断的AUC、敏感度和特异度分别为:升主动脉瘤0.86、72%和100%;主动脉扩张0.66、35%和97%;降主动脉瘤0.50、0%和99%,AI算法为:升主动脉瘤0.99、100% 和 99%;主动脉扩张0.86、82%和90%;降主动脉瘤0.93、94%和91%。AI算法可以优化在LCS-LDCT上对胸主动脉扩张和动脉瘤的诊断。
Pallasch等使用三维DL模型基于平扫胸部CT测量了参加肺癌筛查的26144位患者基线及一年后(n=52228)的SAT体积(SATvol)和密度(SATHU),发现SATHU与全因死亡率独立相关,且一年内SATvol和SATHU下降(≥10%)的患者相比于稳定的患者预后明显较差。自动化DL模型有助于肺癌筛查中高危人群的识别,可以优化患者管理。CXR-Lung-Risk是一种可以基于CXR预测肺相关死亡风险的DL模型。Walia等收集了24333名从不吸烟患者的常规门诊CXR对该模型进行了外部验证,将患者分为低、中、高风险组,主要结果为6年内肺癌发病率。研究发现,CXR-Lung-Risk分类为高风险组的患者肺癌患病率明显增加。目前,美国医疗保险和医疗补助服务中心(CMS)的肺癌筛查标准并不建议对从不吸烟者进行筛查,而CXR-Lung-Risk对不吸烟者中高患肺癌风险人群的识别具有一定的临床意义。
Su等使用相同管电压和管电流(120 kV,45 mA)和不同螺距和旋转时间(组0:0.984,0.28 s;组1:0.992,0.35 s;组2:0.992,0.28 s;组3:1.375,0.5 s;组4:1.531,0.5 s;组5:0.984,0.35 s)分别对包含9个模拟结节的Lungman模型进行了CT扫描,并用AI软件(智能4D胸部成像系统5.5,YITU医疗)对图像进行分析,发现不同螺距和旋转时间对图像质量、结节大小和CT值测量无影响,而对辐射剂量有影响,组0的剂量长度乘积(DLP)最低。在进行胸部LDCT筛查时,螺距和旋转时间采用0.984和0.28 s可以减低辐射剂量。Hata等使用传统CT(C-CT)和超高分辨率CT(UHRCT)收集了20例死亡人体的肺部图像数据,C-CT采用512矩阵、0.5 mm层厚和Hybrid-IR进行重建,UHR-CT采用了三种重建方法:UHR-512(与C-CT相同)、UHR-DLR(1024矩阵、0.25 mm层厚和DLR)和UHR-2048(2048矩阵、0.25 mm层厚和Hybrid-IR),并将CT图像评估的结节和气道与HE染色获得的组织学结果进行比较评分。研究发现,UHR-CT的评分均优于C-CT,错误率低于C-CT,在结节评估方面,UHR-2048重建方法优于UHR-DLR。UHR-CT相比于C-CT在评估结节和气道方面的能力更优。
本文来源:
谢开,等,放射学实践,2023
|
|