深度学习在膀胱癌病理学中的研究进展

【www.zhangdahai.com--其他范文】

郑庆源,杨瑞,王磊,陈志远,刘修恒

膀胱癌(bladder cancer,BLCA)是全球十大最常见的癌症之一,是泌尿系统发病率最高的恶性肿瘤[1]。据最新公布的全球癌症数据(GLOBOCAN 2020)报道,2020年新发病例约有57.3万例,死亡病例约为21.3万例[2]。非肌层浸润性膀胱癌(non-muscular invasive bladder cancer,NMIBC)患者的5年生存率约为90%,但随着肿瘤侵犯膀胱的不同层次,BLCA患者不仅5年生存率急剧下降,对治疗的反应差异也很大[3]。因此,对BLCA的准确识别和诊断有助于后续的个性化治疗,也是实现精准医疗的关键步骤。目前,BLCA的诊断主要由病理学家通过组织活检确定,也以此作为后续治疗的基石[4]。然而,一张病理切片图像所包含的丰富信息并不能完全被病理学家所解读,并且在解读过程中容易受到主观因素的影响。随着人工智能(artificial intelligence,AI)的出现和数字病理学的发展,允许我们使用计算的方法来分析数字化的全切片图像(whole slide imaging,WSI)[5]。本文就深度学习(deep learning,DL)技术在BLCA病理图像处理和分析中的研究进展、局限性和展望作一综述,以期为广大同行及学者提供参考和新的研究思路。

AI是计算机科学的一个分支,它试图通过开发计算机的智能,以模仿人类的工作和思维方式。机器学习(machine learning,ML)是AI的一个组成部分,它可以从大量数据中手动测量一组事先预定的特征,借以构建模型。DL是ML的一个子类,它通过类似于生物神经系统的结构方式来处理和分析信息,其类型包括卷积神经网络(convolutional neural network,CNN)、循环神经网络和前馈神经网络等。CNN是目前使用最为广泛的DL算法,它受到哺乳动物大脑视觉皮层的启发,在图像处理和分析方面有着强大的能力。通常CNN的架构包括卷积层、池化层和全连接层,通过反向传播算法可以自适应地从输入的图像中不断提取特征,进而聚合形成高阶结构关系,以识别感兴趣的区域[6]。

随着近几年DL的兴起,数字病理学得到了迅猛发展。病理学中的AI模型已经从最初始的人工模式发展到传统的ML,然后发展到DL[7]。人工模式依赖于病理学家定义的规则,传统ML需要根据病理学家的先验知识定义特征,而DL可以直接从原始数据中学习相关特征来训练高性能模型。相比于传统的病理图像识别技术,DL方法具有较高的准确性并且更容易在临床实践中应用,有着明显的优势。目前DL已被应用于各种病理图像处理和分类,包括疾病诊断[8]、检测[9]、分割[10]、预测预后[11]和复发[12]等。这些研究表明借助DL技术可能有助于克服病理学家主观视觉评估的局限性,并且缓解病理学家资源相对匮乏的局面[13]。

早期NMIBC患者的5年生存率可达90%左右。然而,当疾病进展到肌层浸润性膀胱癌(muscleinvasive bladder cancer,MIBC)时,生存率急剧下降。降低BLCA的死亡率,早期发现和适当治疗至关重要,而精准高效的病理识别和诊断是实现这一目标的关键。目前,传统上病理诊断主要依靠病理学家手动完成。这种传统工作模式存在难度高、主观性强、可重复性差和耗时繁琐等缺点,已然成为日常实践中较为突出的矛盾点,需要进行优化和改善。因此,越来越多的研究通过DL技术开发简单方便且可靠的方法,以辅助病理学家进行疾病的诊断和识别。

Noorbakhsh等[14]使用DL技术对19种癌症的WSI进行了肿瘤识别、亚型和突变分类。他们的数据集是来自TCGA数据库的27 815张HE染色的WSI图像。结果显示,DL模型对BLCA分类的准确率高达98%以上,并且在大多数癌症类型上进行训练的分类器也可以成功识别BLCA,工作特征曲线下面积(AUC)为98%。Jansen等[15]基于DL技术训练了一个U-Net分割神经网络用于自动检测尿路上皮和一个分类神经网络用于对NMIBC的准确分级。他们从三个不同中心纳入了232例NMIBC患者,共获取了328份肿瘤标本,并对其进行HE染色后数字化扫描成WSI。结果表明,通过结合U-Net分割网络和分类网络,可以实现对NMIBC的自动检测和分级,其准确度与病理学家相当。

BLCA根据肿瘤侵犯膀胱的不同层次,分为NMIBC和MIBC。目前,MIBC已经确定了不同的分子亚型,包括管腔样、基底样和神经元样[16]。由于不同亚型的MIBC对治疗方法有不同的反应,且与预后相关,因此准确识别MIBC的不同亚型在疾病的诊疗中非常重要。但是目前临床上现有的分子亚型分层方法往往耗时长,且经济成本高,限制了MIBC分子亚型在临床中的应用。DL技术在医学领域的迅速发展或可解决此问题。

Woerl 等[17]利用DL 技术从苏木精和伊红(HE)载玻片中预测MIBC患者的分子亚型(基底样、管腔样、P53样以及全阴性型),并将预测结果与病理学专家的诊断结果进行了比较。他们从癌症基因组图谱(TCGA)数据库中收集了363张WSI作为训练集,使用5折交叉验证的策略训练模型,并在独立队列中进行了验证。结果显示,DL模型在验证集的平均准确率高达70%,比病理学家的判读结果更加准确。因此,该研究还利用类激活图可视化技术进一步分析了DL模型对于不同分子亚型肿瘤的感兴趣区域,以研究与每种分子亚型最相关的病理学特征。结果表明,DL模型对于全阴性型肿瘤所关注的病理学特征大多数为具有致密和深染的细胞核;
基底样肿瘤往往具有多形性的细胞核和多个核仁;
管腔样肿瘤常为乳头状生长;
而p53样肿瘤则表现为具有弥漫性浸润的单个肿瘤细胞和一些促纤维间质。由此可见,DL模型的可视化技术可以帮助我们更好地理解神经网络的关注区域是否符合现有的病理学知识,并可能提供之前从未被评估过的病理学特征,也进一步增加了模型的透明度和可信度。

Khosravi等[18]利用DL技术有效地对四种类型癌症的组织病理学图像进行了分类,其中包括BLCA。他们收集了来自斯坦福组织微阵列数据库和TCGA数据库的组织病理学图像,证明DL方法在区分不同癌症组织、亚型、免疫组织化学标记及其表达评分方面的强大能力。

尽管NMBIC患者的五年生存率高达90%,但疾病复发率较高。准确预测NMIBC的复发和进展是管理患者的关键。目前对具有较高复发和进展风险的患者,可以采用欧洲癌症研究和治疗组织(EORTC)[19]、西班牙泌尿肿瘤俱乐部(CUETO)[20]和欧洲泌尿外科协会(EAU)开发的分层工具进行评估。然而,有研究表明,EAU、EORTC和CUETO风险分层量表在预测BLCA的复发和进展方面仅表现出中等表现[21]。其中,EORTC和CUETO对复发的判别能力较低,高估了高危患者的复发风险[22-23]。此外,在这两个分层工具中都使用了肿瘤的组织病理学特征,这些特征容易受观察者之间高度变异的影响[24]。DL技术可以自动提取病理图像中潜在的生物学或病理组织学的特征,而不依靠传统的肿瘤分期和分级的信息,或许可以消除病理学家在阅片中所带来的主观差异。

Lucas等[25]将WSI与临床数据相结合,使用DL预测了NMIBC患者的1年和5年无复发生存率。他们在359例患者的1年随访研究队列和281例患者的5年随访研究队列中进行了探索。结果证明,相比于仅使用临床数据(AUC为57%)或图像数据(AUC为72%)的模型,他们的模型增强了对NMIBC患者5年内复发的预测,AUC为76%。

在临床诊疗中,尽管属于同一种病理亚型的BLCA,在分子水平上也可能存在差异,对治疗的反应也各不相同。其中,成纤维细胞生长因子受体(FGFR)抑制剂已被美国食品药品监督管理局批准用于MIBC的靶向治疗,但前提是需要有明确的分子检测。然而,分子检测并不是所有医院可具备的条件,同时也会加重患者的经济负担。最近有研究报道,DL技术可以通过WSI初步预测基因的突变情况[26]。这类方法拥有简单、快速、可靠和廉价的优点,可以很好地在临床实践中实现对肿瘤分子水平初步检测的应用。

Loeffler等[27]基于DL技术直接从WSI中检测了BLCA患者的FGFR3基因的突变情况。他们所使用的数据集是来自TCGA数据库的237例MIBC患者和来自独立队列的182例BLCA患者,收集这些患者的WSI和相应的遗传信息,结果表明,TCGA队列和独立外部队列中DL模型均能从WSI中准确预测出FGFR3的突变情况,AUC分别为0.701和0.725,优于泌尿病理学家。通过DL对BLCA患者的FGFR3突变进行简便的预筛查,有益于患者的早期检测和个性化治疗。

尿液细胞学检查是被广泛用于检测高级别尿路上皮癌(high-grade urothelial carcinoma,HGUC)的一项检查,其诊断标准是由巴黎第18届国际细胞学大会提出的巴黎尿液细胞学报告系统。在临床实践中,病理学家会在显微镜下手动扫描样本,通过检测HGUC细胞以做出最终诊断。然而,在尿液细胞学检查的病理诊断中同样存在观察者间变异的情况。随着数字病理的发展,这些尿液细胞学检查的病理载玻片可以进行巴氏染色后数字化扫描成WSI。目前,DL技术在BLCA尿液细胞病理图像中的研究也越来越多。在尿液细胞学检查期间,通过借助DL技术进行病理图像的识别和筛查,既可以提高日常工作效率以及降低漏诊和误诊率,也可以帮助泌尿外科医生制定后续的治疗策略。

Nojima等[28]从232例HGUC患者的巴氏染色尿细胞病理图像中开发了一个DL模型,用于筛查HGUC细胞。在良恶性病例的识别中,他们所训练的模型取得了出色的性能,AUC为0.989。此外,DL模型还可以进一步判断肿瘤是否具有侵袭性。通过可视化技术发现,DL模型进行核分级的诊断是基于HGUC的细胞核。在诊断基质侵袭中,细胞核的特点包括有皱缩的细胞核、颜色不规则和中性粒细胞浸润。在诊断核分级中,细胞核的特点为染色密集或核仁明显的粗染色质。此外结果表明,细胞核的大小似乎对模型的诊断没有贡献,且手动复测时也没有发现明显的差异。

Sanghvi等[29]基于2 405张存档的HGUC尿细胞学载玻片开发了一种能够准确分析尿细胞学病理图像的DL模型。结果证明,该DL模型可以通过缩短筛查WSI所需的时间来提高病理学家的工作效率,并且还可以提高诊断准确性,AUC为0.88。

Awan等[30]基于DL方法提出了一种用于识别HGUC尿细胞病理图像中非典型细胞和恶性细胞的方法。他们首先采用细胞分割和分类的方法,对非典型细胞和恶性细胞进行了识别,以计算出非典型细胞和恶性细胞个数在所有细胞中的占比。紧接着根据占比结果作为预测预后的因子,对HGUC患者进行风险分层。该研究纳入了398例患者的398张HE染色切片后对其进行分析,以自动预测每例患者的风险程度。结果表明,DL模型识别非典型细胞和恶性细胞的性能出色,AUC为0.99。通过对非典型和恶性细胞的计数作为预后因子,可以对HGUC患者进行较为准确的风险分层。

综上所述,AI中的DL技术在BLCA的病理诊断、疾病复发与进展和突变基因检测等方面展现出了良好的性能和较好的应用潜力。在一些研究中,DL算法所展现出的能力甚至可以与病理学家媲美。然而,DL的发展时间较为短暂,在病理学中的应用也仅处于起步阶段,仍然存在一些局限性和挑战:(1)数据集标准化问题。来自不同病理科的病理切片在样本采集、制作、染色和数字化扫描上存在着差异,这些异质性均可能会影响到DL模型的稳健性;
(2)模型可解释性差。DL模型由于其推理过程中缺乏可解释性,往往会破坏结果的可信度并限制其实际应用;
(3)可用数据集匮乏。训练一个可靠的DL模型往往需要强大的数据集,然而由于医学伦理要求严格保护好患者的隐私,许多数据不得被公开使用,因此难以获得足够多的数据支撑模型的精度。针对以上存在的挑战,未来可在以下方面进行解决:(1)建立起国内外统一的病理图像标准化制作程序和大型病理数据库;
(2)开展前瞻性实验纳入多中心数据以确保模型的泛化性和稳健性;
(3)进一步开发可解释、可通用的下一代人工智能方法,提高模型的透明度,打破现有深度学习“黑箱算法”的现状。尽管存在上述的局限性和挑战,但基于AI的DL方法在数字病理学方面的应用仍有可观的前景。随着科学的不断发展和进步,病理学家与AI的合作不仅可以提高诊断效能,而且也有助于辅助临床决策的制定,最终将会促进BLCA的精准诊疗,让更多的患者获益。

猜你喜欢亚型病理学病理病理诊断是精准诊断和治疗的“定海神针”保健医苑(2021年7期)2021-08-13开展临床病理“一对一”教学培养独立行医的病理医生中国毕业后医学教育(2020年5期)2020-12-06猪流行性腹泻病毒流行株感染小型猪的组织病理学观察上海农业学报(2017年4期)2017-04-10不一致性淋巴瘤1例及病理分析中华老年多器官疾病杂志(2016年9期)2016-04-28Ikaros的3种亚型对人卵巢癌SKOV3细胞增殖的影响中国病理生理杂志(2015年8期)2015-12-21冠状动脉慢性完全闭塞病变的病理学和影像学研究进展医学研究杂志(2015年6期)2015-07-01ABO亚型Bel06的分子生物学鉴定中国当代医药(2015年30期)2015-03-01WST在病理学教学中的实施卫生职业教育(2014年12期)2014-05-16HeLa细胞中Zwint-1选择剪接亚型v7的表达鉴定癌变·畸变·突变(2014年2期)2014-03-01提高病理学教学效果的几点体会中国中医药现代远程教育(2014年13期)2014-03-01

推荐访问:膀胱癌 研究进展 病理

本文来源:http://www.zhangdahai.com/shiyongfanwen/qitafanwen/2023/0911/652875.html

  • 相关内容
  • 热门专题
  • 网站地图- 手机版
  • Copyright @ www.zhangdahai.com 大海范文网 All Rights Reserved 黔ICP备2021006551号
  • 免责声明:大海范文网部分信息来自互联网,并不带表本站观点!若侵害了您的利益,请联系我们,我们将在48小时内删除!