中国石油大学计算机科学与技术学院的Yecong Wan等人提出了一种利用模糊学习的跨图像像素对比学习网络CPCNet

2025年
CPCNet:一种更准、更快、更轻的医学图像分割模型
– Neurocomputing–
在AI辅助诊断的时代,医学图像分割是定位病灶、量化分析的关键步骤。然而,现有方法常面临两大难题:一是模型越来越深、越来越复杂,计算成本高昂;二是忽略了像素语义中类间相似性和类内变异性的深入探索,导致分割精度遇到瓶颈。为了克服上述限制,中国石油大学计算机科学与技术学院的Yecong Wan等人提出了一种利用模糊学习的跨图像像素对比学习网络CPCNet,以利用全局图像像素表示之间的判别关系。
CPCNet的核心目标,是在不增加额外计算开销的前提下,显著提升医学图像分割的精度。它主要包含两大创新点:一方面,模型基于模糊交叉图像像素对比学习,不再局限于单张图像内部,而是在整个训练集的全局像素之间建立对比关系,让病灶像素彼此靠近,与背景像素远离,从而学习到更具判别力的像素表示。另一方面,CPCNet是一种高效混合网络:微观层面融合了卷积神经网络和 Transformer,既能捕捉局部上下文信息,又能建模长程依赖关系,且网络结构非常紧凑、轻量。实验表明,CPCNet 在息肉分割、皮肤病灶分割和乳腺超声分割等多个任务上,性能均超越了现有最先进的方法,并且其对比学习机制可以无缝集成到其他网络中,带来“即插即用”的性能提升。

研究背景
医学图像分割是计算机辅助诊断系统中的关键一环。传统方法依赖颜色、纹理等低层特征,效果常不尽人意。卷积神经网络的兴起开启了新纪元,U-Net等架构成为主流。
然而,CNN固有的局部连接特性限制了其建模长程依赖的能力。随后,研究者尝试引入Transformer。虽然基于 Transformer的方法在捕获全局信息上表现出色,但它们的计算复杂度通常较高。当前的主流方法存在三个明显局限,现有的CNN-Transformer融合网络多在宏观层面进行并行或串联堆叠,未能在微观模块层面实现优势互补。另外,为了提升性能,模型设计趋于复杂,导致参数量和计算量巨大。一些模型未能充分探索像素表征空间的类间相似性和类内变异性,而这正是提升分割鲁棒性的关键。
因此,研究团队提出一种新的分割框架RefineCatDiff,旨在利用扩散模型对细节的强大刻画能力,来通过粗略的分割结果细化为更精确的分割结果。即模型通过优化和提升现有CNN或ViT分割模型的输出结果,以应对复杂医学图像下的高精度分割挑战。
模型架构
图 1 CPCNet网络结构示意图。
CPCNet的整体网络架构遵循U形架构,每个特征提取单元都是一个精心设计的高效混合模块,可以自适应地提取短程和长程依赖关系,以充分利用焦点特征。 此外,模型使用像素级对比学习策略,以进一步探索类内和类间像素的语义关系并增强模型表示能力。 受益于定制的高效混合块和跨图像像素对比学习机制,CPCNet 可以有效实现病变的精确分割
与仅在单张图像内进行对比不同,CPCNet 提出的跨图像像素对比学习机制旨在挖掘整个训练集中所有像素之间的判别关系。其核心思想是:在特征表示空间中,拉近同类像素(如都是病灶),推开不同类像素(如病灶与背景)。为实现这一目标,研究团队设计了几个关键策略,首先,模型使用模糊过滤的锚点采样不是随机采样所有像素,而是根据网络预测的“模糊隶属度”,重点关注那些难以分类的边界像素。例如,将属于病灶类别但预测置信度低的像素选为“困难锚点”,使网络学习更具边界敏感性的表征。
在计算对比损失时,并非使用所有正/负样本,而是从一个大型记忆库中,根据样本与锚点的相似度,挑选出最难区分的 Top-K 个正样本和负样本。这能让学习更高效、更有针对性。另外,模型用于生成对比学习表征的“投影头”仅在训练时使用,在测试阶段被丢弃,因此不会增加任何额外的计算负担。
结果一、脑肿瘤多子区域分割任务
表 1 息肉分割数据集的定量结果。


图 2 息肉分割任务的结果可视化。
息肉分割的量比较的结果如表1所示,清楚地表明CPCNet与其他最先进的方法相比获得了明显更好的性能。以Kvasir 为例,CPCNet模型比之前最好的基于 Transformer的模型TransUnet提供了 0.015的性能增益。与基线U-Net相比,CPCNet显示出优异的表示能力,观察到 mIoU增加了0.126。值得注意的是,即使没有添加所提出的对比学习机制,EHNet也能实现最先进的性能,这证明了混合网络的有效性。
另外,图1直观地展示了一个具体案例定性分析的结果。无论是在整体还是细节层面观察,CPCNet都会生成与真实情况最相似的掩模。对于较大的ED区域,模型生成的掩模最大程度地覆盖了该区域,同时准确地定义了其与周围组织的边界,如第一个示例所示。关键区域例如一些较小的NET区域,模型能够有效地分割细节,对比而言,其他模型不具备这些功能。
结果二、皮肤病变分割任务
表 2 皮肤病变分割数据集的定量结果。


图 3 皮肤病变分割任务的结果可视化。
皮肤病灶分割在黑色素瘤的诊断和手术中起着至关重要的作用,由于皮肤病灶和正常皮肤之间的微小差异,实现精确分割往往仍然具有挑战性。实验中评估了 CPCNet在三个皮肤病变分割数据集(ISIC2017、ISIC2018和PH2)上的性能和通用性。表2给出了定量比较结果。如表所见,EHNet和CPCNet在所有数据集上的Dice和ACC指标上获得了一致的性能改进,并且在SE和SP指标上获得了更好的权衡。另外,SE和SP并不是越高越好,在实践中,需要做出更好的权衡才能获得更好的性能。
CPCNet模型可以在每个特征处理阶段自适应地捕获和融合局部全局依赖性,以实现焦点区域和皮肤区域的区分性分离,而以前的方法在建模此类互补特征方面存在局限性。通过添加我们提出的跨图像像素级对比学习机制,CPCNet在 Dice指标上比EHNet模型平均提高了0.01。这种机制只需要训练时间的增加可以忽略不计,而不会影响推理速度。
结论与意义
CPCNet通过创新的模糊交叉图像像素对比学习和高效混合网络设计,为医学图像分割提供了一种更准、更快、更轻的解决方案。一方面,CPC机制使网络能够利用整个数据集的全局像素语义信息,学习到边界更清晰、鲁棒性更强的像素表征。另一方面,EHNet在微观层面实现了CNN与Transformer的互补,以紧凑的参数量同时获取了局部和全局信息。另外,模型对比学习机制被证明可以作为一个“即插即用”的组件,无缝集成到 U-Net、TransUNet 等多种现有网络中,稳定提升其性能。这项工作表明,在医学图像分割领域,探索数据本身的结构化信息与设计高效的网络架构同样重要。未来,将 CPC 机制应用于半监督或无监督学习场景,以缓解医学图像标注数据稀缺的难题,是一个极具潜力的方向。这也将为 AI 在更广泛的医疗影像分析中的应用铺平道路。


科学如同大海,要求奋不顾身的拼搏。
——兰道
THE END
医工交叉园地交流群,欢迎扫码加入

点击左下角“阅读原文”即可跳转至文献主页。
复制以下链接即可获取文献原文(.pdf):
https://s.caixuan.cc/LUJTMh7g:PDESenyWOyVD
仅用于学术分享,如有侵权,请联系删除。