FSE-Mamba: 频率-空间纠缠 Mamba 模型用于视网膜血管分割

FSE-Mamba: 频率-空间纠缠 Mamba 模型用于视网膜血管分割

_

作者与机构

- 作者:Xutao Sun, Junwen Liu, Xiaolu Xu, Jingyi Zhou, Yonggong Ren(通讯作者:ryg@lnnu.edu.cn)

- 机构:辽宁师范大学计算机与人工智能学院,中国辽宁大连

- 期刊:Computers in Biology and Medicine, 卷196, 2025年, 文章编号110776

- 关键词:视网膜血管分割、视觉状态空间模型、频率学习

- 代码:https://github.com/MrxutaoSun/FSE-Mamba

摘要

视网膜血管像素级分割在临床和研究中面临挑战。Mamba 方法虽有全局感受野和线性复杂度,但因果约束导致方向偏置,且忽略频率-空间协同学习。本文提出 FSE-Mamba,包括 FSCM(解决方向约束并增强频率引导)、MSFPM(多尺度频率感知降低像素相似性)和 DSEA(双域纠缠注意力融合特征)。在 DRIVE、CHASE_DB1、STARE 和 FIVES 数据集上,FSE-Mamba 优于现有方法。

引言

视网膜血管分割对糖尿病视网膜病变等疾病诊断关键,但结构复杂、低对比度挑战大。U-Net 受限于局部感受野,ViT 计算复杂。Mamba 提供线性复杂度,但因果扫描限全局依赖,且单一空间域易受干扰。本文引入频率域,提出 FSCM、MSFPM 和 DSEA 模块,首次整合频率信息的 Mamba 模型,提升血管辨识。

相关工作

视网膜血管分割

U-Net 及其变体(如双编码器)主导,但 CNN 限长距离依赖。ViT 变体(如 SGAT-Net、TP-Net、GKE-TUNet)整合注意力或拓扑信息改善。

Mamba 在医疗图像分割

U-Mamba、VM-UNet 等结合 SSM 提升长距离依赖,但因果机制限全局理解。本文 FSCM 和 MSFPM 解决这些。

频率学习

频率域增强特征表示(如 FCANet、GFNet)。XNet、SFFNet 和 FAM-Net 分解高低频,但忽略频带依赖。本文 FDGA 和 MSFPM 提升跨频建模,DSEA 融合双域。

方法

框架架构

FSE-Mamba 为 U-Net 式:FSCM 提取分层特征,MSFPM 精炼频率,DSEA 融合双域,经解码器输出预测。

架构图.jpg

FSE-Mamba 为 U-Net 式:FSCM 提取分层特征,MSFPM 精炼频率,DSEA 融合双域,经解码器输出预测。

相关模块

  1. FSCM

并行分支:一分支用 MSAA(多尺度轴向注意力)和 FDGA(频率引导注意力)替换卷积,解决因果约束;二分支线性增强。公式包括 FFT/IFFT 和注意力计算。

  1. MSFPM

多尺度卷积 + FFT + 三重池化捕捉频带依赖。

  1. DSEA

双 DRA 单元交换输入,交叉域逆注意力抑制冗余。

1.2模块图.jpg

实验

数据集

DRIVE (40 图)、CHASE_DB1 (28 图)、STARE (20 图)、FIVES (800 图)。增强包括翻转、旋转。

实现细节

PyTorch 2.1.1,RTX 4090,批次 8,Adam 优化,学习率 0.0001,100 迭代。

与 SOTA 比较

在 DRIVE 等数据集上,F1、ACC 等优于 U-Net、ViT 和 Mamba 变体。统计 t-检验确认显著性。参数 36M,推理 0.015s/图。

1.3实验数据.jpg

不同疾病比较

在 FIVES 上,AMD/DR/GC/正常眼均优,平衡 SE/SP。

消融研究

验证 FSCM、MSFPM、DSEA 有效;并行优于串行;默认序列最佳;VMamba 解码器优。

1.4消融实验5.jpg

结论

FSE-Mamba 通过双域整合提升分割精度。未来优化动态轴权和轻量变体。

一种利用特征交互与融合的有效 UNet 用于医学图像中的器官分割 2026-01-19

评论区