Adaptive graph learning with SEEG data:自适应图学习如何做 SOZ 定位

这篇文章总结 Guo 等 2025 年发表在 Biomedical Signal Processing and Control 的工作:Adaptive graph learning with SEEG data for improved seizure localization。它的核心问题很直接:SEEG 多通道信号能不能不靠手工定义 PLV、PDC、相关系数这类固定连接指标,而是让模型自己为每个病人、每个时间片学习一个更适合 SOZ 定位的功能网络?[1]

我的理解是,这篇文章的价值不在于“又做了一个 GNN”,而在于把两个过去常常分开的环节接了起来:先构建功能网络,再在网络上找异常节点。作者把这两件事放进同一个端到端框架里训练,因此网络的边权不是独立计算出来的静态指标,而是服务于后续发作预测和 SOZ 排名的自适应表示。

缩写表

缩写 全称 在这篇文章里的意思
SEEG stereo-electroencephalography 立体定向脑电,作为多通道颅内时间序列输入。
SOZ seizure onset zone 发作起始区,最终希望定位的异常脑区或电极通道。
FN functional network 功能网络,节点是 SEEG 通道,边表示通道间功能依赖。
FC functional connectivity 功能连接,用来描述通道间同步、影响或相似性。
GNN graph neural network 图神经网络,用于处理节点和边共同构成的功能网络。
GCN graph convolutional network 图卷积网络,用邻接矩阵聚合邻居节点信息。
LSTM long short-term memory 用来建模连续图快照之间的时间依赖。
TCN temporal convolutional network 时间卷积网络,用不同感受野提取单通道 SEEG 特征。
PLV phase locking value 常见手工功能连接指标,基于相位同步。
Corr Pearson correlation 常见手工功能连接指标,基于线性相关。
AP@K average precision at K 看排序前 K 个通道里 SOZ 命中质量。
MAP@K mean AP@K 对每次发作的 AP@K 再取平均。

论文想解决什么

传统 SEEG 辅助定位通常有两条路线。第一条是逐通道检测 biomarker,比如 HFO、spike、focal abnormality,然后按检测频率推断 SOZ。第二条是先用 PLV、PDC、DTF、相关系数等方法构建功能网络,再用图论指标或图模型找异常节点。

这两条路线的问题是:特征和连接指标大多是预先固定的。不同病人的电极覆盖、病灶位置、传播方式和信号质量差异很大,固定指标不一定能泛化。作者因此提出 Adaptive Spatial-Temporal GNN:每个 SEEG 片段先生成节点属性和自适应邻接矩阵,再用 GCN 和 LSTM 同时处理空间关系和时间演化,最后用 attention 权重给通道排序。

Adaptive ST-GNN 总览

图 1 怎么读。 左侧输入是一串连续 SEEG segment。图构建模块先为每个通道生成 attribute vector,也就是节点特征;再根据这些节点特征计算通道之间的 functional connectivity weight,也就是邻接矩阵。中间得到的是随时间变化的 attribute graph sequence。右侧的图分析模块用 GCN 聚合空间依赖,用 LSTM 建模时间依赖。训练目标不是直接监督每个通道是不是 SOZ,而是预测未来片段处于 interictal 还是 ictal。最后,readout attention 给每个通道一个重要性分数,用这个分数排序来推断 SOZ。

数学对象:把 SEEG 片段变成动态图序列

作者把一段 SEEG 序列写成一串图快照。每个图快照有节点属性矩阵和邻接矩阵:

这里 $N$ 是通道数,$D$ 是每个通道的特征维度,$V_{\tau}$ 保存第 $\tau$ 个时间片的节点特征,$E_{\tau}$ 保存通道间连接强度。模型学习一个函数 $f$,用过去 $T$ 个图快照预测当前片段标签:

这一步很关键:文章没有直接拿“SOZ 标签”训练每个通道,而是用发作预测作为 weak supervision。因为每个片段是否接近 ictal/interictal 更容易定义,而通道级 SOZ 标签更依赖临床解释。

单通道特征:IEEG-TCN 做节点属性

每个通道先单独进入 IEEG-TCN,得到一个属性向量 $v_i$。所有通道拼起来就是节点属性矩阵 $V$:

IEEG-TCN 特征提取结构

图 2 怎么读。 IEEG-TCN 的输入是单通道 SEEG segment。中间的 dilated causal convolution 用不同 dilation 扩大时间感受野,既能看到较短的尖波,也能看到较长的慢变模式。右侧示意 dilation 的效果:卷积核不是逐点连续滑动,而是隔着固定步长采样历史点。底部 temporal attention 把时间维度压缩成一个通道向量,这个向量后面会同时用于节点属性和邻接矩阵构建。

dilated causal convolution 可以写成:

式 (4) 里,$k$ 是卷积核大小,$d$ 是 dilation factor。$s-d\cdot i$ 表示只看当前点及其历史点,所以不会把未来信息泄漏进来。

TCN 后面接 gated mechanism:

$\tanh(\cdot)$ 产生候选信息,$\sigma(\cdot)$ 决定通过比例,$\odot$ 是逐元素相乘。直观说,它不是把所有卷积输出都无条件传下去,而是给每个位置一个门控。

temporal attention 把时间特征矩阵 $H$ 压缩成通道向量 $v$:

$\alpha$ 是不同时间点的权重。对 SEEG 来说,这很合理,因为一个 1 秒片段里并不是每个采样点都同样有用,模型需要更关注异常活动出现的时间段。

自适应邻接矩阵:边权来自节点特征相似性

这篇文章最重要的设计是邻接矩阵不再由 PLV、PDC 或 Corr 这类固定公式给出,而是由节点属性向量生成:

这里 $P$ 是可学习参数矩阵,$\tilde{E}{\tau}$ 是把节点属性投影后的 embedding。$\tilde{E}{\tau}\tilde{E}_{\tau}^{T}$ 本质上是在比较通道 embedding 的相似性;ReLU 去掉负值,Softmax 再把连接权重归一化。

这就是“adaptive graph learning”的核心:边权不再是外部先验,而是由模型在训练中学出来的。它的优势是能适应个体差异;代价是解释时必须检查学到的边是否符合临床或生理直觉。

图分析:GCN 处理空间,LSTM 处理时间

每个时间片的图先进入 GCN:

式 (8) 里,$E_{\tau}$ 决定哪些通道的信息会聚合到当前通道,$V_{\tau}$ 是节点特征,$W$ 是可学习权重。作者只用一层 GCN,目的是避免多层图卷积常见的 over-smoothing,也就是所有节点表示被过度混合。

GC-LSTM 图嵌入结构

图 3 怎么读。 每个时间片先做 spatial aggregation,得到当前图的空间表示;然后这些连续图表示按时间顺序进入 LSTM。LSTM 的 hidden state 把前面时间片的信息带到后面,因此模型不是孤立判断一个 segment,而是在看异常活动如何从过去演化到当前。

作者把时空嵌入写成:

$v_{\tau}$ 是节点属性,$z_{\tau}$ 是 GCN 后的空间嵌入,$x_{\tau}$ 是上一时刻信息生成的中间预测。这个组合让模型同时看到“这个通道现在像不像异常”和“这个异常是否沿着网络传播”。

片段标签和损失函数

数据构建时,作者以 seizure onset $t_0$ 为中心,把足够覆盖发作后的 window 标成 ictal,把发作前较长时间段抽样成 interictal。

SEEG segment 生成方式

图 4 怎么读。 中间红线是 onset。右侧 ictal segments 用较密的步长采样,左侧 interictal segments 来自 onset 前较长范围,并用较大的步长采样。这样做是为了平衡 ictal 和 interictal 样本,同时避免模型只学到某个极窄 onset 附近的模式。

标签规则可以写成:

作者还用了 label smoothing,避免模型对硬标签过度自信:

预测损失是交叉熵:

这里要注意:训练目标是 seizure prediction,不是直接做通道级 SOZ 分类。SOZ 排名来自 readout attention 的后处理。

从 attention 到 SOZ 排名

readout attention 对每个节点 $j$ 在每个时间片给一个权重 $\alpha_j^{\tau}$。作者把一个时间区间内的权重加起来,得到通道总体重要性:

$s_j$ 越高,通道越可能与 SOZ 相关。这个设计的逻辑是:如果某个通道对区分 ictal/interictal 一直很关键,它就更可能是发作网络里的关键节点。

结果:自适应图比固定图更稳

OpenNeuro 定位结果

图 5 怎么读。 这张图比较 OpenNeuro 数据集中不同病人的 AP@K 和 MAP@K。Adaptive ST GNN 在多名病人上优于 IEEG-TCN+ECC 以及固定 PLV/Corr 图的 ST-GNN,尤其在 AP@2 这种更严格的指标上表现更明显。临床上,前 2 个或前几个电极命中 SOZ 更有意义,因为医生不只关心“前 10 个里有没有”,而是关心模型能不能把最关键位置排在最前面。

定位结果可视化流程

图 6 怎么读。 作者把通道重要性映射回脑空间,再和手术靶区或影像位置比较。这个流程说明模型输出不是一个抽象分数表,而是可以变成医生能读的空间定位结果。需要注意的是,这种可视化依赖电极定位和配准质量,如果电极坐标或 MRI 配准有误,图上的空间解释也会受影响。

术后 MRI 对照

图 7 怎么读。 这张图把模型定位结果与术后 MRI 或手术靶区进行比较。红圈是手术目标区域,不同切片用于显示空间重合关系。它的意义不是证明模型能独立替代临床判断,而是说明模型 attention 高的区域在若干病例中能落到临床处理区域附近。

学习到的特征可视化

图 8 怎么读。 图中比较 interictal/ictal 的 attribute vectors 和 embedding features。原始属性空间里,红蓝点混合较明显;经过图嵌入后,ictal 与 interictal 的结构分离更清楚。这说明图分析模块不是简单搬运 TCN 特征,而是在邻接矩阵和时序建模后形成了更适合区分状态的表示。

历史序列长度影响

图 9 怎么读。 作者以 hup185 为例测试历史序列长度对定位性能的影响。结果不是“越长越好”,说明模型需要足够上下文,但太长可能带来噪声、冗余或训练难度。对实际项目来说,这提示我们不能只堆长上下文,应该把 segment 长度和历史窗口作为需要调参的临床工程参数。

连接密度分析

图 10 怎么读。 作者把学到的边分成 SOZ-SOZ、SOZ-OUT 和 OUT-OUT 三类,比较 interictal 与 ictal 阶段的 weighted connectivity density。关键观察是 SOZ-SOZ 连接更强,且发作过程中有进一步增强趋势。这个结果为模型提供了一层可解释性:它不是随便给 SOZ 通道高分,而是学到的网络结构与“SOZ 内部连接更紧密”的临床网络假说相符。

SOZ 通道 attention 随时间变化

图 11 怎么读。 这张图展示多个病例中 SOZ 通道 attention 随时间变化。较好的病例里,SOZ 通道权重在接近 ictal 阶段明显上升;中等或较差病例的趋势更不稳定。它提醒我们,attention 不是天然等同于病灶,但如果 attention 的时间变化能和发作演化对齐,就能增强模型解释的可信度。

这篇文章的强点

第一,自适应图构建解决了手工 FC 指标泛化差的问题。对于 SEEG 来说,不同病人的电极数量、覆盖脑区、病灶网络都不一样,固定 PLV 或 Corr 很难一套规则通吃。

第二,图构建和图分析一起训练,减少了两阶段方法里的断裂。过去常见做法是先算网络,再把网络丢给下游模型;这篇文章让网络本身为下游任务优化。

第三,作者不只报告分类准确率,还做了 SOZ 排名、术后 MRI 对照、学习特征可视化和连接密度分析。对于临床 AI 来说,这比单纯 AUROC 更有价值。

需要谨慎的地方

第一,attention 权重不是因果解释。通道对分类重要,不等于它就是发作起点。它可能是传播节点,也可能是和 SOZ 高度同步的节点。

第二,训练任务是 seizure prediction,SOZ 是通过 attention 后处理得到的。这个 weak supervision 很实用,但也意味着模型可能偏向“最能区分 ictal/interictal 的通道”,而不一定是最早起始的通道。

第三,个体化训练依赖每个病人有足够发作记录。作者也提到,发作数量不足会限制模型学习不同 onset pattern 的能力。

一句话总结

这篇文章可以理解为:用 TCN 把每个 SEEG 通道变成节点特征,用可学习相似性生成每个时间片的自适应功能网络,再用 GCN-LSTM 建模网络状态从 interictal 到 ictal 的演化,最后用 attention 排名推断 SOZ。它最适合放进“SEEG 功能网络 + 深度学习定位”的 benchmark 里,作为从手工连接指标走向自适应连接学习的代表。

参考文献

[1] Guo J, Feng T, Wei P, Huang J, Yang Y, Wang Y, Cao G, Huang Y, Kang G, Zhao G. Adaptive graph learning with SEEG data for improved seizure localization: Considerations of generalization and simplicity. Biomedical Signal Processing and Control. 2025;101:107148. doi: 10.1016/j.bspc.2024.107148.