Interpretable Transformer Models for rs-fMRI Epilepsy Classification and Biomarker Discovery

Andrew Jeyabose
Varina L. Boerwinkle
Belfin Robinson
Olivia Leggio
Meitra H Kazemi

Read the full article

Discuss this preprint

Start a discussion What are Sciety discussions?

Listed in

This article is not in any list yet, why not save it to one of your lists.

Abstract

Background

Automated interpretation of resting-state fMRI (rs-fMRI) for epilepsy diagnosis remains a challenge. We developed a regularized transformer that models parcel-wise spatial patterns and long-range temporal dynamics to classify epilepsy and generate interpretable, network-level candidate biomarkers.

Methods

Inputs were Schaefer-200 parcel time series extracted after standardized preprocessing (fMRIPrep). The Regularized Transformer is an attention-based sequence model with learned positional encoding and multi-head self-attention, combined with fMRI-specific regularization (dropout, weight decay, gradient clipping) and augmentation to improve robustness on modest clinical cohorts. Training used stratified group 4-fold cross-validation on n=65 (30 epilepsy, 35 controls) with fMRI-specific augmentation (time-warping, adaptive noise, structured masking). We compared the transformer to seven baselines (MLP, 1D-CNN, LSTM, CNN–LSTM, GCN, GAT, Attention-Only). External validation used an independent set (10 UNC epilepsy cohort, 10 controls). Biomarker discovery combined gradient-based attributions with parcelwise statistics and connectivity contrasts.

Results

On an illustrative best-performing fold, the transformer attained Accuracy 0.77, Sensitivity 0.83, Specificity 0.88, F1-Score 0.77, and AUC 0.76. Averaged cross-validation performance was lower but consistent with these findings. External testing yielded Accuracy 0.60, AUC 0.64, Specificity 0.80, Sensitivity 0.40. Attribution-guided analysis identified distributed, network-level candidate biomarkers concentrated in limbic, somatomotor, default-mode and salience systems.

Conclusions

A regularized transformer on parcel-level rs-fMRI can achieve strong within-fold discrimination and produce interpretable candidate biomarkers. Results are encouraging but preliminary larger multi-site validation, stability testing and multiple-comparison control are required prior to clinical translation.

Version published to 10.1101/2025.09.02.25334737 on medRxiv
Sep 4, 2025

Graph-Neural-Network-Based Brain Connectivity Analysis for Early Detection of Long-COVID Cognitive Impairments Using MRI/fMRI

This article has 3 authors:
1. Supriya Dubey
2. Jitendra Singh
3. Manish Bhardwaj
This article has no evaluationsLatest version Jan 19, 2026
ShiPMAN: A Self-Learnable Sparse Hierarchical Pattern and Multi-Attention Network for Interpretable Brain Connectivity in Autism

This article has 4 authors:
1. Shivani Rohilla
2. Abhyudaya Tak
3. Mahipal Jadeja
4. Pilli Emmanuel Shubhakar
This article has no evaluationsLatest version Jan 14, 2026
Integrating Structural Brain MRI and Clinical Phenotypes for Automated ADHD Diagnosis: A Multimodal Deep Learning Approach

This article has 2 authors:
1. Soumyadip Roy
2. Ratnakar Dash
This article has no evaluationsLatest version Jan 8, 2026

Discuss this preprint

Listed in

Abstract

Background

Methods

Results

Conclusions

Article activity feed

Related articles

Graph-Neural-Network-Based Brain Connectivity Analysis for Early Detection of Long-COVID Cognitive Impairments Using MRI/fMRI

ShiPMAN: A Self-Learnable Sparse Hierarchical Pattern and Multi-Attention Network for Interpretable Brain Connectivity in Autism

Integrating Structural Brain MRI and Clinical Phenotypes for Automated ADHD Diagnosis: A Multimodal Deep Learning Approach