Reliable CNN Evaluation in Medical Imaging via Variance-Aware Cross-Validation

Peter Abban
Mehdi Taassori

Read the full article

Discuss this preprint

Start a discussion What are Sciety discussions?

Listed in

This article is not in any list yet, why not save it to one of your lists.

Abstract

Reliable evaluation and generalizable hyperparameter selection remain critical challenges in deep learning–based medical image analysis, particularly under limited, imbalanced, and heterogeneous data conditions. This paper proposes a Variance-Aware K-Fold Cross-Validation framework for robust hyperparameter optimization of convolutional neural networks (CNNs). Unlike conventional single-run or mean-based cross-validation strategies, the proposed framework introduces a variance-regularized objective function that jointly maximizes mean validation performance while explicitly penalizing fold-to-fold variability, thereby promoting stability and generalization. The approach is systematically integrated with Bayesian optimization and Tree-structured Parzen Estimator (TPE) methods and evaluated across multiple optimization libraries, demonstrating its library-agnostic applicability. Extensive experiments under varying K-Fold configurations show that variance-aware optimization consistently mitigates the optimistic bias of single-run evaluations and identifies hyperparameter configurations with superior robustness and reproducibility. A theoretical analysis further establishes variance-aware generalization error bounds and a reliability ordering principle, providing formal justification for the proposed optimization criterion. Empirical validation on a multi-class breast ultrasound imaging dataset confirms improved performance stability and reduced variance across folds. Overall, the proposed framework offers a principled, reproducible, and architecture-independent evaluation strategy that enhances the reliability of CNN-based medical imaging systems and is readily extensible to other data-limited clinical applications.

Version published to 10.21203/rs.3.rs-8807781/v1 on Research Square
Feb 12, 2026

ML-ConvNet: A Lightweight and Interpretable Unified Architecture for Medical Image Classification Across Modalities

This article has 10 authors:
1. Williams Ayivi
2. Xiaoling Zhang
3. Yeongx Yeong Hyeon Gu
4. Amil Aligayev
5. Ali Alqahtani
6. Wisdom Xornam Ativi
7. Francis Sam
8. Muhammed Amin Abdullah
9. Emmanuel Sarpong Addai Gyarteng
10. Mugahed A. Al-antari
This article has no evaluationsLatest version Mar 17, 2026
Do Hybrid CNN–Transformer Architectures Really Generalize? A Systematic Review for Medical Imaging

This article has 3 authors:
1. Roaa Ehab
2. Shimaa El-Bana
3. Ahmad Al-Kabbany
This article has no evaluationsLatest version Mar 26, 2026
Recurrence with Correlation Network for Medical Image Registration

This article has 6 authors:
1. Vignesh Sivan
2. Teodora Vujovic
3. Raj Kumar Ranabhat
4. Alexander Wong
5. Stewart Mclachlin
6. Michael Hardisty
This article has no evaluationsLatest version Feb 20, 2026

Discuss this preprint

Listed in

Abstract

Article activity feed

Related articles

ML-ConvNet: A Lightweight and Interpretable Unified Architecture for Medical Image Classification Across Modalities

Do Hybrid CNN–Transformer Architectures Really Generalize? A Systematic Review for Medical Imaging

Recurrence with Correlation Network for Medical Image Registration