A Hierarchical Deep Learning Architecture for Diagnosing Retinal Diseases Using Cross-Modal OCT to Fundus Translation in the Lack of Paired Data

Ekaterina A. Lopukhova
Gulnaz M. Idrisova
Timur R. Mukhamadeev
Grigory S. Voronkov
Ruslan V. Kutluyarov
Elizaveta P. Topolskaya

Read the full article

Discuss this preprint

Start a discussion What are Sciety discussions?

Listed in

This article is not in any list yet, why not save it to one of your lists.

Abstract

The paper focuses on automated diagnosis of retinal diseases, particularly Age-related Macular Degeneration (AMD) and diabetic retinopathy (DR), using optical coherence tomography (OCT), while addressing three key challenges: disease comorbidity, severe class imbalance, and the lack of strictly paired OCT and fundus data. We propose a hierarchical modular deep learning system designed for multi-label OCT screening with conditional routing to specialized staging modules. To enable DR staging when fundus images are unavailable, we use cross-modal alignment between OCT and fundus representations. This approach involves training a latent bridge that projects OCT embeddings into the fundus feature space. We enhance clinical reliability through per-class threshold calibration and implement quality control checks for OCT-only DR staging. Experiments demonstrate robust multi-label performance (macro-F1 =0.989±0.006 after per-class threshold calibration) and reliable calibration (ECE =2.1±0.4%), and OCT-only DR staging is feasible in 96.1% of cases that meet the quality control criterion.

Version published to 10.3390/jimaging12010036
Jan 8, 2026
Version published to 10.20944/preprints202512.0450.v1
Dec 5, 2025

A Multimodal Deep Learning Method Based on Multiple Medical Images for Fuchs Endothelial Corneal Dystrophy Diagnosis

This article has 11 authors:
1. En-shuo Liu
2. Li-li Cao
3. Jing-hao Qu
4. Hao-ran Wu
5. Ge-ge Xiao
6. Li-xue Shuai
7. Shao-feng Gu
8. Hai-kun Wang
9. Ke-chao Zheng
10. Rong-mei Peng
11. Jing Hong
This article has no evaluationsLatest version Jan 20, 2026
CDR-LWP: Layer-Wise Probability Fusion and Interpretable Deep Learning for Multi-Stage Diabetic Retinopathy Classification

This article has 6 authors:
1. Saif Khalid Musluh
2. Hatem A. Rashwan
3. Ammar M. Okran
4. Sylvie Chambon
5. Saddam Abdulwahab
6. Domenec Puig
This article has no evaluationsLatest version Jan 8, 2026
A Robust Intelligent CNN Model Enhanced with Gabor-Based Feature Extraction, SMOTE Balancing, and Adam Optimization for Multi-Grade Diabetic Retinopathy Classification

This article has 4 authors:
1. Asri Mulyani
2. Muljono -
3. Purwanto -
4. Moch Arief Soeleman
This article has no evaluationsLatest version Jan 6, 2026

Discuss this preprint

Listed in

Abstract

Article activity feed

Related articles

A Multimodal Deep Learning Method Based on Multiple Medical Images for Fuchs Endothelial Corneal Dystrophy Diagnosis

CDR-LWP: Layer-Wise Probability Fusion and Interpretable Deep Learning for Multi-Stage Diabetic Retinopathy Classification

A Robust Intelligent CNN Model Enhanced with Gabor-Based Feature Extraction, SMOTE Balancing, and Adam Optimization for Multi-Grade Diabetic Retinopathy Classification