Probabilistic vs Deep Generative Models: A Fairness Centred Evaluation of Synthetic Healthcare Tabular Data

Dima Alattal
Barbara Draghi
Puja Myles
Richard Branson
Allan Tucker

Read the full article

Discuss this preprint

Start a discussion What are Sciety discussions?

Listed in

This article is not in any list yet, why not save it to one of your lists.

Abstract

Purpose: Synthetic data offers a promising avenue for addressing privacy, scarcity, and fairness challenges in healthcare datasets. However, there is limited evaluation of how different generation methods balance fidelity, utility, and fairness, particularly for underrepresented subgroups. This study addresses this gap by comparing representative generative modelling techniques, both probabilistic and deep approaches, that are popular in the research literature. Methods: We empirically evaluate BayesBoost, CTGAN, TVAE, CopulaGAN, and DECAF on two healthcare datasets containing numerical, binary, and categorical features. Each model’s performance is assessed along three axes: data fidelity, machine learning utility, and fairness (using Accuracy Parity, Equalised Odds, and Predictive Rate Parity). Results: BayesBoost consistently achieved superior fidelity, utility, and fairness preservation, particularly when paired with Random Forest classifiers. Deep generative models, while effective in capturing complex structures, often degraded fairness, especially for underrepresented groups. VAE outperformed other generative models in fairness preservation especially for equalised odds, but at some cost to fidelity and utility. Conclusion: Synthetic data generation for healthcare must move beyond fidelity evaluations to explicitly assess fairness and subgroup impacts. Probabilistic models like BayesBoost show strong potential for ethical deployment, while deep generative models require further adaptation for fairness-sensitive applications.

Version published to 10.21203/rs.3.rs-7565139/v1 on Research Square
Sep 30, 2025

Evaluating Fidelity and Machine Learning Utility of Synthetic Tabular Data Generated Using Generative Models

This article has 3 authors:
1. Aaditya Kumar Dhaka
2. Apash Roy
3. S Shrivallabha
This article has no evaluationsLatest version Sep 17, 2025
Algorithm Fairness in Predicting Unmet Preventive Care: Evidence from 16 European Countries using SHARE

This article has 10 authors:
1. Toby Kai-Bo Shen
2. Vincent Cheng Sheng Li
3. Nick Meng-Huan Chen
4. Jennifer Sheng Hui Hsu
5. Rifat Atun
6. Valerie Tzu Ning Liu
7. Charlotte Wang
8. David Bin-Chia Wu
9. Pin-Chun Yeh
10. John Tayu Lee
This article has no evaluationsLatest version Sep 10, 2025
Evaluating algorithm Fairness in Predicting Health Service Use and Unmet Need Across Socioeconomic and Caste Subgroups: Evidence from Longitudinal Ageing Study in India

This article has 8 authors:
1. John Tayu Lee
2. Vincent Cheng-Sheng Li
3. Toby Kai-Bo Shen
4. Valerie Tzu Ning Liu
5. Sheng Hui Hsu
6. Tzu-Pin Lu
7. Arokiasamy Perianayagam
8. Rifat Atun
This article has no evaluationsLatest version Sep 9, 2025

Discuss this preprint

Listed in

Abstract

Article activity feed

Related articles

Evaluating Fidelity and Machine Learning Utility of Synthetic Tabular Data Generated Using Generative Models

Algorithm Fairness in Predicting Unmet Preventive Care: Evidence from 16 European Countries using SHARE

Evaluating algorithm Fairness in Predicting Health Service Use and Unmet Need Across Socioeconomic and Caste Subgroups: Evidence from Longitudinal Ageing Study in India