Representation learning-based genome-wide association mapping discovers genes underlying complex traits.

David Enoma
Hongjiang Chu
Dinghao Wang
Li Shu
Ariel Kamdoum
Janith Weeraman
Lang Wu
Paul Gordon
Jason de Koning
Paul Arnold
Rodrigo Polo
Quan Long

Read the full article

Discuss this preprint

Start a discussion What are Sciety discussions?

Listed in

This article is not in any list yet, why not save it to one of your lists.

Abstract

Genome-wide association studies (GWAS) have provided key insights into the genetic architecture of complex traits. However, traditional approaches fall short in accounting for polygenicity, epistatic interactions, and linkage disequilibrium. We present Representation Learning-Based Association Mapping (RBAM), a framework that leverages variational autoencoders to learn latent genotype embedding for improved association mapping and phenotype prediction. We apply RBAM to 17 complex traits, including brain disorders, immunological conditions, cancers, and cardiometabolic phenotypes, using genotypes from the UK Biobank, dbGaP, and WTCCC, totalling 136,458 samples. RBAM enhanced gene discovery and identified DisGeNET-validated gene-disease associations, outperforming REGENIE and SKAT. Simulation studies confirm that RBAM maintains a controlled Type I error rate. The latent embedding as input to machine learning classifiers outperforms PRS estimates in complex diseases. Functional annotations show sensible biological enrichments and shared pleiotropic genes across distinct complex diseases. The RBAM framework bridges the gap between unsupervised representation learning and association mapping

Version published to 10.21203/rs.3.rs-7624342/v1 on Research Square
Sep 23, 2025

Causal splicing variants revealed by deep-learning integration of single-cell sQTL mapping under influenza infection

This article has 8 authors:
1. Liuyang Wang
2. Guinevere Connelly
3. Trisha Dalapati
4. Angela Jones
5. Benjamin Schott
6. Joseph Trimarco
7. Nicholas Heaton
8. Dennis Ko
This article has no evaluationsLatest version Jan 6, 2026
Path-Probability Models Outperform Point-Estimate Scores for Noncoding GWAS Gene Prioritization

This article has 1 author:
1. Abduxoliq Ashuraliyev
This article has no evaluationsLatest version Dec 22, 2025
Decoding Complex Genotype-Phenotype Interactions by Discretizing the Genome

This article has 6 authors:
1. Jędrzej Kubica
2. Hetvi Jethwani
3. Krzysztof H. Banecki
4. Mauricio Moldes
5. Dariusz Plewczynski
6. Ben Busby
This article has no evaluationsLatest version Dec 17, 2025

Discuss this preprint

Listed in

Abstract

Article activity feed

Related articles

Causal splicing variants revealed by deep-learning integration of single-cell sQTL mapping under influenza infection

Path-Probability Models Outperform Point-Estimate Scores for Noncoding GWAS Gene Prioritization

Decoding Complex Genotype-Phenotype Interactions by Discretizing the Genome