Prompt Sensitivity and Bias Amplification in Aligned Video Diffusion Models

Marco Rossi
Giulia Bianchi
Alessandro Conti

Read the full article

Discuss this preprint

Start a discussion What are Sciety discussions?

Listed in

This article is not in any list yet, why not save it to one of your lists.

Abstract

While alignment tuning aims to constrain undesirable outputs, its interaction with prompt sensitivity in video diffusion models has not been systematically quantified. This study examines how minor semantic perturbations in prompts affect bias emergence in aligned versus unaligned video diffusion systems. We generate 26,700 video samples using paired prompts with controlled lexical and contextual variations. Bias amplification is measured using demographic skew ratios, attribute co-occurrence statistics, and visual saliency attribution. Results indicate that aligned models exhibit 34.1% higher sensitivity to prompt perturbations in socially sensitive contexts, leading to amplified bias variance across outputs. These findings suggest that alignment tuning may unintentionally increase model fragility to prompt-level noise, posing challenges for reliable bias mitigation.

Version published to 10.20944/preprints202601.2005.v1
Jan 27, 2026

Cross-Modal Bias Transfer in Aligned Video Diffusion Models

This article has 4 authors:
1. Yuki Nakamura
2. Kenji Sato
3. Ayaka Suzuki
4. Hiroshi Tanaka
This article has no evaluationsLatest version Jan 27, 2026
Adaptive-Guided Latent Diffusion for Video Counterfactual Explanations with Multi-Scale Perceptual Refinement

This article has 2 authors:
1. Yucan Ping
2. Haoxiang Wen
This article has no evaluationsLatest version Feb 3, 2026
The Illusion of Fairness: A Systematic Study of Unsupervised Domain Adaptation on Sparse Educational Data

This article has 1 author:
1. Arjun Adhikari
This article has no evaluationsLatest version Jan 3, 2026

Discuss this preprint

Listed in

Abstract

Article activity feed

Related articles

Cross-Modal Bias Transfer in Aligned Video Diffusion Models

Adaptive-Guided Latent Diffusion for Video Counterfactual Explanations with Multi-Scale Perceptual Refinement

The Illusion of Fairness: A Systematic Study of Unsupervised Domain Adaptation on Sparse Educational Data