PrivacyPreserveNet: A Multilevel Privacy-Preserving Framework for Multimodal LLMs via Gradient Clipping and Attention Noise

Yunfei Guo
Yiming Yu

Read the full article

Listed in

This article is not in any list yet, why not save it to one of your lists.

Abstract

The deployment of multimodal large language models introduces heightened risks of privacy leakage, especially when training involves sensitive text, image, and audio data. Existing solutions typically apply differential privacy or gradient clipping individually, but these lack cohesion and often compromise model utility. This paper proposes PrivacyPreserveNet, a novel framework built on Llama-7B that integrates Differential Privacy-enhanced Pretraining, Privacy-Aware Gradient Clipping, and a Noise-Injected Attention module to enforce privacy at multiple levels of the learning process. PrivacyPreserveNet introduces noise into both model gradients and attention distributions, ensuring comprehensive protection against data leakage without sacrificing performance. The framework also incorporates composite regularization and visualization-based robustness assessments to enhance model stability. Experimental validation confirms that PrivacyPreserveNet achieves a superior balance between privacy guarantees and task performance, establishing a practical path forward for secure multimodal model training.

Version published to 10.20944/preprints202506.0157.v1
Jun 3, 2025

Hybrid Active Learning with Privacy-Preserving Synthetic Data for Medical Multimodal LLM Enhancement

This article has 1 author:
1. xiaochen xiao
This article has no evaluationsLatest version May 28, 2025
FairSYN-Edu: A Fairness-Aware, Privacy-Preserving Diffusion Model for Educational Data Synthesis

This article has 1 author:
1. Kadir Kesgin
This article has no evaluationsLatest version May 28, 2025
Data Collection in Multimodal Language and Communication Research: A Flexible Decision Framework

This article has 13 authors:
1. Anastasia Bauer
2. Patrick C. Trettenbrein
3. Federica Amici
4. Aleksandra Ćwiek
5. Susanne Fuchs
6. Lisa-Marie Krause
7. Anna Kuder
8. Silva Ladewig
9. Marc Schulder
10. Petra schumacher
11. Door Spruijt
12. Chiara Zulberti
13. Martin Schulte-Rüther
This article has no evaluationsLatest version Jun 30, 2025

Listed in

Abstract

Article activity feed

Related articles

Hybrid Active Learning with Privacy-Preserving Synthetic Data for Medical Multimodal LLM Enhancement

FairSYN-Edu: A Fairness-Aware, Privacy-Preserving Diffusion Model for Educational Data Synthesis

Data Collection in Multimodal Language and Communication Research: A Flexible Decision Framework