Efficiency-Fidelity Trade-offs in Legal Document Generation: Evaluating Optimization Strategies for Vietnamese Small Language Models with Normative Content Preservation Analysis

Quoc Lap Nguyen

Read the full article

Discuss this preprint

Start a discussion What are Sciety discussions?

Listed in

This article is not in any list yet, why not save it to one of your lists.

Abstract

Deploying language models for legal document processing in emerging jurisdictions confronts a critical question: do computational efficiency gains compromise normative legal content? This study systematically evaluates optimization strategies for Vietnamese Small Language Models across legal summarization and title generation tasks. We compare three model families (ViT5, BARTpho-word, BARTpho-syllable) under four training configurations (Standard, Dynamic Padding, Layer Freezing, Hybrid) using 48,320 Vietnamese legal documents. Beyond standard metrics, we introduce a normative content preservation protocol assessing retention of deontic markers and legal holdings through expert annotation. Results demonstrate that Hybrid optimization achieves 87.4% carbon emission reduction and 2.01\((\times)\) speedup while maintaining semantic fidelity statistically indistinguishable from baseline. Critically, optimized large models preserve 88% of deontic content versus 91% for unoptimized versions. Optimized large models outperform inherently smaller variants on both efficiency and accuracy (BARTpho-syllable Hybrid: 0.8521 vs Base: 0.8378). Ablation analysis reveals 40% layer freezing as optimal. Error analysis shows optimization increases argumentative simplification but not hallucination (3% constant), indicating safer failure modes for legal applications. These findings establish that aggressive optimization preserves legally salient content, enabling sustainable deployment of legal AI in resource-constrained civil law jurisdictions.

Version published to 10.21203/rs.3.rs-8678504/v1 on Research Square
Feb 17, 2026

Attention Amplification in Multilingual LLMs: Why Script Representation Matters

This article has 3 authors:
1. Yash Mishra
2. Suyash Mishra
3. Kedarnath senapati
This article has no evaluationsLatest version Feb 25, 2026
Legal Aligner: Transforming Generic LLMs into Domain Experts for Enhanced Accuracy

This article has 4 authors:
1. Pengcheng Wen
2. Guoying LU
3. Sirui Han
4. Yike GUO
This article has no evaluationsLatest version Mar 16, 2026
WITHDRAWN: Alignment-Induced Flattening in Large Language Models: A 33-Item Reading Comprehension Measure of Atypical Perspective-Taking Across Five Model Families

This article has 1 author:
1. Shamim Khaliq
This article has no evaluationsLatest version Feb 19, 2026

Discuss this preprint

Listed in

Abstract

Article activity feed

Related articles

Attention Amplification in Multilingual LLMs: Why Script Representation Matters

Legal Aligner: Transforming Generic LLMs into Domain Experts for Enhanced Accuracy

WITHDRAWN: Alignment-Induced Flattening in Large Language Models: A 33-Item Reading Comprehension Measure of Atypical Perspective-Taking Across Five Model Families