Structured Representation Compression for Large Language Models through Hierarchical Tensor Partitioning

Penelope Tifantome
Humphrey Meldrum
Yvette Stratfield
Konstantin Sinclair

Read the full article

Listed in

This article is not in any list yet, why not save it to one of your lists.

Abstract

Resource-efficient neural architectures require compression techniques that retain functional capacity while reducing computational costs. Hierarchical tensor partitioning introduces a structured approach to model compression through the decomposition of high-dimensional tensors into hierarchical components, facilitating reductions in parameter storage without compromising essential representational structures. The empirical evaluation demonstrates that parameter counts decrease significantly across multiple model layers, leading to a reduction in memory consumption and inference latency. The hierarchical factorization strategy preserves linguistic coherence, as evidenced through perplexity analysis and sentence structure assessments, while computational efficiency improvements are reflected in reduced inference times and energy consumption. Variations in attention weight distributions and minor shifts in dependency retention indicate that compression influences representational expressivity, albeit within tolerable thresholds for practical deployment. The structured decomposition framework also introduces slight alterations in training dynamics, requiring adjustments to learning rate schedules to maintain convergence stability. Long-range dependency preservation and adversarial robustness assessments highlight the trade-offs inherent in hierarchical partitioning, revealing that efficiency gains come with marginal shifts in sensitivity to input perturbations. The experimental results suggest that hierarchical tensor partitioning provides a balance between compact model representation and computational efficiency, offering a viable compression strategy for architectures constrained by hardware limitations.

Version published to 10.31219/osf.io/68gcn_v1 on OSF Preprints
Feb 3, 2025

Latent Manifold Realignment in Large Language Models via Hierarchical Gradient Constriction

This article has 6 authors:
1. Joseph Sakau
2. Jonathan Montgomery
3. Edith Templeton
4. Xander Tattershall
5. Margaret Holbrooke
6. Kingsley Wentworth
This article has no evaluationsLatest version Mar 17, 2025
Structural Modulation Through Contextual Perturbation in Large Language Model Training

This article has 5 authors:
1. Ziad Shaker
2. Charles Thornborough
3. Quentin Hathersage
4. Eric Throckmorton
5. Sebastian Wilson
This article has no evaluationsLatest version Mar 21, 2025
Contextual Residual Inversion in Transformer-Based Large Language Models: A Reversibility Paradigm for Studying Representational Fidelity

This article has 3 authors:
1. Daniel Arthev
2. Richard Abercrombie
3. Clive Fenwick
This article has no evaluationsLatest version Mar 24, 2025

Listed in

Abstract

Article activity feed

Related articles

Latent Manifold Realignment in Large Language Models via Hierarchical Gradient Constriction

Structural Modulation Through Contextual Perturbation in Large Language Model Training

Contextual Residual Inversion in Transformer-Based Large Language Models: A Reversibility Paradigm for Studying Representational Fidelity