AURA: An Adaptive Unified Regularization Approach for Gradient-Based Optimization

Keshav Gupta

Read the full article

Discuss this preprint

Start a discussion What are Sciety discussions?

Listed in

This article is not in any list yet, why not save it to one of your lists.

Abstract

In the engineering world, optimization plays an important role i.e. almost every industry tries to optimize their systems as much as possible in order to increase efficiency. Hence, in the machine learning universe as well, optimization is quite famous and when it comes to optimisation, one algorithm which often comes to our mind is gradient descent. Currently, there are many customized optimiser techniques which describe different kinds of techniques and processes to converge faster and obtain a low error rate. We propose AURA (Adaptive Unified Regularized Algorithm), a novel stochastic optimizer that shifts adaptation from the learning rate to the momentum parameter. Unlike conventional adaptive methods such as Adam and RMSProp, which primarily rely on per-parameter learning rate scaling, AURA maintains a fixed learning rate and instead adaptively modulates momentum ($\beta$) through three synergistic signals: (i) loss-trend awareness, which captures short-term dynamics in optimization stability, (ii) gradient-norm sensitivity, which prevents instability under varying gradient magnitudes, and (iii) cosine-similarity modulation, which aligns current updates with historical trajectories to enhance directional consistency. Empirical evaluations on classification and regression benchmarks demonstrate that AURA achieves competitive or superior convergence behavior compared to widely used optimizers.

Version published to 10.21203/rs.3.rs-7480833/v1 on Research Square
Sep 9, 2025

Opt-AEDDM: Towards Optimizing Autoencoders for effective Concept Drift Detection

This article has 2 authors:
1. Usman Ali
2. Tariq Mahmood
This article has no evaluationsLatest version Sep 19, 2025
PEFT Unlocked: Methodologies, Formulas, and Applications in Efficient LLM Adaptation

This article has 5 authors:
1. Maryam Najafi
2. Ehsan Tavan
3. Stefan Kuhn
4. Salaheddin Alakkari
5. Simon Colreavy
This article has no evaluationsLatest version Oct 15, 2025
Streaming Propagation Through Time: A New Computational Paradigm for Recurrent Neural Networks

This article has 12 authors:
1. Huachuan Wang
2. Weihao Xia
3. Yunpeng Guan
4. Yuanhao Wang
5. Chaoyi Ke
6. Enshuo Yan
7. Ping Wang
8. Chen Qiu
9. Xiangping Zheng
10. Yuan Yao
11. Yuanfei Bi
12. James Lo
This article has no evaluationsLatest version Oct 17, 2025

Discuss this preprint

Listed in

Abstract

Article activity feed

Related articles

Opt-AEDDM: Towards Optimizing Autoencoders for effective Concept Drift Detection

PEFT Unlocked: Methodologies, Formulas, and Applications in Efficient LLM Adaptation

Streaming Propagation Through Time: A New Computational Paradigm for Recurrent Neural Networks