Deep Reinforcement Learning based Path Planning with Dynamic Trust Region Optimization for Automotive Application

Vengatesan Arumugam
Vasudevan Alagumalai
Venkataramanan Sriniva

Read the full article

Listed in

This article is not in any list yet, why not save it to one of your lists.

Abstract

Graphical abstract Abstract Multi-robot path planning must adapt to difficult situations, allowing autonomous navigation in both static and dynamic barriers in complicated environments. However, defining the best planning strategies for certain applications remains unsolved. This study focused at three methods for learning complex robotic decision-making principles such as Trust Region Policy Optimization (TRPO), Proximal Policy Optimization (PPO), and Deep Reinforcement Learning (DRL). Furthermore, proposed a novel technique for obstacle avoidance and autonomous navigation called Dynamic Improvement Trust Region Policy Optimization with Covariance Grid Adaptation (DITRPO-CGA). Initially, created the Dynamic Improvement Proximal Policy Optimization with Covariance Grid Adaptation (DIPPO-CGA) based on PPO to assure collision-free policies. Next, developed a DRL technique that integrates DIPPO-CGA, resulting in the DITRPO-CGA algorithm, which improved the flexibility of multi-robot systems in different situations. During training process, DIPPO-CGA is utilized to optimize the multi-robot multi-task policies, ensuring least distance obstacle avoidance and target completion. The proposed DIPPO-CGA algorithm reaches the target within minimum distance. The findings showed that when compared to PPO, TRPO, and DIPPO-CGA, the proposed DITRPO-CGA algorithm achieves a higher convergence rate, faster target achievement and reaches the positions more quickly.

Version published to 10.21203/rs.3.rs-4948392/v1 on Research Square
Sep 19, 2024

Autonomous navigation with minimal sensors in dynamic warehouse environments: a multi-agent reinforcement learning approach with curriculum learning enhancement

This article has 8 authors:
1. Zhilong Shen
2. Yongwei Chi
3. Yu Bai
4. Xiaojing Liao
5. Peiyu Zhao
6. Jianjiang Lu
7. Qian Niu
8. Qinya Dai
This article has no evaluationsLatest version Sep 26, 2024
DPO: Differential reinforcement learning with application to optimal configuration search

This article has 2 authors:
1. Chandrajit Bajaj
2. Minh Nguyen
This article has no evaluationsLatest version Sep 11, 2024
On-policy Actor-Critic Reinforcement Learning for Multi-UAV Exploration

This article has 3 authors:
1. Ali Moltajaei Farid
2. Jafar Roshanian
3. Malek Mouhoub
This article has no evaluationsLatest version Sep 17, 2024

Listed in

Abstract

Article activity feed

Related articles

Autonomous navigation with minimal sensors in dynamic warehouse environments: a multi-agent reinforcement learning approach with curriculum learning enhancement

DPO: Differential reinforcement learning with application to optimal configuration search

On-policy Actor-Critic Reinforcement Learning for Multi-UAV Exploration