Web Application for Scientific Paper Retrieval and Summarization Using Large Language Models

Mateo Hitl
Marina Bagić Babac
Vedran Mornar

Read the full article

Listed in

This article is not in any list yet, why not save it to one of your lists.

Abstract

This research addresses the challenge of effectively discovering and synthesizing scientific literature, a growing concern given the exponential increase in publication volume. To improve search relevance and streamline academic workflows, we developed a web application that leverages semantic search using the all-mpnet-base-v2 embedding model combined with pgvector indexing (Hierarchical Navigable Small World). The system supports automatic paper summarization, citation formatting across multiple styles, similarity graph visualization, and retrieval-augmented generation (RAG) for related work writing. The backend architecture is built on FastAPI and PostgreSQL, with a React-based frontend. Performance was evaluated using standard information retrieval metrics including Recall@3, MRR@3, Precision@3, and MAP@3. The embedding-based approach consistently outperformed a traditional TF-IDF baseline across all measures, confirming its ability to retrieve more contextually relevant results. These findings demonstrate the practical value of integrating large language models and vector-based retrieval in academic tools. The system contributes to ongoing efforts to enhance literature review processes and could serve as a foundation for more advanced, AI-assisted research environments.

Version published to 10.20944/preprints202507.1483.v1
Jul 17, 2025

Information-Optimized and Adaptive Document Segmentation for Multilingual Knowledge Graphs

This article has 3 authors:
1. Diqi Si
2. Yuwen Wei
3. Leiwu Wen
This article has no evaluationsLatest version Jun 6, 2025
AnaliTexGra: A novel visual application for academic collaboration prediction based on standard machine learning techniques and text mining

This article has 4 authors:
1. Maria del Pilar Angeles
2. Francisco Barrios-Lopez
3. Jessica Zepeda Baeza
4. Dora Carmen Galvez Cruz
This article has no evaluationsLatest version Jul 22, 2025
Fusion-Based Retrieval-Augmented Generation for Complex Question Answering with LLMs

This article has 6 authors:
1. Yumeng Sun
2. Renhan Zhang
3. Renzi Meng
4. Lian Lian
5. Heyi Wang
6. Xuehui Quan
This article has no evaluationsLatest version Jul 9, 2025

Listed in

Abstract

Article activity feed

Related articles

Information-Optimized and Adaptive Document Segmentation for Multilingual Knowledge Graphs

AnaliTexGra: A novel visual application for academic collaboration prediction based on standard machine learning techniques and text mining

Fusion-Based Retrieval-Augmented Generation for Complex Question Answering with LLMs