Multi-Model LLM Architectures for Personalized Summarization and Relevance Ranking in Biomedical Literature

Avinash Pandey
Alexey Kuznetsov
Snehasis Mukhopadhyay

Read the full article

Listed in

This article is not in any list yet, why not save it to one of your lists.

Abstract

Objective

To develop and evaluate a personalized literature review system that efficiently processes and summarizes biomedical literature to provide timely, relevant insights for researchers.

Methods

The system integrates ontology-aware keyword extraction (MeSH/ACM constrained TF-IDF from CV/Research Statement), citation-informed retrieval (PubMed and NIH iCite API), and dual-model large language model (LLM) summarization (Google Gemini 2.0 flash, OpenAI GPT-4o-mini). These LLMs leverage advanced Transformer architectures, building on foundations such as BERT, BART, and BioBERT. A two-stage ranking algorithm combines Relative Citation Ratio (RCR) with cosine similarity.

Summary quality was evaluated using ROGUE-1/2/L and BERTScore. The system is deployed as a Streamlit web application.

Results

Across 20 biomedical queries, the system demonstrated strong average performance (BERT-F1≈ 0.86), with cosine similarity strongly correlating with summary quality. Human evaluation involving 10 users yielded average scores above 4.5/5 across summary fidelity and keyword relevance.

Conclusion

Hybrid ranking and ensemble LLM summarization significantly accelerate scientific sense-making. These findings suggest broad applicability to various domains beyond biomedicine.

Version published to 10.1101/2025.07.29.667503 on bioRxiv
Jul 30, 2025

Accelerating Insight Discovery in Large Biomedical Text with Scalable Processing Framework

This article has 3 authors:
1. Dongeun Kim
2. Megan Hauptman
3. Matthew T. Patrick
This article has no evaluationsLatest version Aug 19, 2025
Web Application for Scientific Paper Retrieval and Summarization Using Large Language Models

This article has 3 authors:
1. Mateo Hitl
2. Marina Bagić Babac
3. Vedran Mornar
This article has no evaluationsLatest version Jul 17, 2025
BioPars: A Pretrained Biomedical Large Language Model for Persian Biomedical Text Mining

This article has 6 authors:
1. Baqer M. Merzah
2. Tania Taami
3. Salman Asoudeh
4. Amir reza Hossein pour
5. Saeed Mirzaee
6. Amir Ali Bengari
This article has no evaluationsLatest version Jul 21, 2025

Listed in

Abstract

Objective

Methods

Results

Conclusion

Article activity feed

Related articles

Accelerating Insight Discovery in Large Biomedical Text with Scalable Processing Framework

Web Application for Scientific Paper Retrieval and Summarization Using Large Language Models

BioPars: A Pretrained Biomedical Large Language Model for Persian Biomedical Text Mining