SciMind: A Multimodal Mixture-of-Experts Model for Advancing Pharmaceutical Sciences

Zhaoping Xiong
Xintao Fang
Haotian Chu
Xiaozhe Wan
Liwei Liu
Yameng Li
Wenkai Xiang
Mingyue Zheng

Read the full article

Listed in

This article is not in any list yet, why not save it to one of your lists.

Abstract

Large language models (LLMs) have made substantial strides, but their use in reliably tackling issues within specialized domains, particularly in interdisciplinary areas like pharmaceutical sciences, is hindered by data heterogeneity, knowledge complexity, unique objectives, and a spectrum of constraint conditions. In this area, diverse modalities such as nucleic acids, proteins, molecular structures, and natural language are often involved. We designed a specialized token set and introduced a new Mixture-of-Experts (MoEs) pre-training and fine-tuning strategy to unify these modalities in one model. With this strategy, we’ve created a multi-modal mixture-of-experts foundational model for pharmaceutical sciences, named SciMind. This model has undergone extensive pre-training on publicly accessible datasets including nucleic acid sequences, protein sequences, molecular structure strings, and biomedical texts, and delivers good performance on biomedical text comprehension, promoter prediction, protein function prediction, molecular description, and molecular generation.

Version published to 10.1101/2024.07.16.603812v1 on bioRxiv
Jul 21, 2024

Precious3GPT: Multimodal Multi-Species Multi-Omics Multi-Tissue Transformer for Aging Research and Drug Discovery

This article has 20 authors:
1. Fedor Galkin
2. Vladimir Naumov
3. Stefan Pushkov
4. Denis Sidorenko
5. Anatoly Urban
6. Diana Zagirova
7. Khadija M. Alawi
8. Alex Aliper
9. Ruslan Gumerov
10. Aleksandr Kalashnikov
11. Sabina Mukba
12. Aleksandra Pogorelskaya
13. Feng Ren
14. Anastasia Shneyderman
15. Qiuqiong Tang
16. Deyong Xiao
17. Alexander Tyshkovskiy
18. Kejun Ying
19. Vadim N. Gladyshev
20. Alex Zhavoronkov
This article has no evaluationsLatest version Jul 25, 2024
Mixture-of-Experts Approach for Enhanced Drug-Target Interaction Prediction and Confidence Assessment

This article has 4 authors:
1. Yijingxiu Lu
2. Sangseon Lee
3. Soosung Kang
4. Sun Kim
This article has no evaluationsLatest version Aug 8, 2024
Multi-Modal CLIP-Informed Protein Editing

This article has 11 authors:
1. Mingze Yin
2. Hanjing Zhou
3. Yiheng Zhu
4. Miao Lin
5. Yixuan Wu
6. Jialu Wu
7. Hongxia Xu
8. Chang-Yu Hsieh
9. Tingjun Hou
10. Jintai Chen
11. Jian Wu
This article has no evaluationsLatest version Jul 28, 2024

Listed in

Abstract

Article activity feed

Related articles

Precious3GPT: Multimodal Multi-Species Multi-Omics Multi-Tissue Transformer for Aging Research and Drug Discovery

Mixture-of-Experts Approach for Enhanced Drug-Target Interaction Prediction and Confidence Assessment

Multi-Modal CLIP-Informed Protein Editing