Feature-level interaction and adaptive fusion model based on cross-modal attention for audiovisual emotion recognition

Shuqiu Tan
Chunsheng Tan

Read the full article

Discuss this preprint

Start a discussion What are Sciety discussions?

Listed in

This article is not in any list yet, why not save it to one of your lists.

Log in to save this article

Abstract

No abstract available

Version published to 10.1007/s11760-025-05079-3
Jan 1, 2026
Version published to 10.21203/rs.3.rs-8119217/v1 on Research Square
Nov 26, 2025

Adaptive Contextualized Multi-feature Fusion Network for Robust Cross-Linguistic Speech Emotion Recognition

This article has 2 authors:
1. Haoyu Cen
2. Yutian Gai
This article has no evaluationsLatest version Dec 30, 2025
TCFNet: An End-to-End Framework for Multimodal Action Quality Assessment via Temporal Enhancement and Contrastive Fusion

This article has 4 authors:
1. Zhenxian Lin
2. Minghui Zhang
3. Chengmao Wu
4. Mingzhu Zhang
This article has no evaluationsLatest version Dec 19, 2025
Multimodal Model Based on Contrastive Language-Image Pretraining for Micro-Expression Recognition

This article has 5 authors:
1. Peng Yang
2. Xiaoguang Wu
3. Yanyang Zhou
4. Qilin Wei
5. Zhifeng Zeng
This article has no evaluationsLatest version Dec 17, 2025