Quantum Destructive Self-Attention for NISQ-EraTransformers

Yousra BOUAKBA
Hacene Belhadef

Read the full article

Discuss this preprint

Start a discussion What are Sciety discussions?

Listed in

This article is not in any list yet, why not save it to one of your lists.

Abstract

In the noisy intermediate-scale quantum (NISQ) era, developing attention mechanisms suitable for quantum hardware is essential for advancing quantum-enhanced Transformers applications. This work introduces a novel quantum Transformer model that integrates a low-depth, ancilla-free attention mechanism based on the Destructive swap-test variant, enabling efficient computation of attention scores without auxiliary qubits. Designed specifically for NISQ constraints, the model emphasizes noise resilience and reduced circuit depth, making it practical for current quantum devices. We evaluate the model using transparent and well-documented Natural Language Processing datasets designed for Quantum Computing (QC). Our results demonstrate competitive performance on language tasks, supported by both quantitative metrics that offer interpretable insights into the model's behavior. This work provides a viable pathway toward practical, interpretable quantum language models in the near term.

Version published to 10.21203/rs.3.rs-8946631/v1 on Research Square
Feb 25, 2026

Quantum-Enhanced Hybrid-Model Compressionusing Knowledge Distillation

This article has 3 authors:
1. Luigi Barbato
2. Massimo Esposito
3. Francesco Gargiulo
This article has no evaluationsLatest version Mar 4, 2026
Local Scrambling and Structural Gradient Bias in Hardware-Efficient Quantum Circuits

This article has 1 author:
1. Seongmuk Khang
This article has no evaluationsLatest version Mar 13, 2026
Sample-efficient quantum error mitigation via classical learning surrogates

This article has 8 authors:
1. He-Liang Huang
2. Wei-You Liao
3. Ge Yan
4. Yujin Song
5. Tian-Ci Tian
6. Wei-Ming Zhu
7. De-Tao Jiang
8. Yuxuan Du
This article has no evaluationsLatest version Feb 6, 2026

Discuss this preprint

Listed in

Abstract

Article activity feed

Related articles

Quantum-Enhanced Hybrid-Model Compressionusing Knowledge Distillation

Local Scrambling and Structural Gradient Bias in Hardware-Efficient Quantum Circuits

Sample-efficient quantum error mitigation via classical learning surrogates