Fault-Injection Probing: A Causal Interpretability Framework for Quantum Machine Learning Models

Prabakaran Kannan¹
Venkatesan M. Sundaram¹

Read the full article

Discuss this preprint

Start a discussion What are Sciety discussions?

Listed in

This article is not in any list yet, why not save it to one of your lists.

Abstract

Quantum machine learning (QML) models achieve competitive performance on real-world tasks, yet interpreting what these models learn remains an open challenge. Classical interpretability techniques depend on access to intermediate representations, which quantum systems forbid due to measurement collapse, the no-cloning theorem, and exponential state-space dimensionality. We introduce Fault-Injection Probing (FIP), a framework that repurposes controlled quantum errors—bit flips, phase flips, depolarising channels, and erasure—as interpretability probes. FIP injects a known fault at a specific qubit and circuit layer, then measures the output shift. Comparing shifts across inputs with and without a target feature yields causal attribution scores linking qubits to learned representations. On variational quantum classifiers trained for sentiment analysis, FIP identifies sentiment-encoding qubits whose targeted perturbation flips 72% of relevant predictions. On a synthetic benchmark with known ground-truth mappings, FIP achieves 100% identification accuracy with zero false positives across all eight qubits. The framework is model-agnostic, extending to quantum kernels, reservoir models, and QAOA, and supports practical applications including model debugging and adversarial robustness assessment.

Version published to 10.21203/rs.3.rs-8766996/v1 on Research Square
Feb 9, 2026

Comparative Analysis of Asymmetric Readout Errors on Variational Quantum Classifiers: Scaling from 2 to 4 Qubits

This article has 1 author:
1. Feras Shita
This article has no evaluationsLatest version Feb 18, 2026
Simulation-Based Explainable AI for Quantum Dynamics: Neural Proxies and SHAP for Entanglement Analysis

This article has 1 author:
1. Muhammad Shaharyar Nasir
This article has no evaluationsLatest version Mar 4, 2026
Quantum Circuit-Based Learning Models: Bridging Quantum Computing and Machine Learning

This article has 8 authors:
1. Fan Fan
2. Yilei Shi
3. Mihai Datcu
4. Bertrand Le Saux
5. Luigi Iapichino
6. Francesca Bovolo
7. Silvia Liberata Ullo
8. Xiao Xiang Zhu
This article has no evaluationsLatest version Feb 17, 2026

Discuss this preprint

Listed in

Abstract

Article activity feed

Related articles

Comparative Analysis of Asymmetric Readout Errors on Variational Quantum Classifiers: Scaling from 2 to 4 Qubits

Simulation-Based Explainable AI for Quantum Dynamics: Neural Proxies and SHAP for Entanglement Analysis

Quantum Circuit-Based Learning Models: Bridging Quantum Computing and Machine Learning