GReX-Bench: Benchmarking Generalization, Robustness, and Explainability in AI-Generated Image Detection

Nusrat Tasnim
kutub Uddin
Khalid Malik

Read the full article

Discuss this preprint

Start a discussion What are Sciety discussions?

Listed in

This article is not in any list yet, why not save it to one of your lists.

Abstract

Generative AI has significantly transformed media creation and accessibility, enabling the rapid generation of fake content, particularly images. However, AI-generated images pose growing challenges for misinformation and biometric security, contributing to declining public trust, rising fraud, and increasing social engineering attacks.Despite progress in forensics, existing methods still face major limitations: (i) reliance on non-standardized benchmarks, (ii) inconsistent training protocols, (iii) limited evaluation metrics, (iv) weak interpretability, (v) lack of human-readable explanations, and (vi) insufficient attention to deployment and usability in real-world settings. These issues hinder fair comparison and obscure true reliability in security-critical applications.To address this, we introduce \textbf{GReX-Bench}, the first unified benchmarking framework for reproducible evaluation of forensic, anti-forensic (AF), and explainability. We benchmark sixteen prior detectors across eight public datasets (e.g., GAN, diffusion, and low-level vision) under six AF attacks. We analyze model behavior through confidence, ROC, and explainability techniques, including model-specific, model-agnostic, and generative LLM. Our findings reveal significant generalization gaps, with many methods performing well in-distribution but degrading across datasets, particularly under AF attacks. We also examine deployment factors such as efficiency, latency, and scalability to guide practical adoption.

Version published to 10.21203/rs.3.rs-8633550/v1 on Research Square
Feb 12, 2026

The Cognitive Fingerprint Problem: Transformer-LSTM Perplexity Geometry for Fair and Adversarially Robust AI Text Detection

This article has 1 author:
1. Pranil Raichura
This article has no evaluationsLatest version Mar 3, 2026
Towards Robust Industrial Micro-Defect Detection: AContext-Aware and Feature-Refined Architecture forCamouflaged Anomalies

This article has 7 authors:
1. Xinda Yu
2. Kunxin Zheng
3. Chunan Yu
4. Qingbo Song
5. Hao Xiao
6. Ying Zang
7. Jie Liu
This article has no evaluationsLatest version Mar 11, 2026
Sensing Deepfake Detection: A Survey of Detection Architectures, Adversarial Challenges, and Critical Applications in Political, Educational, and Military Domains

This article has 5 authors:
1. Alexandros Gazis
2. Stylianos Pappas
3. Theodoros Vavouras
4. Asim Ali
5. Nikos E. Mastorakis
This article has no evaluationsLatest version Mar 23, 2026

Discuss this preprint

Listed in

Abstract

Article activity feed

Related articles

The Cognitive Fingerprint Problem: Transformer-LSTM Perplexity Geometry for Fair and Adversarially Robust AI Text Detection

Towards Robust Industrial Micro-Defect Detection: AContext-Aware and Feature-Refined Architecture forCamouflaged Anomalies

Sensing Deepfake Detection: A Survey of Detection Architectures, Adversarial Challenges, and Critical Applications in Political, Educational, and Military Domains