Controlled Multi-Hop RAG: A Deterministic Parallel Pipeline Architecture as an Alternative to Agentic Retrieval
Discuss this preprint
Start a discussion What are Sciety discussions?Listed in
This article is not in any list yet, why not save it to one of your lists.Abstract
RAG systems fallan sistemáticamente con queries que requieren información distribuida en documentos interdependientes. El RAG tradicional usa single-pass retrieval que no puede atravesar cadenas de dependencias. El Agentic RAG delega control a un loop LLM autónomo, acumulando errores y perdiendo auditabilidad en producción. Este paper propone Controlled Multi-Hop RAG — una tercera categoría arquitectónica que logra multi-hop retrieval completo manteniendo determinismo y auditabilidad. Cuatro etapas explícitas: (1) multi-query augmentation con coreference resolution, (2) query decomposition con inter-query dependency modeling, (3) recursive multi-hop retrieval sobre chunk dependency graphs ejecutado por N Ray actors concurrentes, (4) relational synthesis sobre el contexto completo recuperado. Introduce Referential Discovery — estrategia de ingesta two-pass que pre-computa referencias cross-document con cola de pendientes incremental, reduciendo resolución de hops de O(log N) a O(1) en inference time. Evaluado en MIKA sobre 500 queries concurrentes en corpus de 100 documentos — full dependency-chain traversal en menos de 62 minutos, cero alucinaciones, comportamiento determinista y auditabilidad completa. También documenta blind spots de seguridad de sistemas agentic: prompt injection, unbounded tool execution, EU AI Act non-compliance.