AgriIR: un framework scalabile per il recupero di conoscenze specifiche del dominio
AgriIR: A Scalable Framework for Domain-Specific Knowledge Retrieval
March 17, 2026
Autori: Shuvam Banerji Seal, Aheli Poddar, Alok Mishra, Dwaipayan Roy
cs.AI
Abstract
Questo articolo presenta AgriIR, un framework configurabile di retrieval augmented generation (RAG) progettato per fornire risposte fondate e specifiche del dominio, mantenendo al contempo flessibilità e basso costo computazionale. Invece di basarsi su modelli monolitici di grandi dimensioni, AgriIR scompone il processo di accesso all'informazione in fasi modulari dichiarative: raffinamento della query, pianificazione delle sotto-query, recupero, sintesi e valutazione. Questo progetto consente ai professionisti di adattare il framework a nuovi verticali conoscitivi senza modificare l'architettura. La nostra implementazione di riferimento è mirata all'accesso alle informazioni agricole in India, integrando modelli linguistici da 1 miliardo di parametri con retriever adattivi e cataloghi di agenti con consapevolezza del dominio. Il sistema applica citazioni deterministiche, integra la telemetria per la trasparenza e include risorse di deployment automatizzate per garantire un'operazione verificabile e riproducibile. Enfatizzando il progetto architetturale e il controllo modulare, AgriIR dimostra che pipeline ben ingegnerizzate possono ottenere un retrieval accurato dal punto di vista del dominio e affidabile anche con risorse limitate. Sosteniamo che questo approccio esemplifichi l'``IA per l'Agricoltura'' promuovendo accessibilità, sostenibilità e responsabilità nei sistemi di retrieval augmented generation.
English
This paper introduces AgriIR, a configurable retrieval augmented generation (RAG) framework designed to deliver grounded, domain-specific answers while maintaining flexibility and low computational cost. Instead of relying on large, monolithic models, AgriIR decomposes the information access process into declarative modular stages -- query refinement, sub-query planning, retrieval, synthesis, and evaluation. This design allows practitioners to adapt the framework to new knowledge verticals without modifying the architecture. Our reference implementation targets Indian agricultural information access, integrating 1B-parameter language models with adaptive retrievers and domain-aware agent catalogues. The system enforces deterministic citation, integrates telemetry for transparency, and includes automated deployment assets to ensure auditable, reproducible operation. By emphasizing architectural design and modular control, AgriIR demonstrates that well-engineered pipelines can achieve domain-accurate, trustworthy retrieval even under constrained resources. We argue that this approach exemplifies ``AI for Agriculture'' by promoting accessibility, sustainability, and accountability in retrieval-augmented generation systems.