AgriIR: Een schaalbare raamwerk voor domeinspecifieke kennisextractie
AgriIR: A Scalable Framework for Domain-Specific Knowledge Retrieval
March 17, 2026
Auteurs: Shuvam Banerji Seal, Aheli Poddar, Alok Mishra, Dwaipayan Roy
cs.AI
Samenvatting
Dit artikel introduceert AgriIR, een configureerbaar retrieval-augmented generation (RAG)-raamwerk dat is ontworpen om gegronde, domeinspecifieke antwoorden te leveren met behoud van flexibiliteit en lage rekenkosten. In plaats van te vertrouwen op grote, monolithische modellen, deconstrueert AgriIR het informatieverkrijgingsproces in declaratieve modulaire fasen: queryverfijning, subqueryplanning, retrieval, synthese en evaluatie. Dit ontwerp stelt gebruikers in staat het raamwerk aan te passen aan nieuwe kennisdomeinen zonder de architectuur te wijzigen. Onze referentie-implementatie richt zich op toegang tot landbouwinformatie in India en integreert taalmodelen van 1 miljard parameters met adaptieve retrievers en domeinbewuste agentcatalogi. Het systeem handhaaft deterministische bronverwijzingen, integreert telemetrie voor transparantie en omvat geautomatiseerde implementatiemiddelen om controleerbare, reproduceerbare werking te garanderen. Door de nadruk te leggen op architectonisch ontwerp en modulaire controle, toont AgriIR aan dat goed ontworgen pijplijnen domeinaccurate, betrouwbare retrieval kunnen bereiken, zelfs met beperkte middelen. Wij beargumenteren dat deze aanpak "AI voor Landbouw" belichaamt door toegankelijkheid, duurzaamheid en verantwoordingsplicht in retrieval-augmented generation-systemen te bevorderen.
English
This paper introduces AgriIR, a configurable retrieval augmented generation (RAG) framework designed to deliver grounded, domain-specific answers while maintaining flexibility and low computational cost. Instead of relying on large, monolithic models, AgriIR decomposes the information access process into declarative modular stages -- query refinement, sub-query planning, retrieval, synthesis, and evaluation. This design allows practitioners to adapt the framework to new knowledge verticals without modifying the architecture. Our reference implementation targets Indian agricultural information access, integrating 1B-parameter language models with adaptive retrievers and domain-aware agent catalogues. The system enforces deterministic citation, integrates telemetry for transparency, and includes automated deployment assets to ensure auditable, reproducible operation. By emphasizing architectural design and modular control, AgriIR demonstrates that well-engineered pipelines can achieve domain-accurate, trustworthy retrieval even under constrained resources. We argue that this approach exemplifies ``AI for Agriculture'' by promoting accessibility, sustainability, and accountability in retrieval-augmented generation systems.