AgriIR: ドメイン特化型知識検索のためのスケーラブルなフレームワーク
AgriIR: A Scalable Framework for Domain-Specific Knowledge Retrieval
March 17, 2026
著者: Shuvam Banerji Seal, Aheli Poddar, Alok Mishra, Dwaipayan Roy
cs.AI
要旨
本論文は、柔軟性と低計算コストを維持しつつ、確かな根拠に基づく分野特化の回答を提供するために設計された、設定可能な検索拡張生成(RAG)フレームワーク「AgriIR」を提案する。AgriIRは、大規模で一枚岩的なモデルに依存する代わりに、情報アクセスプロセスを宣言的なモジュール型のステージ――クエリ精緻化、サブクエリ計画、検索、統合、評価――に分解する。この設計により、実践者はアーキテクチャを変更することなく、フレームワークを新しい知識領域に適応させることができる。我々の参照実装は、インドの農業情報アクセスを対象とし、10億パラメータ規模の言語モデルを適応型検索器および分野認識エージェントカタログと統合している。本システムは確定的な典拠提示を強制し、透明性のためのテレメトリを統合し、監査可能で再現性のある運用を保証する自動デプロイメント資産を含む。アーキテクチャ設計とモジュール制御を重視することにより、AgriIRは、リソースが制約された環境であっても、適切に設計されたパイプラインが領域に正確で信頼性の高い検索を実現できることを示す。このアプローチは、検索拡張生成システムにおけるアクセシビリティ、持続可能性、説明責任を促進することで、「農業のためのAI」の具体例を示すものであると我々は主張する。
English
This paper introduces AgriIR, a configurable retrieval augmented generation (RAG) framework designed to deliver grounded, domain-specific answers while maintaining flexibility and low computational cost. Instead of relying on large, monolithic models, AgriIR decomposes the information access process into declarative modular stages -- query refinement, sub-query planning, retrieval, synthesis, and evaluation. This design allows practitioners to adapt the framework to new knowledge verticals without modifying the architecture. Our reference implementation targets Indian agricultural information access, integrating 1B-parameter language models with adaptive retrievers and domain-aware agent catalogues. The system enforces deterministic citation, integrates telemetry for transparency, and includes automated deployment assets to ensure auditable, reproducible operation. By emphasizing architectural design and modular control, AgriIR demonstrates that well-engineered pipelines can achieve domain-accurate, trustworthy retrieval even under constrained resources. We argue that this approach exemplifies ``AI for Agriculture'' by promoting accessibility, sustainability, and accountability in retrieval-augmented generation systems.