OneKE: Ein Dockerisiertes System zur Wissensextraktion basierend auf einem Schema-geführten LLM-Agenten
OneKE: A Dockerized Schema-Guided LLM Agent-based Knowledge Extraction System
December 28, 2024
Autoren: Yujie Luo, Xiangyuan Ru, Kangwei Liu, Lin Yuan, Mengshu Sun, Ningyu Zhang, Lei Liang, Zhiqiang Zhang, Jun Zhou, Lanning Wei, Da Zheng, Haofen Wang, Huajun Chen
cs.AI
Zusammenfassung
Wir stellen OneKE vor, ein dockerisiertes, schema-geführtes Wissensextraktionssystem, das Wissen aus dem Web und Roh-PDF-Büchern extrahieren kann und verschiedene Bereiche (Wissenschaft, Nachrichten usw.) unterstützt. Speziell haben wir OneKE mit mehreren Agenten und einer konfigurierbaren Wissensbasis entworfen. Unterschiedliche Agenten erfüllen ihre jeweiligen Rollen, um Unterstützung für verschiedene Extraktionsszenarien zu ermöglichen. Die konfigurierbare Wissensbasis erleichtert die Schema-Konfiguration, die Fehlerfall-Debugging und -Korrektur, was die Leistung weiter verbessert. Empirische Bewertungen anhand von Benchmark-Datensätzen zeigen die Wirksamkeit von OneKE, während Fallstudien seine Anpassungsfähigkeit an vielfältige Aufgaben in verschiedenen Bereichen verdeutlichen und sein Potenzial für breite Anwendungen hervorheben. Wir haben den Code unter https://github.com/zjunlp/OneKE veröffentlicht und ein Video unter http://oneke.openkg.cn/demo.mp4 veröffentlicht.
English
We introduce OneKE, a dockerized schema-guided knowledge extraction system,
which can extract knowledge from the Web and raw PDF Books, and support various
domains (science, news, etc.). Specifically, we design OneKE with multiple
agents and a configure knowledge base. Different agents perform their
respective roles, enabling support for various extraction scenarios. The
configure knowledge base facilitates schema configuration, error case debugging
and correction, further improving the performance. Empirical evaluations on
benchmark datasets demonstrate OneKE's efficacy, while case studies further
elucidate its adaptability to diverse tasks across multiple domains,
highlighting its potential for broad applications. We have open-sourced the
Code at https://github.com/zjunlp/OneKE and released a Video at
http://oneke.openkg.cn/demo.mp4.Summary
AI-Generated Summary