ChatPaper.aiChatPaper

AIonopedia: агент на основе больших языковых моделей для оркестровки мультимодального обучения при открытии ионных жидкостей

AIonopedia: an LLM agent orchestrating multimodal learning for ionic liquid discovery

November 14, 2025
Авторы: Yuqi Yin, Yibo Fu, Siyuan Wang, Peng Sun, Hongyu Wang, Xiaohui Wang, Lei Zheng, Zhiyong Li, Zhirong Liu, Jianji Wang, Zhaoxi Sun
cs.AI

Аннотация

Открытие новых ионных жидкостей (ИЖ) сдерживается серьезными проблемами в прогнозировании свойств, включая ограниченность данных, низкую точность моделей и фрагментированные рабочие процессы. Используя возможности больших языковых моделей (LLM), мы представляем AIonopedia — насколько нам известно, первого LLM-агента для открытия ИЖ. Основанный на мультимодальной доменно-специфичной фундаментальной модели для ИЖ, усиленной LLM, AIonopedia обеспечивает точное прогнозирование свойств и включает иерархическую архитектуру поиска для молекулярного скрининга и дизайна. Наша модель, обученная и протестированная на вновь созданном всеобъемлющем наборе данных по ИЖ, демонстрирует превосходную производительность. Дополняя эти результаты, оценки на системах, описанных в литературе, указывают на способность агента эффективно выполнять модификацию ИЖ. Выходя за рамки офлайн-тестов, практическая эффективность была дополнительно подтверждена реальной лабораторной валидацией, в ходе которой агент продемонстрировал исключительные способности к обобщению на сложных задачах за пределами распределения обучающих данных, подчеркивая его потенциал для ускорения реального процесса открытия ИЖ.
English
The discovery of novel Ionic Liquids (ILs) is hindered by critical challenges in property prediction, including limited data, poor model accuracy, and fragmented workflows. Leveraging the power of Large Language Models (LLMs), we introduce AIonopedia, to the best of our knowledge, the first LLM agent for IL discovery. Powered by an LLM-augmented multimodal domain foundation model for ILs, AIonopedia enables accurate property predictions and incorporates a hierarchical search architecture for molecular screening and design. Trained and evaluated on a newly curated and comprehensive IL dataset, our model delivers superior performance. Complementing these results, evaluations on literature-reported systems indicate that the agent can perform effective IL modification. Moving beyond offline tests, the practical efficacy was further confirmed through real-world wet-lab validation, in which the agent demonstrated exceptional generalization capabilities on challenging out-of-distribution tasks, underscoring its ability to accelerate real-world IL discovery.
PDF244December 1, 2025