AIonopedia: un agente LLM que orquesta el aprendizaje multimodal para el descubrimiento de líquidos iónicos
AIonopedia: an LLM agent orchestrating multimodal learning for ionic liquid discovery
November 14, 2025
Autores: Yuqi Yin, Yibo Fu, Siyuan Wang, Peng Sun, Hongyu Wang, Xiaohui Wang, Lei Zheng, Zhiyong Li, Zhirong Liu, Jianji Wang, Zhaoxi Sun
cs.AI
Resumen
El descubrimiento de nuevos Líquidos Iónicos (LIs) se ve obstaculizado por desafíos críticos en la predicción de propiedades, incluyendo datos limitados, baja precisión de los modelos y flujos de trabajo fragmentados. Aprovechando el poder de los Modelos de Lenguaje a Gran Escala (LLMs), presentamos AIonopedia, que hasta donde sabemos, es el primer agente basado en LLM para el descubrimiento de LIs. Impulsado por un modelo de dominio multimodal aumentado con LLM para LIs, AIonopedia permite predicciones precisas de propiedades e incorpora una arquitectura de búsqueda jerárquica para el cribado y diseño molecular. Entrenado y evaluado en un nuevo conjunto de datos de LIs exhaustivo y cuidadosamente seleccionado, nuestro modelo ofrece un rendimiento superior. Complementando estos resultados, las evaluaciones en sistemas reportados en la literatura indican que el agente puede realizar modificaciones efectivas de LIs. Yendo más allá de las pruebas offline, la eficacia práctica se confirmó mediante validación en laboratorio con experimentación real, donde el agente demostró capacidades excepcionales de generalización en tareas complejas fuera de distribución, subrayando su capacidad para acelerar el descubrimiento de LIs en el mundo real.
English
The discovery of novel Ionic Liquids (ILs) is hindered by critical challenges in property prediction, including limited data, poor model accuracy, and fragmented workflows. Leveraging the power of Large Language Models (LLMs), we introduce AIonopedia, to the best of our knowledge, the first LLM agent for IL discovery. Powered by an LLM-augmented multimodal domain foundation model for ILs, AIonopedia enables accurate property predictions and incorporates a hierarchical search architecture for molecular screening and design. Trained and evaluated on a newly curated and comprehensive IL dataset, our model delivers superior performance. Complementing these results, evaluations on literature-reported systems indicate that the agent can perform effective IL modification. Moving beyond offline tests, the practical efficacy was further confirmed through real-world wet-lab validation, in which the agent demonstrated exceptional generalization capabilities on challenging out-of-distribution tasks, underscoring its ability to accelerate real-world IL discovery.