AIonopedia: um agente de LLM que orquestra aprendizado multimodal para descoberta de líquidos iônicos

Resumo

A descoberta de novos Líquidos Iônicos (LIs) é dificultada por desafios críticos na previsão de propriedades, incluindo dados limitados, baixa precisão de modelos e fluxos de trabalho fragmentados. Aproveitando o poder dos Modelos de Linguagem de Grande Porte (LLMs), introduzimos o AIonopedia, que, até onde sabemos, é o primeiro agente baseado em LLM para descoberta de LIs. Alimentado por um modelo de domínio multimodal aumentado por LLM para LIs, o AIonopedia permite previsões precisas de propriedades e incorpora uma arquitetura de busca hierárquica para triagem e design molecular. Treinado e avaliado em um novo conjunto de dados de LIs abrangente e curado, nosso modelo oferece um desempenho superior. Complementando esses resultados, avaliações em sistemas reportados na literatura indicam que o agente pode realizar modificações eficazes de LIs. Indo além de testes offline, a eficácia prática foi confirmada através de validação experimental em laboratório, na qual o agente demonstrou capacidades excepcionais de generalização em tarefas desafiadoras fora da distribuição de dados, destacando sua capacidade de acelerar a descoberta real de LIs.

English

The discovery of novel Ionic Liquids (ILs) is hindered by critical challenges in property prediction, including limited data, poor model accuracy, and fragmented workflows. Leveraging the power of Large Language Models (LLMs), we introduce AIonopedia, to the best of our knowledge, the first LLM agent for IL discovery. Powered by an LLM-augmented multimodal domain foundation model for ILs, AIonopedia enables accurate property predictions and incorporates a hierarchical search architecture for molecular screening and design. Trained and evaluated on a newly curated and comprehensive IL dataset, our model delivers superior performance. Complementing these results, evaluations on literature-reported systems indicate that the agent can perform effective IL modification. Moving beyond offline tests, the practical efficacy was further confirmed through real-world wet-lab validation, in which the agent demonstrated exceptional generalization capabilities on challenging out-of-distribution tasks, underscoring its ability to accelerate real-world IL discovery.