ChatPaper.aiChatPaper

GenoMAS: Un Marco de Trabajo Multiagente para el Descubrimiento Científico mediante Análisis de Expresión Génica Basado en Código

GenoMAS: A Multi-Agent Framework for Scientific Discovery via Code-Driven Gene Expression Analysis

July 28, 2025
Autores: Haoyang Liu, Yijiang Li, Haohan Wang
cs.AI

Resumen

El análisis de expresión génica es clave para muchos descubrimientos biomédicos, sin embargo, extraer conocimientos de los datos transcriptómicos crudos sigue siendo un desafío formidable debido a la complejidad de múltiples archivos grandes y semiestructurados, y a la necesidad de un amplio conocimiento del dominio. Los enfoques actuales de automatización suelen estar limitados por flujos de trabajo inflexibles que fallan en casos extremos o por agentes completamente autónomos que carecen de la precisión necesaria para una investigación científica rigurosa. GenoMAS traza un camino diferente al presentar un equipo de científicos basados en LLM que integra la confiabilidad de los flujos de trabajo estructurados con la adaptabilidad de los agentes autónomos. GenoMAS orquesta seis agentes LLM especializados a través de protocolos de paso de mensajes tipados, cada uno contribuyendo con fortalezas complementarias a un lienzo analítico compartido. En el núcleo de GenoMAS se encuentra un marco de planificación guiada: los agentes de programación desglosan las directrices de tareas de alto nivel en Unidades de Acción y, en cada punto, eligen avanzar, revisar, omitir o retroceder, manteniendo así la coherencia lógica mientras se adaptan con flexibilidad a las idiosincrasias de los datos genómicos. En el benchmark GenoTEX, GenoMAS alcanza una Correlación de Similitud Compuesta del 89.13% para el preprocesamiento de datos y un F_1 del 60.48% para la identificación de genes, superando el mejor arte previo en un 10.61% y un 16.85% respectivamente. Más allá de las métricas, GenoMAS descubre asociaciones gen-fenotipo biológicamente plausibles corroboradas por la literatura, todo ello ajustando los factores de confusión latentes. El código está disponible en https://github.com/Liu-Hy/GenoMAS.
English
Gene expression analysis holds the key to many biomedical discoveries, yet extracting insights from raw transcriptomic data remains formidable due to the complexity of multiple large, semi-structured files and the need for extensive domain expertise. Current automation approaches are often limited by either inflexible workflows that break down in edge cases or by fully autonomous agents that lack the necessary precision for rigorous scientific inquiry. GenoMAS charts a different course by presenting a team of LLM-based scientists that integrates the reliability of structured workflows with the adaptability of autonomous agents. GenoMAS orchestrates six specialized LLM agents through typed message-passing protocols, each contributing complementary strengths to a shared analytic canvas. At the heart of GenoMAS lies a guided-planning framework: programming agents unfold high-level task guidelines into Action Units and, at each juncture, elect to advance, revise, bypass, or backtrack, thereby maintaining logical coherence while bending gracefully to the idiosyncrasies of genomic data. On the GenoTEX benchmark, GenoMAS reaches a Composite Similarity Correlation of 89.13% for data preprocessing and an F_1 of 60.48% for gene identification, surpassing the best prior art by 10.61% and 16.85% respectively. Beyond metrics, GenoMAS surfaces biologically plausible gene-phenotype associations corroborated by the literature, all while adjusting for latent confounders. Code is available at https://github.com/Liu-Hy/GenoMAS.
PDF12July 29, 2025