Artículos de Investigación en IA Diarios

Artículos de investigación en IA seleccionados diariamente con traducciones

AlphaMaze: Mejorando la Inteligencia Espacial de los Modelos de Lenguaje de Gran Escala mediante GRPO
AlphaMaze: Enhancing Large Language Models' Spatial Intelligence via GRPO

Alan Dao, Dinh Bach Vu•Feb 20, 2025•142

¿Cuánto conocimiento puedes empaquetar en un adaptador LoRA sin perjudicar a un modelo de lenguaje grande (LLM)?
How Much Knowledge Can You Pack into a LoRA Adapter without Harming LLM?

Sergey Pletenev, Maria Marina, Daniil Moskovskiy, Vasily Konovalov, Pavel Braslavski, Alexander Panchenko, Mikhail Salnikov•Feb 20, 2025•919

Geolocalización con Datos de Juego de Humanos Reales: Un Conjunto de Datos a Gran Escala y un Marco de Razonamiento Similar al Humano
Geolocation with Real Human Gameplay Data: A Large-Scale Dataset and Human-Like Reasoning Framework

Zirui Song, Jingpu Yang, Yuan Huang, Jonathan Tonglet, Zeyu Zhang, Tao Cheng, Meng Fang, Iryna Gurevych, Xiuying Chen•Feb 19, 2025•42

Logic-RL: Liberando el razonamiento de LLM con aprendizaje por refuerzo basado en reglas
Logic-RL: Unleashing LLM Reasoning with Rule-Based Reinforcement Learning

Tian Xie, Zitian Gao, Qingnan Ren, Haoming Luo, Yuqian Hong, Bryan Dai, Joey Zhou, Kai Qiu, Zhirong Wu, Chong Luo•Feb 20, 2025•485

Generación de Moléculas π-Funcionales Utilizando STGG+ con Aprendizaje Activo
Generating π-Functional Molecules Using STGG+ with Active Learning

Alexia Jolicoeur-Martineau, Yan Zhang, Boris Knyazev, Aristide Baratin, Cheng-Hao Liu•Feb 20, 2025•42

Escalando la Comprensión de Imágenes con Texto mediante la Generación Sintética de Datos Multimodales Guiada por Código
Scaling Text-Rich Image Understanding via Code-Guided Synthetic Multimodal Data Generation

Yue Yang, Ajay Patel, Matt Deitke, Tanmay Gupta, Luca Weihs, Andrew Head, Mark Yatskar, Chris Callison-Burch, Ranjay Krishna, Aniruddha Kembhavi, Christopher Clark•Feb 20, 2025•132

LongWriter-V: Habilitando la generación ultra larga y de alta fidelidad en modelos de visión y lenguaje
LongWriter-V: Enabling Ultra-Long and High-Fidelity Generation in Vision-Language Models

Shangqing Tu, Yucheng Wang, Daniel Zhang-Li, Yushi Bai, Jifan Yu, Yuhao Wu, Lei Hou, Huiqin Liu, Zhiyuan Liu, Bin Xu, Juanzi Li•Feb 20, 2025•242

Mejorando la Cognición y Explicabilidad de Modelos Fundacionales Multimodales con Datos Autosintetizados
Enhancing Cognition and Explainability of Multimodal Foundation Models with Self-Synthesized Data

Yucheng Shi, Quanzheng Li, Jin Sun, Xiang Li, Ninghao Liu•Feb 19, 2025•83

CLIPPER: La compresión permite la generación de datos sintéticos de contexto extenso
CLIPPER: Compression enables long-context synthetic data generation

Chau Minh Pham, Yapei Chang, Mohit Iyyer•Feb 20, 2025•82

¿Cuánto alucinan los LLM en diferentes idiomas? Sobre la estimación multilingüe de la alucinación de LLM en entornos reales
How Much Do LLMs Hallucinate across Languages? On Multilingual Estimation of LLM Hallucination in the Wild

Saad Obaid ul Islam, Anne Lauscher, Goran Glavaš•Feb 18, 2025•32

¿Tiene el tiempo su lugar? Cabezales temporales: Dónde los modelos de lenguaje recuerdan información específica del tiempo
Does Time Have Its Place? Temporal Heads: Where Language Models Recall Time-specific Information

Yein Park, Chanwoong Yoon, Jungwoo Park, Minbyul Jeong, Jaewoo Kang•Feb 20, 2025•262

Gestión de Perfiles de Usuario Basada en Modelos de Lenguaje de Gran Escala para Sistemas de Recomendación
LLM-based User Profile Management for Recommender System

Seunghwan Bang, Hwanjun Song•Feb 20, 2025•62

SigLIP 2: Codificadores Multilingües de Visión y Lenguaje con Mejor Comprensión Semántica, Localización y Características Densas
SigLIP 2: Multilingual Vision-Language Encoders with Improved Semantic Understanding, Localization, and Dense Features

Michael Tschannen, Alexey Gritsenko, Xiao Wang, Muhammad Ferjad Naeem, Ibrahim Alabdulmohsin, Nikhil Parthasarathy, Talfan Evans, Lucas Beyer, Ye Xia, Basil Mustafa, Olivier Hénaff, Jeremiah Harmsen, Andreas Steiner, Xiaohua Zhai•Feb 20, 2025•1437

NAVIG: Análisis Guiado por Lenguaje Natural con Modelos de Visión y Lenguaje para la Geo-localización de Imágenes
NAVIG: Natural Language-guided Analysis with Vision Language Models for Image Geo-localization

Zheyuan Zhang, Runze Li, Tasnim Kabir, Jordan Boyd-Graber•Feb 20, 2025•112

Personalización de Conceptos Dinámicos a partir de Vídeos Únicos
Dynamic Concepts Personalization from Single Videos

Rameen Abdal, Or Patashnik, Ivan Skorokhodov, Willi Menapace, Aliaksandr Siarohin, Sergey Tulyakov, Daniel Cohen-Or, Kfir Aberman•Feb 20, 2025•162

Atribución de Evidencia No Estructurada para la Generación de Resúmenes Enfocados en Consultas de Contexto Largo
Unstructured Evidence Attribution for Long Context Query Focused Summarization

Dustin Wright, Zain Muhammad Mujahid, Lu Wang, Isabelle Augenstein, David Jurgens•Feb 20, 2025•32

Cómo Hacer que tu Modelo de Lenguaje Grande Genere Problemas Desafiantes para Evaluación
How to Get Your LLM to Generate Challenging Problems for Evaluation

Arkil Patel, Siva Reddy, Dzmitry Bahdanau•Feb 20, 2025•172

PC-Agent: Un Marco de Colaboración Jerárquico Multi-Agente para la Automatización de Tareas Complejas en PC
PC-Agent: A Hierarchical Multi-Agent Collaboration Framework for Complex Task Automation on PC

Haowei Liu, Xi Zhang, Haiyang Xu, Yuyang Wanyan, Junyang Wang, Ming Yan, Ji Zhang, Chunfeng Yuan, Changsheng Xu, Weiming Hu, Fei Huang•Feb 20, 2025•203

S^2R: Enseñando a los LLM a auto-verificarse y auto-corregirse mediante Aprendizaje por Refuerzo
S^2R: Teaching LLMs to Self-verify and Self-correct via Reinforcement Learning

Ruotian Ma, Peisong Wang, Cheng Liu, Xingyan Liu, Jiaqi Chen, Bang Zhang, Xin Zhou, Nan Du, Jia Li•Feb 18, 2025•292

Generación de Conjuntos de Datos de Skyline para Modelos de Ciencia de Datos
Generating Skyline Datasets for Data Science Models

Mengying Wang, Hanchao Ma, Yiyang Bian, Yangxin Fan, Yinghui Wu•Feb 16, 2025•72

SuperGPQA: Escalando la Evaluación de LLM a través de 285 Disciplinas de Posgrado
SuperGPQA: Scaling LLM Evaluation across 285 Graduate Disciplines

M-A-P Team, Xinrun Du, Yifan Yao, Kaijing Ma, Bingli Wang, Tianyu Zheng, Kang Zhu, Minghao Liu, Yiming Liang, Xiaolong Jin, Zhenlin Wei, Chujie Zheng, Kaixing Deng, Shuyue Guo, Shian Jia, Sichao Jiang, Yiyan Liao, Rui Li, Qinrui Li, Sirun Li, Yizhi Li, Yunwen Li, Dehua Ma, Yuansheng Ni, Haoran Que, Qiyao Wang, Zhoufutu Wen, Siwei Wu, Tianshun Xing, Ming Xu, Zhenzhu Yang, Zekun Moore Wang, Junting Zhou, Yuelin Bai, Xingyuan Bu, Chenglin Cai, Liang Chen, Yifan Chen, Chengtuo Cheng, Tianhao Cheng, Keyi Ding, Siming Huang, Yun Huang, Yaoru Li, Yizhe Li, Zhaoqun Li, Tianhao Liang, Chengdong Lin, Hongquan Lin, Yinghao Ma, Zhongyuan Peng, Zifan Peng, Qige Qi, Shi Qiu, Xingwei Qu, Yizhou Tan, Zili Wang, Chenqing Wang, Hao Wang, Yiya Wang, Yubo Wang, Jiajun Xu, Kexin Yang, Ruibin Yuan, Yuanhao Yue, Tianyang Zhan, Chun Zhang, Jingyang Zhang, Xiyue Zhang, Xingjian Zhang, Yue Zhang, Yongchi Zhao, Xiangyu Zheng, Chenghua Zhong, Yang Gao, Zhoujun Li, Dayiheng Liu, Qian Liu, Tianyu Liu, Shiwen Ni, Junran Peng, Yujia Qin, Wenbo Su, Guoyin Wang, Shi Wang, Jian Yang, Min Yang, Meng Cao, Xiang Yue, Zhaoxiang Zhang, Wangchunshu Zhou, Jiaheng Liu, Qunshu Lin, Wenhao Huang, Ge Zhang•Feb 20, 2025•10310

Multimodal RewardBench: Evaluación Integral de Modelos de Recompensa para Modelos de Lenguaje y Visión
Multimodal RewardBench: Holistic Evaluation of Reward Models for Vision Language Models

Michihiro Yasunaga, Luke Zettlemoyer, Marjan Ghazvininejad•Feb 20, 2025•72

LServe: Servicio eficiente de LLM para secuencias largas con atención dispersa unificada
LServe: Efficient Long-sequence LLM Serving with Unified Sparse Attention

Shang Yang, Junxian Guo, Haotian Tang, Qinghao Hu, Guangxuan Xiao, Jiaming Tang, Yujun Lin, Zhijian Liu, Yao Lu, Song Han•Feb 20, 2025•132

S: Escalado en Tiempo de Prueba para Generación de Código
S: Test Time Scaling for Code Generation

Dacheng Li, Shiyi Cao, Chengkun Cao, Xiuyu Li, Shangyin Tan, Kurt Keutzer, Jiarong Xing, Joseph E. Gonzalez, Ion Stoica•Feb 20, 2025•633

De RAG a Memoria: Aprendizaje Continuo No Paramétrico para Modelos de Lenguaje a Gran Escala
From RAG to Memory: Non-Parametric Continual Learning for Large Language Models

Bernal Jiménez Gutiérrez, Yiheng Shu, Weijian Qi, Sizhe Zhou, Yu Su•Feb 20, 2025•132

Optimización de Contraste Visual Simétrico: Alineación de Modelos de Visión-Lenguaje con Imágenes de Contraste Mínimas
Symmetrical Visual Contrastive Optimization: Aligning Vision-Language Models with Minimal Contrastive Images

Shengguang Wu, Fan-Yun Sun, Kaiyue Wen, Nick Haber•Feb 19, 2025•42

Descubrimiento de códigos cuánticos de corrección de errores altamente eficientes y de bajo peso mediante aprendizaje por refuerzo
Discovering highly efficient low-weight quantum error-correcting codes with reinforcement learning

Austin Yubo He, Zi-Wen Liu•Feb 20, 2025•364

RelaCtrl: Control Eficiente Guiado por Relevancia para Transformadores de Difusión
RelaCtrl: Relevance-Guided Efficient Control for Diffusion Transformers

Ke Cao, Jing Wang, Ao Ma, Jiasong Feng, Zhanjie Zhang, Xuanhua He, Shanyuan Liu, Bo Cheng, Dawei Leng, Yuhui Yin, Jie Zhang•Feb 20, 2025•122

MLGym: Un Nuevo Marco de Referencia y Punto de Referencia para el Avance de los Agentes de Investigación en IA
MLGym: A New Framework and Benchmark for Advancing AI Research Agents

Deepak Nathani, Lovish Madaan, Nicholas Roberts, Nikolay Bashlykov, Ajay Menon, Vincent Moens, Amar Budhiraja, Despoina Magka, Vladislav Vorotilov, Gaurav Chaurasia, Dieuwke Hupkes, Ricardo Silveira Cabral, Tatiana Shavrina, Jakob Foerster, Yoram Bachrach, William Yang Wang, Roberta Raileanu•Feb 20, 2025•1923